probabilidad y estadstica_isc

434
Probabilidad y estadística Unida d Temas Subtemas 1 Estadística descriptiva. 1.1 Conceptos básicos de estadística. 1.1.1 Definición de estadística. 1.1.2 Inferencia estadística. 1.1.3 Teoría de decisión. 1.1.4 Población. 1.1.5 Muestra aleatoria. 1.1.6 Parámetros aleatorios. 1.1.7 Enfoque clásico. 1.1.8 Enfoque Bayesiano. 1.2 Descripción de datos. 1.2.1 Datos agrupados y no agrupados. 1.2.2 Frecuencia de clase. 1.2.3 Frecuencia relativa. 1.2.4 Punto medio. 1.2.5 Límites. 1.2.6 Histograma. 1.2.7 Histograma de frecuencia relativa. 1.3 Medidas de tendencia central. 1.3.1 Media aritmética, geométrica y ponderada. 1.3.2 Mediana. 1.3.3 Moda. 1.4 Medidas de dispersión. 1.4.1 Varianza. 1.4.2 Desviación estándar. 1.4.3 Desviación media. 1.4.4 Desviación mediana. 1.4.5 Rango. 1.5 Parámetros para datos agrupados. 1.5.1 La media.

Upload: alejandro-vazquez-aguirre

Post on 31-Jul-2015

55 views

Category:

Documents


0 download

TRANSCRIPT

Probabilidad y estadsticaUnidad Temas Subtemas1 Estadstica descriptiva. 1.1 Conceptos bsicos de estadstica.1.1.1 Definicin de estadstica.1.1.2 Inferencia estadstica.1.1.3 Teora de decisin.1.1.4 Poblacin.1.1.5 Muestra aleatoria.1.1.6 Parmetros aleatorios.1.1.7 Enfoque clsico.1.1.8 Enfoque Bayesiano.1.2 Descripcin de datos.1.2.1 Datos agrupados y no agrupados.1.2.2 Frecuencia de clase.1.2.3 Frecuencia relativa.1.2.4 Punto medio.1.2.5 Lmites.1.2.6 Histograma.1.2.7 Histograma de frecuencia relativa.1.3 Medidas de tendencia central.1.3.1 Media aritmtica, geomtrica y ponderada.1.3.2 Mediana.1.3.3 Moda.1.4 Medidas de dispersin.1.4.1 Varianza.1.4.2 Desviacin estndar.1.4.3 Desviacin media.1.4.4 Desviacin mediana.1.4.5 Rango.1.5 Parmetros para datos agrupados.1.5.1 La media.1.5.2 La desviacin tpica.1.6 Distribucin de frecuencias.1.6.1 Distribuciones numricas.1.6.2 Distribuciones categricas.1.6.3 Distribuciones acumuladas.1.6.4 Distribuciones porcentuales.1.6.5 Distribuciones porcentuales acumuladas.1.7 Tcnicas de agrupacin de datos.1.7.1 Lmites de clase.1.7.2 Rango de clase.1.7.3 Fronteras de clase.1.7.4 Marca de clase.1.7.5 Intervalo de clase.1.7.6 Diagrama de tallos y hojas.1.7.7 Diagrama de Pareto.1.7.8 Diagrama de puntos.1.8 Histograma.1.8.1 Diagrama de barras.1.8.2 Polgono de frecuencias.1.8.3 Ojivas.1.8.4 Grficas circulares.1.9 Distribuciones muestrales.2 Probabilidad. 2.1Teora elemental de probabilidad.2.1.1 Concepto clsico y como frecuencia relativa.2.1.2 Interpretacin subjetiva de la probabilidad.2.2 Probabilidad de eventos.2.2.1 Definicin de espacio muestral.2.2.2 Discreto y continuo.2.2.3 Definicin de evento.2.2.4 Simbologa, uniones e intersecciones.2.2.5 Diagramas de Venn.2.3 Tcnicas de conteo.2.3.1 Diagrama de rbol.2.3.2 Notacin factorial.2.3.3 Permutacin.2.3.4 Combinaciones.2.3.5 Teorema del Binomio.2.4Probabilidad con tcnicas de conteo.2.4.1 Aplicacin del concepto clsico de probabilidad.2.4.2 Ejerciciosde permutacin.2.4.3 Ejerciciosde combinaciones.2.4.4 Axiomas.2.4.5 Teoremas.2.5Probabilidad condicional.2.5.1 Dependiente.2.5.2 Independiente.2.6 Ley multiplicativa.2.6.1 Clculo de probabilidad de eventos.2.6.2 Conjuntos.2.6.3 Problemas de eventos independientes.2.6.4 Eventos dependientes.2.6.5 Diagramas de rbol.2.7 Eventos Independientes.2.7.1 Aplicacin de teoremas.2.7.2 Regla de Bayes.2.7.3 Conocer teoremas y realizar ejercicios.2.7.4 Resolver problemas que apliquen el teorema.3 Funciones y distribuciones muestrales.3.1 Funcin de probabilidad.Variables aleatorias discretas.Variables aleatorias continuas.3.2 Distribucin binomial.3.2.1 Conceptos de ensayos repetidos.3.2.2 Conceptos de ensayos de Bernoulli.Smbolos de representacin3.3 Distribucin hipergeomtrica.Muestra con reemplazo.Muestra sin reemplazo.3.4 Distribucin de Poisson.3.5 Esperanza matemtica.3.5.1 Medida de una variable aleatoria.3.5.2 Valor esperado.Propiedades de la curva Binomial.Propiedades geomtricas.Parmetros.3.7 Distribucin normal.3.7.1 Distribucin de la probabilidad continua.3.7.2 Ecuacin de la normal.3.7.3 Grficas.3.7.4 Tablas.3.7.5 Aplicaciones3.8 Aproximacin de la binomial a la normal.3.9 Otras distribuciones muestrales.3.9.1 Distribucin T-student.3.9.2 Distribucin X cuadrada.3.9.3 Distribucin F.3.9.4 CPU..4 Estadstica aplicada. Inferencia estadstica.4.1.1 Concepto.4.1.2 Estimacin.4.1.3 Prueba de hiptesis.4.1.4 Mtodo clsico de estimacin (puntual).4.1.5 Estimador Insesgado.4.1.6 Varianza de un estimador puntual.4.2 Intervalos de confianza.4.2.1 Estimacin por intervalo.4.2.2 Lmites de confianza.4.2.3 Intervalo de confianza para medida con varianza conocida.4.2.4 Intervalo de confianza para medida con varianza desconocida.4.2.5 Intervalo de confianza para proporciones.4.3 Pruebas de hiptesis.4.3.1 Prueba de hiptesis para la media poblacional.4.3.2 Prueba de hiptesis para diferencias de medias.4.3.3 Prueba de hiptesis para proporciones.5 Regresin y correlacin.5.1Introduccin.5.1.1 Grficas de los datos.5.1.2 Variables de regresin independientes.5.1.3 Regresin lineal simple.5.1.4 Coeficientes de regresin.5.1.5 Lneas de regresin ajustada.5.2Diagrama de dispersin.5.2.1 Tabla de datos.5.2.2 Construccin de diagramas.5.3Estimacin mediante la lnea de regresin.5.3.1 Ecuacin de la recta como ajuste de datos.5.3.2 Modelos.5.4Mtodos de mnimos cuadrados.5.4.1 Ecuaciones normales.5.4.2 Estimacin de los coeficientes de regresin.5.5Error estndar de estimacin.5.6Coeficientes de determinacin y correlacin.5.6.1 Coeficiente de determinacin de la muestra.5.6.2 Coeficiente de correlacin de la muestra.5.6.3 Error estndar del coeficiente de regresin.5.7Problemas prcticos de ajuste de curvas.Unidad 1. Estadstica descriptiva.1.1 Conceptos bsicos de estadstica.1.1.1 Definicin de estadstica.Definicin de estadstica.El trmino estadstica tiene su raz en la palabra Estado. Surge cuando se hace necesario para sus intereses cuantificar conceptos. En la mayora de los casos esta cuantificacin se har en funcin de unos fines econmicos o militares. El estado quiere conocer censo de personas, de infraestructura, de recursos en general, para poder obtener conclusiones de esta informacin.Actualmente la estadstica es una ciencia. No es ya una cuestin reservada al estado. Podramos decir que se encuentra en la totalidad del resto de ciencias. La raznes clara: por una partela estadstica proporciona tcnicas precisas para obtener informacin, (recogida y descripcin de datos) y por otra parte proporciona mtodos para el anlisis de esta informacin .De ah el nombre de ESTADSTICA DESCRIPTIVA, ya que el objetivo ser, a partir deunamuestradedatos(recogidasegnunatcnicaconcreta), la descripcin de las caractersticas ms importantes, entendiendo como caractersticas, aquellas cantidades que nos proporcionen informacin sobre el tema de inters del cual hacemos el estudio.Si bien no hay una definicin de estadstica exacta, se puede decir quela "estadsticaes el estudiodelos mtodos yprocedimientos pararecoger, clasificar, resumir y analizar datos y para hacer inferencias cientficas partiendo de tales datos".Esta definicin cubre gran parte de la actividad del cientfico. Es importante observar que el objeto del que realiza el anlisis estadstico son los datos y las observacionescientficaspor s mismos, masqueel material qumicoque interviene en el estudio.Por lo tanto no es posible trazar lmites rgidos entre la qumica, la estadstica y la matemtica.La estadstica se puede dividir en 2 categoras, la "estadstica descriptiva" y la "inferencia estadstica".Laestadsticadescriptivaimplicalaabstraccindevariaspropiedadesde conjuntos de observaciones, mediante el empleo de mtodos grficos, tabulares numricos. Entre estas propiedades, estn la frecuencia con que se dan varios valores en la observacin, la nocin de un valor tpico o usual, la cantidad de variabilidad en un conjunto de datos observados y la medida de relaciones entre 2 mas variables.El campo de la estadstica descriptiva no tiene que ver con las implicaciones o conclusionesquesepuedandeducir deconjuntosdedatos. Laestadstica descriptiva sirve como mtodo para organizar datos y poner de manifiesto sus caractersticas esenciales con el propsito de llegar a conclusiones.La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.Las variables pueden ser de dos tipos:Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, sexo).Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales).Las variables tambin se pueden clasificar en:Variables unidimensionales: slo recogen informacin sobre una caracterstica (por ejemplo: edad de los alunmos de una clase).Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y altura de los alumnos de una clase).Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase).Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr ser 3,45).Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:Individuo: cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin sobre el fenmeo que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la poblacin ser el total de las viviendas de dicha ciudad.Muestra: subconjunto que seleccionamos de la poblacin. As, si se estudia el precio de la vivienda de una ciudad, lo normal ser no recoger informacin sobre todas las viviendas de la ciudad (sera una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.1.1.2 Inferencia estadstica.La inferencia estadstica se basa en las conclusiones a la que se llega por la ciencia experimental basndose en informacin incompleta. Por ejemplo, Mendel al estudiar la manera como diferan entre s las plantas de guisantes en altura, color de las semillas, color de las vainas y color de las flores, tuvo que hacersusconclusionesnecesariamentebasndoseenungrupodeplantas relativamente poco numeroso comparado con toda la poblacin de plantas de guisantes de un tipo particular.Al hacerunenunciado, comoporejemplo, sobreel colordelasflores, las conclusiones de Mendel dependan de la muestra particular de plantas disponibles para este estudio.Enlaterminologaestadstica, el procedimientoinductivoimplicael hacer inferencias acercadeunapoblacinadecuadauniversoalaluz delo averiguado en un subconjunto aparte o muestra.La inferencia estadstica se refiere a los procedimientos mediante los cuales se pueden hacer tales generalizaciones inducciones.Es importante por todo lo dicho anteriormente, que el proceso de la inferencia cientfica, implica el grado mas elevado de cooperacin entre la estadstica y el estudio experimental.LaInferenciaEstadsticaeslapartedelaestadsticamatemticaquese encarga del estudio de los mtodos para la obtencin del modelo de probabilidad(formafuncional yparmetrosquedeterminanlafuncinde distribucin) que sigue una variable aleatoria de una determinada poblacin, a travs de una muestra (parte de la poblacin) obtenida de la misma. Los dos problemas fundamentales que estudia la inferencia estadsticason el "Problema de la estimacin" y el "Problema del contraste de hiptesis" Cuando se conoce la forma funcional de la funcin de distribucin que sigue la variable aleatoria objeto de estudio y slo tenemos que estimar los parametros que la determinan, estamos en un problema deinferencia estadstica paramtrica; por el contrario cuando no se conoce la forma funcional de la distribucin que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadstica no paramtrica. Enloquesiguenosvamosalimitaraproblemasdeinferenciaestadstica paramtrica, donde la variable aleatoria objeto de estudio sigue una distribucinnormal,yslotendremosquetratardeestimarlosparmetros que la determinan, la media y la desviacin tpica. Esta situacin se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de la distribucin de probabilidad, por consideraciones tericas, quedando nicamente indeterminados los parmetros que determinan la funcin de distribucin. Comolas poblaciones enlas quesepretendeestudiar unadeterminada variable aleatoria, son grandes, es muy caro o imposible, estudiar a todos sus individuos; loquesehace, es estudiar unamuestra( unaparte) dela poblacin En todos estos problemas que estudia la inferencia estadstica juega un papel fundamental la "Teora de la Probabilidad" (distintas formas funcionales de las distribuciones de probabilidad) y la "Teora de Muestras" (procedimientos para tomar muestras de manera apropiada). 1.1.3 Teora de decisin.TEORA DE DECISINEstudio formal sobre la toma de decisiones. Los estudios de casos reales,que se sirven de la inspeccin y los experimentos, se denominan teora descriptiva de decisin; los estudios de la toma de decisiones racionales,que utilizan la lgica y la estadstica, se llaman teora preceptiva de decisin. Estos estudios se hacen ms complicados cuando hay ms de un individuo, cuando los resultados de diversas opciones no se conocen con exactitud y cuando las probabilidades de los distintos resultados son desconocidas. La teora de decisin comparte caractersticas con la teora de juegos, aunque en la teora de decisin el adversario es la realidad en vez de otro jugador o jugadores.Al hacer un anlisis sobre esta teora, y mirndola desde el punto de vista de un sistema, se puede decir que al tomar una decisin sobre un problema en particular, se debe tener en cuenta los puntos de dificultad que lo componen, para as empezar a estudiarlos uno a uno hasta obtener una solucin que sea acorde a lo que se esta esperando obtener de este, y sino,buscar otras soluciones que se acomoden a lo deseado.La teora de decisin, no solamente se puede ver desde el punto de vista de un sistema, sino en general, porque esta se utiliza a menudo para tomar decisiones de la vida cotidiana, ya que muchas personas piensan que la vida es como una de las teoras; La teora del juego, que para poder empezarlo y entenderlo hay que saber jugarlo y para eso se deben conocer las reglas de este, para que no surjan equivocaciones al empezar la partida.Se puede decir que la Teora de decisin es una de las ramas que sirve para que al dar un paso, no se vaya a dar en falso, porque si se conoce de esta no hay el porque de equivocarse.http://www.tuobra.unam.mx/publicadas/040924151253.htmlTeora de Decisin trata de decisiones contra la naturaleza. Esto se refiere a una situacin donde el resultado(ganancia, prdida) de una decisin depende de la accin de otro jugador (la naturaleza). Por ejemplo, si la decisin es de llevar o no paraguas, la ganancia (llueve o no llueve) depende de la accin que toma la naturaleza. Es importante darse cuenta que en este modelo la ganancia (prdida)concerne solo al tomador de la decisin.Esta condicin distingue la teora de decisin de la teora de juegos. En la teora de juegos ambos jugadores estn interesados en el resultado. La informacin fundamental para los problemas en teora de decisin se encuentra representada en una matriz de ganancias (costos)

Los valoresson las ganancias (o prdidas) para cada posible combinacin de decisin con estado de la naturaleza. El proceso de decisin es el siguinte: El tomador de decisiones selecciona una de las posibles decisiones . Digamos Despus de tomar la decisin, ocurre un estado de la naturaleza. Digamos el estado j. La ganancia recibida por el tomador de decisiones es . El problema del tomador de decisiones es determinar que decisin tomar?. La decisin depender del comportamiento del tomador de decisiones con respecto a la naturaleza, es decir al estado de la naturaleza que sucede. Si creemos que ocurrir el estado de la naturaleza j seleccionaremos naturalmente la decisin que est asociada al mayor valor deen la columnajde la matriz de ganancias. Diferentes suposiciones acerca del comportamiento de la naturaleza conducirn a diferentes formas de seleccionar la "mejor" decisin. Si supieramos cual estado de la naturaleza ocurrir, simplemente seleccionaramos la decisin que nos lleva a obtener una mayor ganancia para ese conocido estado de la naturaleza. En la prctica, pueden haber infinitas posibles decisiones. Si esas posibles decisiones se representan mediante un vectord y la ganancia por la funcin con valores realesr(d), el problema de decisin puede ser formulado como:

max r(d) sujeto a la factibilidad de las restricciones sobre d

http://www.inf.utfsm.cl/~mcriff/fio/td.html1.1.4 Poblacin.Poblaciones, muestras e inferenciaComo se ha sealado anteriormente, el objetivo de la estadstica descriptiva, es la descripcin de los datos y no la inferencia partiendo de los datos.Una poblacindeunidadesesungrupodeentidadesquetienenalguna caracterstica cuantificable en comn.Las unidades pueden ser personas, rboles, bacterias, compuestos qumicos, etc.. Pueden ser finitas o infinitas en nmero. La caracterstica cuantificable puede ser una variable continua o discreta.Unapoblacindeobservacionesesungrupoqueconsisteenlosvalores numricos de una caracterstica cuantificable determinada en cada elemento de una poblacin de unidades.La misma poblacin de unidades tendr en ocasiones mas de una poblacin de observaciones asociada.Una muestra de unidades es un nmero finito de unidades procedentes de una poblacin de unidades.Una muestra de observaciones es un nmero finito de observaciones procedentes de una poblacin de observaciones.Es decir unamuestraes unapartedeunapoblacinqueaislamos para estudiarla.Esteconceptoesdeimportanciaparael anlisisestadsticoporqueporlo general unodisponedeunamuestradeunapoblacinparael estudioque intenta realizar. Por ejemplo, si necesitramos hacer un promedio de todas las alturas de los habitantes de un pas de 200.000.000 de habitantes (esta sera lapoblacinestadstica),eslgicosuponerloengorrosoqueseramedirla altura de todos. Esto se realiza midiendo las alturas de una muestra de esta poblacin, por ejemplo 10.000 habitantes. Este procedimiento es inductivo ya que el investigador saca conclusiones acerca de la poblacin basndose en el anlisis de una muestra de esa poblacin; esto es hacer una inferencia acerca de una poblacin partiendo de una muestra. Se llama inferencia estadstica una conclusin que se refiere a una poblacin de observaciones, obtenida sobre la base de una muestra de observaciones.Unacaractersticadescriptivaglobal deunapoblacindeobservacionesse llama parmetro.Unacaractersticadescriptivaglobal deunamuestradeobservacionesse llama estadgrafo.Poblacion:En estadstica el concepto de poblacin va ms all de lo que comnmente se conoce como tal. En trminos estadsticos, poblacin es un conjunto finito o infinito de personas, animales o cosas que presentan caractersticas comunes, sobre los cuales se quiere efectuar un estudio determinado. En otras palabras, la poblacin se define como la totalidad de los valores posibles (mediciones o conteos) de una caracterstica particular de un grupo especificado de personas, animales o cosas que se desean estudiar en un momento determinado. As, se puede hablar de la poblacin de habitantes de un pas, de la poblacin de estudiantes universitarios de la zona sur del Estado Anzotegui, de la poblacin de casas de la Urbanizacin Los Ros de la ciudad de El Tigre, el rendimiento acadmico de los estudiantes del IUTJAA, el nmero decarrosmarcaCoroladelaciudaddeEl Tigre, laestaturadeungrupo alumnos del IUTJAA, la talla, etc.1.1.5 Muestra aleatoria.Una muestra aleatoria es una muestra sacada de una poblacin de unidades, de manera que todo elemento de la poblacin tenga la misma probabilidad de seleccin y que las unidades diferentes se seleccionen independientemente.Una muestra aleatoria de tamao n de una poblacin X , es una sucesin de n variablesaleatorias, independientes, X1, X2 ,..., Xn, conidnticaleyde probabilidad que X . Una muestra de tamao n est constituida por n rplicas de X. Una vez que la muestra se haya realizado, es decir, se hayan extrado los n individuos de la poblacin y "medido" la variable X en cada uno de ellos, se dispondrndendatosuobservaciones: x1, x2 ,..., xn. Paraqueuna variablealeatoria, definidaapartirdeunamuestraaleatoriadetamaon, tomevalores, esnecesariodisponerdelosndatosdelarealizacindetal muestra. 1.1.6 Parmetros aleatorios.Los Parmetros:Son cualquiera caracterstica que se pueda medir y cuya medicin se lleve a cabo sobre todos los elementos que integran una poblacin determinada, los mismossuelenrepresentarseconletrasgriegas. El valor deunparmetro poblacional es un valor fijo en un momento dado. Ejemplo: La media Aritmtica = m (miu), La desviacin Tpica = s, (Sigma) etctera.Una parmetro es una medida usada para describir alguna caracterstica de una poblacin, tal como una media aritmtica, una mediana o una desviacin estndar de una poblacin.Cuando los dos nuevos trminos de arriba son usados, por ejemplo, el proceso de estimacin en inferencia estadstica puede ser descrito como le proceso de estimar un parmetro a partir del estadstico correspondiente, tal como usar una media muestral ( un estadstico para estimar la media de la poblacin (un parmetro).Lossmbolosusadospararepresentarlosestadsticosylosparmetros, en ste y los siguientes captulos, son resumidos en la tabla siguiente:Tabla 1Smbolos para estadsticos y parmetros correspondientesMedida Smbolo para el estadstico Smbolo para el parmetro(muestra) (Poblacin)Media X Desviacin estndar s Nmero de elementos n NProporcin p P1.1.7 Enfoque clsico.El enfoque clsico analiza la serie considerando cada variable por separado y en funcin del tiempo; se ha convertido en un mtodo estndar de estudio de estas series, y es aceptado de forma unnime por los estadsticos; por tanto es el que se describir en el presente tema.Elenfoque cl si co: Dice que si hay x posibles resultados favorables a la ocurrencia de un evento A y z posibles resultados desfavorables a la ocurrencia de A, y todos los resultados son igualmente posibles y mutuamente excluyente (no pueden ocurrir los dos al mismo tiempo), entonces la probabilidad de que ocurra A es:P(A) = __ x __(x+z)El enfoque clsico de la probabilidad se basa en la suposicin de que cada resultado sea igualmente posible. Este enfoque es llamado enfoque a priori porque permite, (en caso de que pueda aplicarse) calcular el valor de probabilidad antes de observar cualquier evento de muestra.Ejempl o: Si tenemos en una caja 15 piedras verdes y 9 piedras rojas. La probabilidad de sacar una piedra roja en un intento es:P(A) = ____9____= 0.375 o 37.5%9+15http://html.rincondelvago.com/probabilidades_1.html1.1.8 Enfoque Bayesiano.La estadstica bayesiana le debe su nombre al trabajo pionero del reverendo Thomas Bayes titulado An Essay towards solving a Problem in the Doctrine of Chances publicadopstumamente en 1764 en la Philosophical Transactions of the Royal Society of London.El artculo fue enviado a la Real Sociedad de Londres por Richard Price, amigo de Bayes, en1763, quin escribi:Yo ahora le mando un ensayo que he encontrado entre los papeles de nuestro fallecido amigo Thomas Bayes, y el cual, en mi opinin, tiene un gran mrito, y bien merece ser preservado... En una introduccin que l ha escrito para este ensayo, l dice, que su objetivo en un principio fue, descubrir un mtodo por elcual se pueda juzgar la probabilidad de que un evento tenga que ocurrir bajocircunstancias dadas, y bajo la suposicin de que nada es conocido sobre dichoevento, salvo que, bajo las mismas circunstancias, ste ha ocurrido un ciertonmero de veces y fallado otro tanto... Cualquier persona juiciosa ver que elproblema aqu mencionado no es de ninguna manera una simple especulacinproducto de la curiosidad, sino un problema que se necesita resolver para contarcon un fundamento seguro para todos nuestros razonamientos concernientes ahechos pasados y a lo que probablemente ocurra de ah en adelante... El propsitoa m me parece es, mostrar qu razones nosotros tenemos para creer que en laconstitucin de las cosas existen leyes fijas de acuerdo con las cuales las cosaspasan, y que, por lo tanto, el funcionamiento del mundo debe ser el efecto de lasabidura y el poder de una causa inteligente, y as, confirmar el argumentotomado desde las causas finales para la existencia de la deidad.Aunque la obra de Thomas Bayes data ya de hace ms de dos siglos, la estadsticabayesiana es relativamente nueva, y actualmente ostenta un gran desarrollo aunque noajeno a tambin grandes controversias.Inferencia BayesianaUn punto importante en la definicin clsica de inferencia es que el parmetro , el cual esdesconocido, es tratado como constante en vez que como variable. Esta es la idea fundamentalde la teora clsica, pero conduce a ciertos problemas de interpretacin.Si [0.2, 0.3] es un intervalo del 95% de confianza para , sera cmodo decir que hay un 95%de probabilidad de que est en el intervalo. Sin embargo, esto es incongruente con la idea deque no es aleatorio. Dado que es fijo, solo existen dos opciones: est dentro o est fueradel intervalo. El nico elemento aleatorio en este modelo es y, por lo que la interpretacincorrecta del intervalo consistira en decir que, si se repite el procedimiento muchas veces,entonces a la larga, el 95% de los intervalos contendran a .Toda inferencia basada en la estadstica clsica es forzada a tener este tipo de interpretacinfrecuencial, aunque sin embargo, nosotros solo contamos con un intervalo para interpretar.El marco terico en el cual se desarrolla la inferencia bayesiana es idntico al de la teoraclsica. Se tiene un parmetro poblacional sobre el cual se desea hacer inferencias y se tieneun modelo de probabilidad p(y| ) el cual determina la probabilidad de los datos observados ybajo diferentes valores de . La diferencia fundamental entre la teora clsica y la bayesianaest en que es tratado como una cantidad aleatoria. As, la inferencia bayesiana se basa enp( | y) en vez de p(y | ), esto es, en la distribucin de probabilidades del parmetro dados losdatos.La inferencia bayesiana, se puede resumir como el proceso de ajustar un modelo deprobabilidad a un conjunto de datos y resumir los resultados mediante una distribucin deprobabilidades para los parmetros del modelo y para cantidades desconocidas peroobservables tales como predicciones para nuevas observaciones. La caracterstica esencial delos mtodos bayesianos est en su uso explcito de probabilidades para cuantificar laincertidumbre en inferencias basadas en el anlisis estadstico de los datos. Esto permite unmanejo mucho ms natural e intuitivo de la inferencia, salvando por ejemplo el problema dela interpretacin frecuencial de los resultados. Sin embargo, para hacer uso de un enfoquebayesiano, es necesario especificar una distribucin de probabilidades a priori p( ), la cualrepresenta el conocimiento que se tiene sobre la distribucin de previo a la obtencin de losdatos.Esta nocin de una distribucin a priori para el parmetro constituye el centro delpensamiento bayesiano y, dependiendo de si se es un defensor o un opositor a estametodologa, su principal ventaja sobre la teora clsica o su mayor vulnerabilidad.Caractersticas de la Aproximacin BayesianaDe acuerdo con OHagan (1994), se pueden identificar cuatro aspectos fundamentales quecaracterizan la aproximacin bayesiana a la inferencia estadstica:???Informacin a Priori. Todos los problemas son nicos y tienen su propio contexto. De talcontexto se deriva informacin a priori, y es la formulacin y uso de esta informacin apriori la que diferencia la inferencia bayesiana de la estadstica clsica.??? Probabilidad Subjetiva. La estadstica bayesiana formaliza la nocin de que todas lasprobabilidades son subjetivas, dependiendo de las creencias individuales y la informacindisponible. As, el anlisis bayesiano resulta personal, nico de acuerdo con las creenciasindividuales de cada uno.??? Auto consistente. Al tratar al parmetro como aleatorio, la inferencia bayesiana se basacompletamente en la teora de la probabilidad. Esto tiene muchas ventajas y significa quetoda inferencia puede ser tratada en trminos de declaraciones probabilsticas para .??? No adhockery. Debido a que la inferencia clsica no puede hacer declaracionesprobabilsticas acerca de , varios criterios son desarrollados para juzgar si un estimadorparticular es en algn sentido bueno. Esto ha conducido a una proliferacin deprocedimientos, frecuentemente en conflicto unos con otros. La inferencia bayesiana dejade lado esta tendencia a inventar criterios ad hoc para juzgar y comparar estimadores albasarse exclusivamente en la distribucin posterior para expresar en trminosexclusivamente probabilsticos toda inferencia referente al parmetro.Objeciones a la Inferencia Bayesiana.La principal objecin a la inferencia bayesiana, es que las conclusiones dependen de laseleccin especfica de la distribucin a priori. Aunque para otros esto es lo interesante de laaproximacin bayesiana, este es un debate an no cerrado. Sin embargo, antes de dejar estacaracterstica, se debe sealar que inclusive en inferencia clsica, y adems en investigacincientfica en general, estos conocimientos a priori son utilizados implcitamente. As porejemplo, el conocimiento a priori es utilizado para formular un modelo de verosimilitudapropiado. En pruebas de hiptesis, las creencias a priori acerca de la plausibilidad de unahiptesis son frecuentemente utilizadas para ajustar el nivel de significancia de la prueba. As,si se cree que los datos pueden conducir al rechazo de la hiptesis, esto se puede ajustarescogiendo un nivel de significancia bastante alto. En este sentido entonces, la inferenciabayesiana formaliza la incorporacin de la informacin a priori, la cual es incorporadafrecuentemente debajo de la mesa en el anlisis clsico.http://tarwi.lamolina.edu.pe/~reyzaguirre/EB.htm1.2 Descripcin de datos.1.2.1 Datos agrupados y no agrupados.Clculo de la mediana a partir de datos no agrupados:Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o ascendente. Si el conjunto de datos contiene un nmero impar de elementos, el de en medio en el arreglo es la mediana. Si hay un nmero par de observaciones, la mediana es el promedio de los dos elementos de en medio. Mediana = (n + 1) / 2Clculo de la mediana a partir de datos agrupados:1. Encontrar qu observacin de la distribucin est ms al centro (Mediana = (n + 1) / 2). 2. Sumar las frecuencias de cada clase para encontrar la clase que contiene a ese elemento ms central. 3. Determinar el nmero de elementos de la clase y la localizacin de la clase que contiene al elemento mediano. 4. Determinar el ancho de cada paso para pasar de una observacin a otra en la clase mediana, dividiendo el intervalo de cada clase entre el nmero de elementos contenido en la clase. 5. Determinar el nmero de pasos que hay desde el lmite inferior de la clase mediana hasta el elemento correspondiente a la mediana. 6. Calcular el valor estimado del elemento mediano multiplicando el nmero de pasos que se necesitan para llegar a la observacin mediana por el ancho de cada paso. Al producto sumarle el valor del lmite inferior de la clase mediana. 7. Si existe un nmero par de observaciones en la distribucin, tomar el promedio de los valores obtenidos para el elemento mediano calculados en el paso nmero 6. Clculo de la moda a partir de datos no agrupados:En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el valor ms frecuente del conjunto de datos. Es por esta razn que rara vez utilizamos la moda de un conjunto de datos no agrupados como medida de tendencia central.Por esta razn, siempre que utilizamos la moda como medida de tendencia central de un conjunto de datos, debemos calcular la moda de datos agrupados (buscar la clase modal).Clculo de la moda de datos agrupados:Cuando los datos ya se encuentran agrupados en una distribucin de frecuencias, podemos poner que la moda est localizada en la clase que contiene el mayor nmero de elementos, es decir, en la clase que tiene mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal:Mo = Lmo + [d1 / (d1 + d2 )] wLmo = lmite inferior de la clase modal.d1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por debajo de ella.d2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por encima de ella.w = ancho del intervalo de la clase modal.1.2.2 Frecuencia de clase.Distribucin de frecuencia de clase o de datos Agrupados:Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, losdatosoriginalesdevariosvaloresadyacentes del conjuntosecombinan paraformar unintervalodeclase. Noexisten normas establecidas para determinar cundo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el nmero total de datos (N) es igual o superior 50 y adems el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizar la distribucin de frecuencia para datos agrupados, tambin se utilizar este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la ojiva.La razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una investigacin sea manejable con mayor facilidad.Componentes de una distribucin de frecuencia de clase1.- RangooAmplitudtotal (recorrido).- Esel lmitedentrodel cual estn comprendidos todos los valores de la serie de datos, en otras palabras, es el nmero de diferentes valores que toma la variable en un estudio o investigacin dada. Es la diferencia entre el valor mximo de una variable y el valor mnimo que sta toma en una investigacin cualquiera. El rango es el tamao del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribucin de frecuencia se designa con la letra R.2.- Clase o Intervalo de clase.- Son divisiones o categoras en las cuales se agrupanunconjuntodedatosordenadosconcaractersticascomunes. En otraspalabras, sonfraccionamientosdel rangoorecorridodelaseriede valores para reunir los datos que presentan valores comprendidos entre dos limites. Para organizar los valores de la serie de datos hay que determinar un nmero de clases que sea conveniente. En otras palabras, que ese nmero de intervalos no origine un nmero pequeo de clases ni muy grande. Un nmero declasespequeopuedeocultarlanaturalezanatural delosvaloresyun nmeromuyaltopuedeprovocardemasiadosdetallescomoparaobservar alguna informacin de gran utilidad en la investigacin.Tamao de los Intervalos de ClaseLos intervalos de clase pueden ser de tres tipos, segn el tamao que estos presentenenunadistribucindefrecuencia: a)Clasesdeigual tamao, b) clases desiguales de tamao y c) clases abiertas.3.-Amplitud de Clase, Longitud o Ancho de una Clase La amplitud o longitud de una clase es el nmero de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa diversidad de criterios, se ha considerado que lo ms importante es dar un ancho o longitud de clase a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la practica.4.-Punto medio o Marca de claseEl centrodelaclase, esel volardelosdatosqueseubicaenlaposicin centralde la clase y representa todos los dems valores de esa clase. Este valor se utiliza para el calculo de la media aritmtica.5.-Frecuencia de claseLa frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el nmero total de valores de las variables que se encuentran presenteenunaclasedeterminada, deunadistribucindefrecuenciade clase.6.- Frecuencia RelativaLa frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clasesdeunadistribucindefrecuenciadeclaseentreel nmerototal de datos(N) de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).7.-Frecuencias acumuladasLas frecuencias acumuladas de una distribucin de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clasesdeunadistribucindefrecuenciadeclase, estoselogracuandola acumulacin de las frecuencias se realiza tomando en cuenta la primera clase hastaalcanzar laultima. Lasfrecuenciasacumuladassedesignanconlas letrasfa. Lasfrecuenciasacumuladaspuedenser menor que(faque).8.- Frecuencia acumulada relativaLa frecuencia acumulada relativa es aquella que resulta de dividir cada una de las fa de las diferentes clases que integran una distribucin de frecuencia de clase entre el nmero total de datos (N) de la serie de valores, estas frecuencias se designan con las letras far. Si las far se multiplican por 100 se obtienen las frecuencias acumuladas relativas porcentuales y las mismas se designan as: far %.1.2.3 Frecuencia relativa.Frecuencia relativa:La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fiDonde N = Tamao de la muestraLa frecuencia relativa de un intervalo se obtiene dividiendo la frecuencia dl intervalo, entre el nmero total de datos. Cuando el resultado se multiplica por 100 obtenemos la FRECUENCIA RELATIVA PORCENTUAL .FRECUENCIA RELATIVA( h i )La frecuencia relativa es el cuociente entre la frecuencia absoluta ( f i ) y el nmero total de datos ( n ).En nuestro ejemplo, n = 50: TABLA:x if ih i 040,08 190,18 2120,24 3100,20 480,16 540,08 620,04 710,02 GRAFICOS: http://www.eneayudas.cl/estentrada.htm#relativa1.2.4 Punto medio.El punto medio de un intervalo se puede obtener de varias formas. Posiblemente la ms fcil consiste en sumar los lmites inferiores de dos intervalos consecutivos y dividir entre dos. Ejemplo:Puntuacionesfrecuencia200-299 2300-399 8400-499 6 En el ejemplo anterior 200 es el lmite inferior del primer intervalo y 300 el lmite inferior del segundo intervalo. Por lo tanto el punto medio del primer intervalo es (200+300)/2 = 250De igual forma el punto medio del segundo intervalo es 350.Nota: Algunos autores definen el punto medio como el punto que se encuentra a mitad de camino entre los llamados lmites exactos de cada intervalo. Por lo tanto calculan el punto medio sumando los lmites exactos del intervalo y dividiendo entre 2. (Vase Hinkle capt.2) http://rrpac.upr.clu.edu:9090/~amenend/poligonofre.htmPunto medio o Marca de claseEl centrodelaclase, esel volardelosdatosqueseubicaenlaposicin centralde la clase y representa todos los dems valores de esa clase. Este valor se utiliza para el calculo de la media aritmtica.Punto medi o de cl ase o marca de cl ase: Para fines de anlisis de datos, los valores de las clases se representan a travs del punto medio de clase o marca de clase. El punto medio de clase se define como la semi-suma de los limites de clase. El punto medio de clase se identifica como Xi, donde Xi = (limite superior + limite inferior).Pasos para construir una distribucin de frecuencias: conocidos ya todos los elementos tericos necesarios para la construccin y comprensin de una distribucin de frecuencias vamos a proceder a mostrar los pasos requeridos para su ejecucin.1 Determinar el recorrido o rango. R = X mx. - X mn.2 Calcular el intervalo de clase, siempre que se conozca l numero de clases.R = R NC3 Calcular l numero de clases, siempre que se conozca el intervalo de clase.NC = R CiComo se puede observar en el segundo y tercer paso resultara muy difcil resolver estas ecuaciones por simples mtodos matemticos ya que cada una de ellas presenta dos incgnitas. Como solucin a este problema surge la formula s Sturgees que se expresa as:Ci = R .1+3.22 log NDonde R = recorrido y N = numero total de valores.En lo referente al punto medio de cada clase, este es usado para representar mediante un solo valor el recorrido de cada clase y sirve adems para los fines de anlisis estadsticos de los datos. Es importante sealar con relacin a la construccin de una distribucin de frecuencias que el lector o usuario tenia plena libertad en la pre-escogencia del intervalo de clase, en funcin de la naturaleza de los datos y su conveniencia tcnica.http://html.rincondelvago.com/estadistica-en-la-toma-de-decisiones.html1.2.5 Lmites.Lmite de una funcin en un punto. Propiedades. A) LIMITE EN UN PUNTO. A1) Lmite finito:Se dice que la funcin y = f(x) tiene por lmite l cuando x tiende hacia a, y se representa por (Es decir, que si fijamos un entorno de l de radio, podemos encontrar un entorno de a de radio , que depende de, de modo que para cualquier valor de x que est en el entorno E(a, ) exceptuando el propio a, se tiene que su imagen f(a) est en el entorno E(l, ).) A2) Lmite infinito: (A partir de ahora usaremos la notacin matemtica para hacer ms corta la definicin). B) PROPIEDADES DE LOS LMITES. B1)siempre que no aparezca la indeterminacin.B2)con.B3)siempre y cuando no aparezca la indeterminacin.B4)siempre y cuando no aparezcan las indeterminacionese.B5)con, siempre y cuando tengan sentido las potencias que aparecen.B6)siempre y cuando tengan sentido las potencias que aparecen y no nos encontremos con indeterminaciones de los tipos.C) LIMITES LATERALES. C1) Lmite por la izquierda: C2) Lmite por la derecha: TEOREMA: Existe el lmite si y solo si existen los limites laterales (por la derecha y por la izquierda) y ambos coinciden. (Demostracin inmediata).TEOREMA: Si existe el lmite, ste es nico. (Demostracin inmediata).Todo lo dicho anteriormente es tambin vlido si consideramos que el lmite valeen lugar de l. 2. Lmites en el infinito. Asntotas de una curva.A) LIMITES EN EL INFINITO. A1) Lmite finito. A2) Lmite infinito. Todo lo referente a las propiedades de los lmites vistas en la pregunta anterior es vlido si escribimosen lugar de a. Hay casos que parecen indeterminaciones y no lo son realmente.B) ASNTOTAS DE UNA CURVA. B1) Asntotas verticales.Se dice que y = f(x) tiene una asntota vertical en x=a sio alguno (o ambos) de los lmites laterales vale. Es decir, puede haber asntota vertical por la derecha, por la izquierda o por ambos lados. La posicin de la curva respecto a la asntota depender del signo de los lmites laterales. Como ejemplo, determinar la asntota vertical y su posicin con respecto a la grfica de la funcin B2) Asntotas horizontales. Se dice que y = f(x) tiene una asntota horizontal en y=b si. La asntota puede aparecer cuandoLa posicin de la grfica de la funcin respecto a la asntota vertical se determina estudiando si el signo de f(x) - b es positivo o negativo cuando. Como ejemplo, determinar la asntota horizontal y su posicin con respecto a la grfica de la funcin B3) Asntotas oblicuas. Dada la funcin y = f(x), si se verifica que a)b)c) entonces se dice que y = mx + h es una asntota oblicua de dicha funcin para. La asntota puede aparecer cuandoPara estudiar la posicin de la grfica de la funcin con respecto a la asntota basta estudiar el signo de f(x)-(mx + h). Como ejemplo, determinar la asntota oblicua y su posicin con respecto a la grfica de la funcin 3. Clculo de lmites.A) INDETERMINACIN En la mayora de los casos basta con efectuar las operaciones indicadas. Ejemplo.-En otros casos, sobre todo en aquellos en que aparecen radicales, basta con multiplicar y dividir por la expresin radical conjugada. Ejemplo.-B) INDETERMINACIN En la mayora de los casos basta con efectuar las operaciones indicadas. Ejemplo.-C) INDETERMINACIN Cuando solo aparecen funciones racionales, basta con descomponer factorialmente el numerador y el denominador. Ejemplo.-En aquellos casos en que aparecen funciones irracionales (radicales), basta con multiplicar y dividir por la expresin radical conjugada. Ejemplo.-D) INDETERMINACIN En la mayora de los casos basta con dividir el numerador y denominador por la mayor potencia de x del denominador. Ejemplos.-E) INDETERMINACIONES-- Para determinar estos lmites tendremos en cuenta que: de donde resulta que: pudiendo aparecer otras indeterminaciones, que resolveremos por los mtodos anteriores o por mtodos que aprenderemos en temas posteriores. En el caso de la indeterminacinpodemos aplicar con mayor facilidad la siguiente igualdad: Aplicar la igualdad anterior a la resolucin del siguiente lmite: F) LIMITES DE FUNCIONES TRIGONOMTRICAS. En algunos casos podemos utilizar un lmite muy conocido, que es: Aplica lo anterior para resolver los siguientes lmites: (Usa la frmula del sen(x/2))En los casos anteriores puede ocurrir que aplicando lo dicho anteriormente no podamos resolver la indeterminacin. Estos casos, al igual que en el apartado E), se resolvern en los temas siguientes aplicando la Regla de L'Hpital. 4. Funcin continua en un punto y en un intervalo.Diremos que la funcin y = f(x) es continua en x = a si: a. Existe f(a), es decir, f(x) est definida en x=a. b. Existe el. c. Ambos valores coinciden, es decir. Si tenemos en cuenta la definicin de lmite, podemos obtener la siguiente definicin equivalente: Diremos que y = f(x) es continua en el (a,b) si es continua en cada uno de los puntos del intervalo abierto (a,b). Diremos que y = f(x) es continua por la derecha en x=a si. Diremos que y = f(x) es continua por la izquierda en x=a si. Diremos que y = f(x) es continua en el [a,b] si: a. y = f(x) es continua en el intervalo abierto (a,b). b. y = f(x) es continua por la derecha en x=a. c. y = f(x) es continua por la izquierda en x=b. TEOREMA: Si y = f(x) es continua en x = a existe el. (La demostracin es inmediata) Sin embargo, el teorema recproco no es cierto en general. Como ejemplo comprobarlo para: TEOREMA DE CONSERVACIN DEL SIGNO Sea y=f(x) una funcin continua en x=a siendo f(a) distinto de 0existe un entorno de x=a en el que los valores de f(x) tienen el mismo signo que f(a). Demostracin:Supongamos que f(a)>0 (si fuese negativo, se razonara de modo similar).Tomemos. Por la continuidad de y=f(x) en x=a se tiene que:Es decir: Por lo tanto: f(x)>0. (Como se quera demostrar) TEOREMA DE ACOTACIN DE LA FUNCIN Si y = f(x) es continua en x = ay = f(x) est acotada en un cierto entorno de x = a. Demostracin:Tomemos. Por la continuidad de y = f(x) en x = a se tiene que:de modo quees un intervalo acotado, por lo tanto y=f(x) est acotada en el entornode x=a. 5. Operaciones con funciones continuas.Sean f(x) y g(x) dos funciones continuas en x=a, se tiene entonces que: a. es continua en x=a. b. es continua en x=a. c. es continua en x=a si. d. es continua en x=a suponiendo que f(a)>0 (para que tenga sentido la potencia). TEOREMA: Si f(x) es continua en x=a y g(x) es continua en y=f(a)es continua en x=a. Demostracin:De lo dicho anteriormente resulta que:6. Discontinuidades.Se dice que una funcin y = f(x) es discontinua en x = a si no es continua en dicho valor de x, es decir, no cumple alguna de las tres condiciones de continuidad.TIPOS DE DISCONTINUIDADES A) Evitable: Cuando existe elpero no coincide con el valor de f(a) por una de estas dos razones, son distintos los valores o no existe f(a).B) De salto: Cuando existe el lmite por la derecha y por la izquierda (siendo ambos finitos) pero no coinciden.C) Asinttica: Cuando alguno de los lmites laterales (o ambos) no es finito. Puede ser asinttica por la derecha, por la izquierda o por ambos lados.D) Esencial: Cuando no existe alguno de los lmites laterales (o ambos). Puede serlo por la derecha, por la izquierda o por ambos lados. Si y = f(x) tiene una discontinuidad evitable en x = a, llamaremos verdadero valor de la funcin en x=a al. Dicho valor es el que convierte a la funcin en continua.Si y = f(x) tiene una discontinuidad de salto en x=a, llamaremos salto de la funcin en x=a al valor.Estudiar, como aplicacin de lo anterior, la continuidad y discontinuidades de las funciones elementales vistas en el captulo anterior y de las funciones definidas a trozos. 7. El Teorema del valor intermedio de Bolzano y el Teorema de existencia de extremos absolutos de Weierstrass.TEOREMA DE BOLZANO Si y = f(x) es una funcin continua en el [a,b] siendo distintos los signos de dicha funcin en los extremos del intervalo, es decir,tal que f(c)=0. Demostracin:Supongamos que f(a)0 (Se razona de forma anloga si ocurre lo contrario).Siel teorema est demostrado. En caso contrario, la funcin tomar en dicho punto un valor del mismo signo que f(a) o que f(b).Seael nuevo intervalo donde hay cambio de signo.Siel teorema est demostrado. En caso contrario, repetimos el proceso anterior, obtenindose una sucesinde intervalos encajados tales que cada uno es la mitad del anterior y la funcin toma valores opuestos en los extremos de cada intervalo. Dicha sucesin define un nmero real. Demostremos que f(c)=0.Supongamos quepor el TEOREMA DE CONSERVACIN DEL SIGNO, existir un entorno de c donde se mantendr el mismo signo que en c. Sin embargo, por la construccin anterior, dicho entorno contendr uno al menos de los, donde la funcin tomaba valores opuestos. Llegamos pues a una contradiccinf(c)=0.Consecuencia: Si y = f(x) es continua en a,b y k es un valor comprendido entre los valores de f(a) y f(b) (o al revs)(Basta aplicar el Teorema de Bolzano a g(x)=f(x)-k.) TEOREMA DE WEIERSTRASS: Si y = f(x) es continua en [a,b]f(x) alcanza el mximo y el mnimo absoluto en dicho intervalo [a,b]. Demostracin: A) Veamos, en primer lugar, que f(x) est acotada en [a,b].Supongamos que no lo est. Consideremos el punto medioy los subintervalosy f(x) no est acotada en uno de ellos, al menos, que llamaremos. Dividamosen dos mitades y llamemosa aquella parte de las dos (al menos) en la que f(x) no est acotada. Repitamos el proceso indefinidamente, obteniendo una sucesinde intervalos encajados, cada uno la mitad del anterior, donde f(x) no est acotada.Sea c el nmero real que define esta sucesin. Como f es continua en [a,b]f es continua en c por el TEOREMA DE ACOTACIN DE LA FUNCIN, existir un entorno de c en el que la funcin est acotada. Pero en dicho entorno y por construccin estarn incluidos a partir de uno todos los, donde la funcin no estaba acotada. Llegamos a una contradiccin, luego f(x) est acotada en [a,b].B) Veamos, a continuacin, que f(x) alcanza el mximo en [a,b]. (Anlogamente se demuestra que alcanza el mnimo).Si f(x) est acotada en [a,b]siendo m el nfimo o extremo inferior y M el supremo o extremo superior. Si en algn punto de [a,b] resulta que f(x)=M, el teorema estar demostrado.g(x) est acotada en [a,b]M no es el extremo superior de f, en contra de lo supuesto. Luego necesariamente ha de existir un f(x) alcanza un mximo absoluto en [a,b]. Consecuencia (Teorema de Darboux): Si y=f(x) es continua en [a,b]f(x) toma en dicho intervalo todos los valores comprendidos entre el mximo y el mnimo. ( Su demostracin es inmediata a partir de la consecuencia del teorema de Bolzano y del teorema de Weierstrass. http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/39-1-u-continuidad.htmlSin duda, el teorema ms importante en Estadstica es el teorema del lmite central. No solamente es importante desde el punto de vista terico sino por su gran trascendecia en mtodos estadsticos. Teorema del lmite central.- Cuando el tamao de la muestra (nmero de observaciones en cada muestra) se vuelve suficientemente grande, la distribucin en el muestreo de la media se puede aproximar con la distribucin normal. Esto es vlido cualquiera que sea la distribucin de los valores individuales en la poblacin.Ahora la pregunta que surge con todo seguridad en este momento es que tamao de muestra es "suficientemente grande". Se ha dedicado gran parte de la investigacin estadstica a esta pregunta particular. Los estadsticos han encontrado que no importa lo no normal que sea la distribucin de la poblacin, una vez que el tamao de la muestra es, cuando menos menos de 30, la distribucin en el muestreo de la media ser aproximadamente normal.La aplicacin del teorema del lmite central a diferentes poblaciones, se puede explicar con referencia a las sguientes figuras. Cada una de las distribuciones muestrales ilustradas se ha obtenido con el uso de la computadora para seleccionar 500 diferentes muestras a partir de sus respectivas distribuciones poblacionales. estas muestras se seleccionaron para tamaos variables (n = 2,4,8,16,32) a partir de cuatro distribuciones continuas diferentes (normal, uniforme, en forma de U y exponencial).La primera figura, ilustra la distribucin en el muestreo de la media seleccionada de una poblacin normal. Es sabido, que si la poblacin tiene distribucin normal, la distribucin en el muestreo de la media tambin tendr distribucin normal cualquiera que sea el tamao de la muestra. En la figura se puede observar que para cada tamao de muestra estudiado, la distribucin en el muestreo de la media tiene una distribucin aproximadamente normal.Distribucin normal y distribucin de la muestra de la media de 500 muestras de tamao n= 2, 4, 8, 18, 32La segunda figura, presenta la distribucin en el muestreo de la media basada en una poblacin que sigue una distribucin continua (regular). Como se ilustra en el panel (a) de la la figura, para muestras de tamao n = 1, cada valor en la poblacin tiene la misma probabilidad. No obstante cuando se seleccionan muestras slo de dos, hay un "mximo" o "limitacin central". Por ello, en este caso se pueden observar ms valores "cercanos a" la media de l apoblacin, que en los extremos. Asimismo, conforme aumenta el tamao de la muestra, la distribucin en el muestreo de la media se aproxima con rapidez a una distribucin normal. En este caso, uan vez que hay muestras de cuando menos ocho observaciones, la media muestral sigue, ms o menos, una distribucin normal.Distribucin continua (rectangular) y distribucin de la media de 500 muestras de tamao n= 2, 4, 8, 18, 32La tercera figura, se relaciona con la distribucin en el muestreo de la media obtenida con la poblacin en forma de U. En el panel (a) de la figura se puede observar que esta poblacin, aunque es simtrica, tiene su menor frecuencia en el centro y su mayor frecuencia en los extremos inferior y superior de la distribucin. Aunque la poblacin tiene muy pocos valores cerca del centro, incluso cuando el tamao de la muestra sea slo de dos, muchas de las medias muestrales ya estn reunidas alrededor del centro de las distribuciones. Un examen de los otros paneles revele que una vez que el tamao de la muestra llega a ocho, la distribucin en el muestreo de la media tiene distribucin aproximadamente normal.Distribucin en forma de U y distribucin de la muestra de la media de 500 muestras de tamao n= 2, 4, 8, 18, 32Y por ltimo la cuarta figura, ejemplifica la distribucin en el muestreo de la media obtenida con una poblacin con fuerte sesgamiento a la derecha, llamada la distribucin exponencial. En la figura se aprecia que conforme aumenta el tamao de la muestra, la distribucin en el muestreo se vuelve menos sesgada. Cuando se toman muestras de tamao 16, la distribucin en el muestreo tiene un ligero sesgamiento, mientrs que, para muestras de tamao 32, la distribucin en el muestreo de la media parece tener distribucin normal.Distribucin exponencial y distribucin de la muestra de la media de 500 muestras de tamao n= 2, 4, 8, 18, 32Entonces, el Teorema del Lmite Central es de importancia crucial en el uso de la inferencia estadstica para llegar a conclusiones en cuanto a una poblacin. Le permite al investigador hacer inferencias en cuanto a la media de la poblacin sin tener que conocer la forma especfica de la ditribucin de la poblacin. Esto significa que el estadstico muestral calculado, como la media muestral, la desviacin estndar y la proporcin, suministran la informacin necesaria para estimar los valores reales en la poblacin.1.2.6 Histograma.Se utiliza en datos cuantitativos en distribuciones de frecuencia. Son rectngulos verticales unidos entre s, en donde sus lados son los lmites reales inferior y superior de clase y cuya altura es igual ala frecuencia de clase.Con la distribucin de frec. anterior se tiene: HISTOGRAMAUn histograma es un resumen grfico de la variacin de un conjunto de datos. La naturaleza grfica del histograma nos permite ver pautas que son difciles de observar en una simple tabla numrica. Esta herramienta se utiliza especialmente en la Comprobacin de teoras y Pruebas de validez. Cmo i nterpretarl os hi stogramas:Sabemos que los valores varan en todo conjunto de datos. Esta variacin sigue cierta pauta. El propsito del anlisis de un histograma es, por un lado, identificar y clasificar la pauta de variacin, y por otro desarrollar una explicacin razonable y relevante de la pauta. La explicacin debe basarse en los conocimientos generales y en la observacin de las situaciones especficas y debe ser confirmada mediante un anlisis adicional. Las pautas habituales de variacin ms comunes son la distribucin en campana, con dos picos, plana, en peine, sesgada, truncada, con un pico aislado, o con un pico en el extremo. Construcci n de un hi stograma:PASO 1 Determinar el rango de los datos: RANGO es igual al dato mayor menos el dato menor; R = > - < PASO 2Obtener ennmero de clases, existen varioscriterios paradeterminarelnmero de clases(o barras). Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendodecomoestnlosdatosycuntossean. Uncriteriousadofrecuentementeesqueel nmero de clases debe ser aproximadamente ala raz cuadrada del nmero de datos, por ejemplo, la raz cuadrada de 30 ( nmero de artculos) es mayor que cinco, por lo que se seleccionan seis clases.PASO 3 Establecer la longitud de clase: es igual al rango entre el nmero de clases.

PASO 4Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relacin al resultado del PASO 2 en intervalos iguales.PASO 5 Graficar el histograma: se hace un grfico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectngulos se obtiene el polgono de frecuencias. Ejempl o : A una fabrica de envases de vidrio, un cliente le est exigiendo que la capacidad de cierto tipo de botella sea de13 ml, con una tolerancia de ms menos 1 ml. La fbrica establece un programa de mejora de calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente.

Ejempl os de otros ti pos de representaci ones grfi cas:Hay histogramas donde se agrupan los datos en clases, y se cuenta cuntas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases estn definidas de modo natural, p.e sexo con dos clases: mujer, varn o grupo sanguneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definirlas explcitamente (intervalos de clase).

Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical). A veces es ms til representar las frecuencias acumuladas.

O representar simultneamente los histogramas de una variable en dos situaciones distintas.

Otra forma muy frecuente, de representar dos histogramas de la misma variable en dos situaciones distintas.

Otra forma

En las variables cuantitativas o en las cualitativas ordinales se pueden representar polgonos de frecuencia en lugar de histogramas, cuando se representa la frecuencia acumulativa, se denomina ojiva. Un histograma es un diagrama de barras que se utiliza para representar una distribucin de frecuencias agrupadas de datos cuantitativos. Un histograma debe tener: o Un ttulo para identificar la poblacin de donde salen los datos. o El eje horizontal en donde se colocan los valores de las clases. o El eje vertical en donde se representa el nmero de datos en cada una de las clases. Tambin se puede utilizar la frecuencia relativa para hacer el histograma.1.2.7Histograma de frecuencia relativa.1.3 Medidas de tendencia central.Al describir gruposdeobservaciones, confrecuenciasedeseadescribir el grupo con un solo nmero. Para tal fin, desde luego, no se usar el valor mas elevadoni el valor mas pequeocomonicorepresentante, yaquesolo representan los extremos. mas bien que valores tpicos. Entonces sera mas adecuado buscar un valor central.Lasmedidasquedescribenunvalor tpicoenungrupodeobservaciones suelen llamarse medidas de tendencia central..Es importante tener en cuenta queestas medidas seaplicanagrupos mas bienqueaindividuos. un promedio es una caracterstica de grupo, no individual.Medidas de Tendencia CentralMedia aritmtica Suma de los valores de una serie de medidas respecto del nmero de valores existentes. Su clculo equivale a xi/n, siendo n el tamao de la muestra y xi cada uno de los valores.Mediana Valor que queda en el centro tras la divisin de una serie de valores ordenados en dos partes iguales, una superior y una inferior. Para determinarla debe seguirse los siguientes pasos: -ordenar los datos de menor a mayor-si el nmero de datos es impar corresponde al que queda en el centro-si el nmero de datos es par corresponde al valor medio de los dos datos centralesModa Valor que se presenta con ms frecuencia en una serie de mediciones.1.3.1 Media aritmtica, geomtrica y ponderada.Media aritmticaLa medida de tendencia central ms obvia que se puede elegir, es el simple promedio de las observaciones del grupo, es decir el valor obtenido sumando las observaciones y dividiendo esta suma por el nmero de observaciones que hay en el grupo.En realidadhay muchas clases depromedios y sta selallama media aritmtica para denotar la suma de un grupo de observaciones dividida por su nmero.*************************************************************************************************************************Media aritmtica Llamando xl, ..., xk a los datos distintos de un carcter en estudio, o las marcas de clase de los intervalos en los que se han agrupado dichos datos,y ni,..., nka las correspondientes frecuencias absolutas de dichos valores o marcas de clase, llamaremos media aritmtica de la distribucin de frecuencias a en donde n es la frecuencia total. Ejemplo 1: La media aritmtica de las veinticinco familias encuestadas ser: es decir, las familias encuestadas tienen un nmero medio de hijos de 1'68. Ejemplo 2: Se midieron los niveles de colinesterasa en un recuento de eritrocitos en mol/min/ml de 34 agricultores expuestos a insecticidas agrcolas, obtenindose los siguientes datos: Individuo Nivel Individuo Nivel Individuo Nivel1 10,61312,22511,8 2 12,51410,82612,7 311,11516,52711,4 4 9,21615,0289,3 5 11,51710,3298,6 6 9,91812,4308,5 7 11,9199,13110,1 8 11,6207,83212,4 9 14,92111,33311,1 10 12,52212,33410,2 11 12,5239,7 12 12,32412,0 La distribucin de frecuencias las marcas de clase ser: Intervalo Ii7'5-9 9-10'5 10'5-12 12-13'5 13'5-15 15-16'5Marca de Clase xi8'25 9'75 11'25 12'75 14'25 15'75Frecuenciani38101012?ni=25 la cual proporciona una media aritmtica de MEDIA ARITMETICA. Es la medida de tendencia central ms utilizada en estadstica y es la que se conoce como el promedio de las observaciones, sin embargo, debido a la confusin que hay con el trmino promedio. La media es el valor correspondiente a una lnea imaginaria que compensa los valores que se exceden de la media y los que quedan por debajo de sta; de esta manera, la media es mayor que el valor ms pequeo, y menor que el valor ms grande. Cuando se dispone de datos no agrupados, la media se puede calcular con precisin al sumar todos los valores observados y dividir el total entre el nmero de observaciones. Si las utilidades anuales de cinco empresas (en millones de dlares) fueron 2, 2, 4, 7 y 15, la media aritmtica sera igual a: 2 + 2 + 4 + 7 + 1530 -------------------- = ---- = 6 5 5Este nmero (6) sera la media poblacional si el sistema de inters contuviera slo cinco empresas, por ejemplo, un sistema de inters son todos los fabricantes de aviones en los Estados Unidos o todos los fabricantes de cerveza en Detroit. Sera una media muestral si se refiere slo a cinco empresas de entre un grupo de inters mucho mayor, como cinco entre docenas de fabricantes de aviones en el mundo o cinco entre cientos de cerveceras en los Estados Unidos. El procedimiento anterior se resume como: Para una poblacin: Para una muestra: en dondees la suma de todos los valores de la poblacin (o muestra) observados, N es el nmero de observaciones en la poblacin y n es el de observaciones en la muestra. Propiedades de la media aritmtica 1. La suma de las desviaciones o diferencias de cada valor respecto a la media es igual a cero. 2. La suma de los cuadrados de las desviaciones de cada valor respecto a la media es un valor mnimo. 3. La media puede utilizarse para determinar el valor total de la poblacin. (Nmero de elementos) * (Media) = Total de la poblacin 4. La media se afecta sustancialmente hacia arriba o hacia abajo con la presencia de valores extremos (muy grandes o muy pequeos) respecto a la media. EJEMPLO Mediante el uso de la tabla 3.1, calcule la media aritmtica de las utilidades ganadas por las 100 multinacionales ms grandes con oficinas en los Estados Unidos. Tabla 3.1 SOLUCION= (78 662 / 100) = 782.62 millones de dlares La solucin se puede encontrar por clculo manual o, mucho ms rpidamente, por computadora despus de que los datos de la tabla 3.2 se le hayan introducido. Media geomtricaLa media geomtrica de un conjunto de observaciones es la raz n sima de su producto. El clculo de la media geomtrica exige que todas las observaciones sean positivas.MEDIA GEOMETRICA. Esta es una medida que puede aplicarse al crecimiento exponencial o inters compuesto, pues obtiene la raz ensima de un grupo de n datos multiplicados entre s, por ejemplo, la raz cbica del producto de 3 datos, o la raz octava del producto de 8 datos. El resultado obtenido, al elevarse a la potencia ensima, produce el producto de todos los datos multiplicados entre s. Para una poblacin: Para una muestra: Caractersticas de la media geomtrica: 1. El clculo de la media geomtrica est basado en todos los elementos de un conjuntos de datos. El valor de cada elemento de dicho conjunto afecta as el valor de la media geomtrica. 2. Si uno de los valores es cero, el valor de G es cero. 3. Si uno de los valores es negativo y el nmero de datos es par, el valor de G es imaginario y no tiene interpretacin. Si uno de los valores es negativo y el nmero de datos es impar, aunque G existe, su valor no es representativo. 4. La media geomtrica es afectada por valores extremos en una menor cantidad que lo es la media aritmtica. Por ejemplo, la media geomtrica de los valores 1, 4 y 16 es 4, mientras que la media aritmtica de los mismos valores es 7. El valor 7 es ms cercano al valor alto 16 que el valor 4 lo es de 16. El valor de G es siempre menor que el valor de la media de los mismos datos, excepto cuando todos los valores en una serie son iguales, tales como la media geomtrica y la media aritmtica para los valores 4, 4 y 4 que son ambas 4. 5. La media geomtrica da igual ponderacin a las tasas de cambio iguales. En otras palabras, al promediar tasas de cambio geomtricamente, la tasa que muestra el doble de su base es compensada por la otra que muestra la mitad de su base; la tasa que muestra un quinto de su base; y as sucesivamente. Las tasas de cambio son ordinariamente expresadas en porcentajes. Puesto que la base de cada proporcin expresada en porciento es siempre igual a 100%, el promedio de dos proporciones las cuales se compensan deber ser 100% tambin. 6. La media geomtrica de las proporciones de los valores individuales con respecto a cada valor precedente en una secuencia de valores es la nica medida de tendencia central apropiada para las proporciones. La media aritmtica de las proporciones no dar un resultado consistente. EJEMPLO Las ventas mensuales de una tienda por departamentos y las proporciones de las ventas mensuales a la ventas en cada mes previo de Enero a Mayo, estn dadas en la tabla siguiente: Tabla 3.3Calcule la media geomtrica as como la media aritmtica de las tasas y comprelas. SOLUCION La media geomtrica de las tasas es 1.20 120% y la media aritmtica es 1.305 130.5%. Comparacin de las ventas calculadas mediante la media aritmtica y la media geomtrica: Tabla 3.4Media armnicaEs el inverso de la media aritmtica de los inversos de las observaciones.MEDIA ARMONICA. La media armnica (H) de n observaciones X1, X2, ... , Xn es el inverso (multiplicativo) de la media aritmtica de los inversos de las observaciones. Para la poblacin: Para la muestra: Caractersticas de la media armnica: 1. La media armnica como la media aritmtica y la geomtrica, se calcula usando todos los elementos en un conjunto de valores. El valor de cada elemento en todos los datos afecta, por lo tanto, el valor de la media armnica. Sin embargo, la media armnica es aun menos afectada por valores extremos que la media geomtrica. La magnitud relativa de las tres diferentes medias para los mismos datos puede ser expresada como sigue: 2. La media armnica no es tan frecuentemente usada como una medida de tendencia central de un conjunto de datos como es la media aritmtica. Sin embargo, es til en caos especiales para promediar velocidades. La razn de cambio usualmente indica la relacin entre dos tipos diferentes de unidades de medida que pueden ser expresadas recprocamente. Por ejemplo si una persona camin 10 millas en 2 horas, la razn de su velocidad de caminar puede ser expresada: 3. 10 millas4. ------------ = 5 millas/hora5. 2 horas6. reciprocamente, 7. 2 horas8. ----------- = 1/5horas/milla9. 10 millas10. La media armnica deber usarse cuando un valor constante, el cual tiene la misma unidad que el numerador ( millas) de cada razn dada, es igualmente aplicable a cada elemento en los datos. EJEMPLO Si un automvil recorre las primeras 10 millas a 30 mph y las segundas a 60 mph, a primera vista pareciera que la velocidad promedio de 30 y 60 es de 45 mph. Pero este tipo de media se suele definir en Fsica como la distancia total recorrida divida entre el tiempo total empleado en recorrerla, y como la distancia total es de 20 millas y el tiempo total es 1/3 + 1/6 de hora, se tiene que la velocidad media es: vel = 20 / ( 1/3 + 1/6 ) = 40 mph Es interesante observar que esta media se puede calcular como una media armnica de 30 y 60, es to es: H = 2 / ( 1 / 30 + 1 / 60 ) = 40 mph.Media ponderadaEnciertascircunstanciasnotodaslasobservacionestienenigual peso. En general si se tienen observaciones con sus respectivos pesos es:MEDIA PONDERADA. La media o promedio simple es la medida de tendencia central ms utilizada; sin embargo, cuando algunos de los valores por promediar son ms importantes que otros, por ejemplo, al evaluar a un empleado, su calificacin en conocimientos, puntualidad, presentacin y otros conceptos tiene una importancia relativa diferente en funcin a quin, hace la evolucin. Tal vez no sea lo mismo un empleado con 10 en conocimientos, 10 en puntualidad y 7 en presentacin (promedio = 9), que otro con 10 en conocimientos, 7 en puntualidad y 10 en presentacin (promedio = 9). Cuando los valores por promediar tienen diferentes grados de importancia entre s, debe utilizarse el promedio ponderado, el cual aplica un factor de ponderacin (o importancia relativa) a cada uno de los valores que se van a promediar. Para una poblacin: Para una muestra: dondees la suma de todos los pesos (w) multiplicada por los valores observados (X), en tanto quees igual a N (el nmero de observaciones de la poblacin) o n (e nmero de observaciones de la muestra). EJEMPLO En una empresa dada, el sueldo por hora es de 5 dlares para 100 trabajadores, de 10 dlares para 50 trabajadores y de 15 dlares para diez trabajadores. Cul es el sueldo promedio? SOLUCION = ((100*5) + (50*10) + (10*15)) / (100 + 50 + 10) = 7.19El resultado dista mucho del sueldo por hora promedio no ponderado de 10 dlares. 1.3.2Mediana.Otra medida de tendencia central que se utiliza con mucha frecuencia es la mediana, que es el valor situado en medio en un conjunto de observaciones ordenadas por magnitud.La medianaLa mediana (Md) es una medida de posicin que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuentapor cientoqueesmenor oigual queella. Es por lotanto, un parmetroqueestaenel mediodel ordenamientooarreglodelosdatos organizados, entonces, la mediana divide la distribucin en una forma tal que a cada lado de la misma queda un nmero igual de datos.Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los datos en una forma creciente o decreciente y luego se ubicalaposicinqueestaocupaenesaseriededatos; paraellohayque determinar si la serie de datos es par o impar, luego el nmero que se obtiene indica el lugar o posicin que ocupa la mediana en la serie de valores, luego la mediana ser el nmero que ocupe el lugar de lo posicin encontrada. MedianaLa mediana es otra medida de posicin, la cual se define como aquel valor de la variable tal que, supuestos ordenados los valores de sta en orden creciente, la mitad son menores o iguales y la otra mitad mayores o iguales As, si en la siguiente distribucin de frecuencias, xiniNi0 3 31 2 52 2 77ordenamos los valores en orden creciente, 0 0 0 1 1 2 2el 1 ser el valor que cumple la definicin de mediana. Lgicamente, en cuanto el valor de la frecuencia total sea ligeramente mayor, este procedimiento resulta inviable. Por esta razn, daremos a continuacin una frmula que permita calcularla. No obstante, ser necesario distinguir los casos en los que los datos vengan agrupados de aquellos en los que vengan sin agrupar. Datos sin agrupar: Las grficas siguientes, correspondientes a un diagrama de frecuencias absolutas acumuladas, recogen las dos situaciones que se pueden presentar: Si la situacin es como la de la figura de la derecha, es decir, si Si la situacin que se presenta es como la de la figura de la izquierda, entonces la mediana queda indeterminada, aunque en este caso se toma como mediana la media aritmtica de los dos valores entre los que se produce la indeterminacin; as pues, si Nj-1 = n/2 < Njentonces la mediana es Ejemplo 1: La distribucin de frecuencias acumuladas del ejemplo del nmero de hijos era N de hijos(xi) 01234 Frecuencias Acumuladas(Ni) 511 19 23 25y como es n/2=12'5 y en consecuencia 11 < 12'5 < 19la mediana ser Me= 2. Datos Agrupados Las grficas siguientes, correspondientes a polgonos de frecuencias absolutas acumuladas, nos plantea de nuevo dos situaciones diferentes a considerar: El ms sencillo, el de la derecha, en el que existe una frecuencia absoluta acumulada Nj tal que n/2 = Nj, la mediana es Me = xj. Si la situacin es como la que se representa en la figura de la izquierda, en la que Nj-l < n/2 < Njentonces, la mediana, est en el intervalo [xj-1, xj), es decir entre xj-1 y xj, tomndose en ese caso, por razonamientos de proporcionalidad, como mediana el valor siendo cj la amplitud del intervalo [xj-1, xj). Ejemplo: La distribucin de frecuencias del ejemplo de los niveles de colinesterasa es: Intervalo Ii7'5-9 9-10'5 10'5-12 12-13'5 13'5-15 15-16'5Frecuenciani38101012 Frecuencia Acumulada Ni31121313234 Al ser n/2 = 17 y estar 11 < 17 < 21la mediana estar en el intervalo [10'5 , 12), y aplicando la frmula anterior, ser MEDIANA. Es valor del elemento de la posicin central de los datos individuales, ordenados de mayor a menor (o viceversa), y es el punto que marca la mitad de valores mayores que l, es decir, est a la mitad, con el 50% de valores a su derecha y el 50% de valores a su izquierda. Es la medida de tendencia central ms utilizada en estadstica y es la que se conoce como el promedio de las observaciones, sin embargo, debido a la confusin que hay con el trmino promedio. Para calcular la mediana: Ordene los datos, de mayor a menor o viceversa. Calcule la posicin de la mediana: n + 1 N + 1 Pisicin de la mediana = ------- = ------- 2 2 Determine el elemento de la posicin central, que es finalmente la mediana. (Si el nmero de datos es par, deber obtener el promedio del valor de los dos elementos centrales.) Caractersticas bsicas de la mediana 1. El valor de la mediana se afecta por el nmero de datos, no por la magnitud de ningn valor extremo. 2. Es igualmente probable que cualquier observacin escogida al azar sea mayor o menor que la mediana. 3. Se puede determinar, incluso en distribuciones con intervalos abiertos. 4. La suma de los cuadrados de las desviaciones respecto a la mediana es un valor mnimo. En los casos en que los datos contengan valores extremos, y considerando la cuarta propiedad de la media, es mejor utilizar la mediana en lugar de la media como medida de tendencia central. EJEMPLO Use los datos de la tabla 3.2 para calcular la utilidad mediana obtenida por las cien multinacionales ms grandes de los Estados Unidos. Tabla 3.2 SOLUCION El arreglo ordenado tiene un par de observaciones. En consecuencia, hay dos valores centrales de 532 y 535 millones de dlares. La mediana es la media aritmtica, es decir, (532 millones + 535 millones) / 2 = 533.3 millones de dlaresque es un nmero muy distinto de la media aritmtica de todas las cifras 1.3.3 Moda.Otra medida de tendencia central es la moda. La moda es el valor que ocurre con mas frecuencia en un conjunto de observaciones.La modaLa moda es la medida de posicin que indica la magnitud del valor que se presenta con ms frecuencia en una serie de datos; es pues, el valor de la variable que ms se repite en un conjunto de datos. De las medias de posicin la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observacin de los datos en estudio, puesto que la moda es el dato que se observa con mayor frecuencia. La moda se designa con las letras Mo.Moda La moda se define como aquel valor de la variable al que corresponde mxima frecuencia (absoluta o relativa). Para calcularla, tambin ser necesario distinguir si los datos estn o no agrupados. Datos sin agrupar: Para datos sin agrupar, la determinacin del valor o valores (ya que puede haber ms de uno) modales es muy sencilla. Basta observar a que valor le corresponde una mayor ni. Ese ser la moda. As en el ejemplo del nmero de hijos, la simple inspeccin de la tabla siguiente proporciona como valor para la moda el Md = 2. N de hijos(xi) 01234 N de familias(ni) 56 8 4 2 ?ni=25 Datos agrupados: Si los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si stos tienen o no igual amplitud. Si tienen amplitud constante c, una vez identificado el intervalo modal [xj-1, xj), es decir el intervalo al que corresponde mayor frecuencia absoluta nj = max{nl, ..., nk}, la moda se define, tambin por razones geomtricas, como Ejemplo: Este ejemplo presenta un caso de distribucin bimodal, ya que tanto el intervalo [10'5 - 12) como el [12 - 13'5) tienen frecuencia absoluta mxima. Deberamos aplicar, por tanto, para cada uno de los dos intervalos la frmula anterior, determinando as las dos modas de la distribucin. No obstante, este ejemplo presenta adems la peculiaridad adicional de ser ambos intervalos modales contiguos. En esta situacin se considera la distribucin unimodal, eligiendo como moda el extremo comn, Md = 12. Si los intervalos tuvieran distinta amplitud cj, primeros debemos normalizar las frecuencias absolutas nj, determinando los cocientes y luego aplicar la regla definida para el caso de intervalos de amplitud constante a los lj. Es decir, primero calcular el lj = max{l1,...., lk} para determinar el intervalo modal [xj-1, xj) y luego aplicar la frmula siendo cj la amplitud del intervalo modal [xj-1, xj). Ejemplo: Las frecuencias normalizadas correspondientes al ejemplo de intervalos con distinta amplitud sern, Iinili0-20 80'4 20-3090'9 30-40121'2 40-45102 45-5091'8 50-60101 60-8080'4 80-10040'2 con lo que el intervalo modal es el [40 - 45) y la moda A diferencia de lo que ocurre con la media o con la mediana, s es posible determinar la moda en el caso de datos cualitativos. As, en el ejemplo del tratamiento de radiacin seguido de ciruga puede afirmarse que la causa modal por la que no fue completado el tratamiento es Md = rehusaron ciruga.MODA. La moda es el valor ms frecuente de un conjunto de datos en ocasiones se presentan dos o ms valores que se repiten con mayor frecuencia. En este caso, a los datos se les conoce como bimodales o multimodales, respectivamente. La moda es la nica medida de tendencia central que se puede aplicar a datos del tipo cualitativo, por ejemplo: analizar el color de ojos (caf, negro, azul) de una poblacin. Es muy fcil de determinar, basta con observar detenidamente al conjunto de datos y ver cul es el que ms se repite; sin embargo, no es muy til por que puede ocurrir que una distribucin tenga dos o ms valores que se repitan con la misma frecuencia, en tal caso se tienen dos o mas modas. Tambin puede ocurrir que no exista ningn valor que se repita y entonces no habr moda. Por otra parte puede ser un valor extremo el de mayor frecuencia y difcilmente podra ser considerado una medida de tendencia central. En la prctica, la moda raras veces se usa para describir datos no agrupados, es mucho ms frecuente su designacin para datos agrupados. 1.4 Medidas de dispersin.La dispersin puede medirse en trminos de la diferencia entre dos valores seleccionados del conjunto de datos. Las medidas de distancia son: el alcance, el alcance interfractil y el alcance intercuartil.Alcance.Es la diferencia entre el ms alto y el ms pequeo de los valores observados.Alcance = valor de la observacin ms alta valor de la observacin ms pequeaEl alcance es fcil de entender y de encontrar, pero su utilidad como medida de dispersin es limitada. Slo toma en cuenta los valores ms alto y ms bajo de una distribucin y no considera ninguna otra observacin del conjunto de datos. Ignora la naturaleza de la variacin entre todas las dems observaciones, y se ve muy influido por los valores extremos.Las distribuciones de extremo abierto no tienen alcance, pues no existe un valor ms alto o ms bajo en la clase de extremo abierto.Alcance interfractil.En una distribucin de frecuencias, una fraccin o proporcin dada de los datos cae en un fractil o por debajo de ste. La mediana, por ejemplo, es el fractil 0,5, puesto que la mitad de los datos es menor o igual a este valor. Los fractiles son parecidos a los porcentajes. En una distribucin cualquiera, el 25% de los datos est en el fractil 0,25 o por debajo de ste; igualmente, 25% de los datos cae en el vigsimo quinto percentil o por debajo de ste. El alcance interfractil es una medida de la dispersin entre dos fractiles de una distribucin de frecuencias, es decir, la diferencia entre los valores de los dos fractiles.Los fractiles tienen nombres especiales, dependiendo del nmero de partes iguales en que se dividen los datos. Los fractiles que los dividen en 10 partes iguales se conocen como deciles. Los cuartiles dividen los datos en cuatro partes iguales. Los percentiles dividen el conjunto de datos en 100 partes iguales.Alcance intercuartil.El alcance intercuartil mide aproximadamente qu tan lejos de la mediana tenemos que ir en cualquiera de las dos direcciones antes de que podamos recorrer una mitad de los valores del conjunto de datos. Para calcular este alcance, dividimos nuestros datos en cuatro partes, cada una de las cuales contiene 25% de los elementos de la distribucin. Los cuartiles son, entonces, los valores ms alto y ms bajo de estas cuatro partes, y el alcance intercuartil es la diferencia entre los valores del primer cuartil y el tercer cuartil.SUGERENCIAEl punto fractil es siempre el punto en el o debajo del cual cae la proporcin establecida de valores.Medidas de DispersinAmplitud Diferencia entre los valores mayor y menor de un conjunto de datos obtenidos en una medicin.Coeficiente de variacinEquivale a la desviacin tpica expresada en porcentaje respecto de la media aritmtica. Es la desviacin tpica partido por la media aritmtica.Desviacin estandar Medida de la dispersin de una distribucin de frecuencias respecto de su media. Equivale a la raiz cuadrada de la varianza. Se expresa como si corresponde a la poblacin total o como s si corresponde a una muestra de la poblacinRango Medida equivalente a la amplitudValor Z Medida del nmero de desviaciones estandar que un valor se aleja de la media Z= (xi - X) / s o Z= (xi - ) / Varianza Medida de la variacin de una serie de observaciones respecto de la media. Equivale a la dispersin respecto de la media en una serie de datos continuos. Su clculo corresponde a: (xi- )2/n si corresponde a la poblacin total o (xi- X)2/(n-1) si corresponde a una muestra de esa poblacin, siendo o X la media, n el tamao de la poblacin o de la muestra y xi cada uno de los valores.1.4.1 Varianza.Existeotromecanismoparasolucionarel efectodecancelacinparaentre diferenciaspositivasynegativas. Si elevamosal cuadradocadadiferencia antes de sumar, desaparece la cancelacin:Esta frmula tiene una desventaja, y es que sus unidades no son las mismas que las de las observaciones, ya que son unidades cuadradas.Esta dificultad se soluciona, tomando la raz cuadrada de la ecuacin anterior:VarianzaEs otra de las variaciones absolutas y la misma se define como el cuadrado de la desviacin tpica; viene expresada con las mismas letras de la desviacin tpica pero elevadas al cuadrado, as S2 y s2. Las formulas para calcular la varianza son las mismas utilizadas por la desviacin tpica, exceptuando las respectivas races, las cuales desaparecen al estar elevados el primer miembro al cuadrado.Varianza Denotando por x1,...,xk los datos o las marcas de clase, llamaremos varianza a siendo a la media de la distribucin. As en el ejemplo del nmero de hijos la varianza es s2 = 4'24 - (1'68)2 = 1'4176. y en ejemplo de los niveles de colinesterasa s2 = 133'97 - (11'426)2 = 3'42. Al valor se le denomina cuasivarzanza. VARIANZA. Una medida de dispersin mucho ms comn, que se calcula al promediar los cuadrados de las desviaciones individuales a partir de la media, es la media de desviaciones cuadrticas o la varianza. La varianza es una medida de dispersin promedia de un conjunto de datos. Para una poblacin se construye al tomar la diferencia entre cada valor observado y la media poblacional, elevando al cuadrado cada una de estas desviaciones y luego hallando la media aritmtica de los valores cuadrados. Para una muestra, una expresin casi anloga se construye con la ayuda de su media. Para una poblacin Para una muestra EJEMPLO Calcule la varianza para una poblacin de N = 5 valores: 2, 2, 4, 7 y 15. SOLUCION Vease la tabla 3.5 que muestra la forma en que la varianza se calcula para datos poblacionales, procedimiento por dems tedioso cuando el numero de observaciones es grande. Los programas modernos para computadora efectan con suma rapidez este tipo de operacin. Tabla 3.5PROBLEMAS PRACTICOS Por desgracia hay dos problemas prcticos relacionados con el uso de concepto de varianza. Primero la varianza tiende a ser un nmero grande en comparacin con las observaciones cuya dispersin haya de describirse. Cuando las observaciones originales son iguales a unos pocos miles de millones, su varianza puede ser igual a muchos cientos de miles de millones. En segundo trmino, y ms grave es que la varianza , siendo un nmero elevado al cuadrado no se expresa en las mismas unidades que los valores observados en s. Pero tambin hay buenas noticias: ambas dificultades conceptuales se pueden vencer de un solo golpe al trabajar con la raz cuadrada de la varianza, concepto el cual vemos en seguida. 1.4.2 Desviacin estndar.VARIANZAY DESVIACIN ESTNDARLa varianza se asemeja a la desviacin media absoluta en que se basa en la diferencia entre cada valor del conjunto de datos y la media del grupo. Pero se distingue de ella en un muy importante aspecto: cada diferencia se eleva al cuadrado antes de sumarse. En el caso de una poblacin, la varianza se representa con V(X) o, ms habitualmente, con la letra griega minscula o2 ("sigma cuadrada"). La frmula esA diferencia de lo que ocurre con las dems estadsticas muestrales ya expuestas, la varianza deunamuestra no equivale exactamente, en trminos declculo, a la varianza de una poblacin. El denominador de la frmula de la varianza muestral es un tanto distinto. En esencia, en esta frmula se incluye un factor de correccin, a fin de que la varianza muestral sea un estimador insesgado de la varianza de la poblacin. La varianza muestral es representada por s2; su frmula esEngeneral, esdifcil interpretar el significadodel valor deunavarianza, porquelas unidades en las que se le expresa son valores elevados al cuadrado. Debido en parte a esta razn, es ms frecuente el uso de la raz cuadrada de la varianza, representada por la letra griega a (o por s en el caso de una muestra) y llamada desviacin estndar. Las frmulas son:Desviacin estndar de la poblacin:Desviacin estndar de la muestra:La desviacin estndar es particularmente til en conjuncin con la as llamada distribucin normal.EJEMPLO En relacin con los datos de ventas de equipo de aire acondicionado dados enel ejemploanterior, lamediaaritmticaes10.5unidades (vaseseccin2.2). Considerandoestos datos deventas mensuales comolapoblacinestadsticade inters, la desviacin estndar se determina como sigue, de acuerdo con los clculos de la tabla 3.2:Tabla 3.2 Hoja de trabajo para el clculo de la desviacin estndar de la poblacin de los datos d