libro dr nerys funes estadística

206
1 ANÁLISIS EXPLORATORIO DE DATOS Y PROBABILIDAD E INFERENCIA ESTADISTICA Dr. José Nerys funes Torres Lic. René Armando Peña Aguilar Facultad de Ciencias Naturales y Matemática Escuela de Matemática Departamento de Estadística Universidad de El Salvador Septiembre de 2010.

Upload: herberson-salazar

Post on 17-Nov-2015

80 views

Category:

Documents


18 download

DESCRIPTION

Teoría estadística del Dr. Nery Funes un gran maldito en esto de la estadística lol

TRANSCRIPT

  • 1

    ANLISIS EXPLORATORIO DE DATOS Y

    PROBABILIDAD E INFERENCIA ESTADISTICA

    Dr. Jos Nerys funes Torres

    Lic. Ren Armando Pea Aguilar

    Facultad de Ciencias Naturales y Matemtica

    Escuela de Matemtica

    Departamento de Estadstica

    Universidad de El Salvador

    Septiembre de 2010.

  • 2

    ndice general.

    Introduccin. ............................................................................................................................ 5

    Captulo 1. Conceptos Bsicos de Estadstica. ................................................... 6

    1.1. La Estadstica y sus aplicaciones ............................................................................................. 6 1.1.1. Qu es la Estadstica? ...................................................................................................... 6

    1.1.2. Aplicaciones de la Estadstica. .......................................................................................... 6 1.2. Poblacin, Muestra y tcnicas de muestreo. .......................................................................... 10 1.3. Unidad de estudio y unidad de muestreo ............................................................................... 13 1.4. Variables y datos .................................................................................................................... 14 1.5. Escalas de medicin .............................................................................................................. 15

    1.5.1. Escalas nominales ........................................................................................................... 15

    1.5.2. Escalas ordinales ............................................................................................................. 16

    1.5.3. Escalas de intervalos ....................................................................................................... 16 1.5.4. Escalas de razones o cocientes ........................................................................................ 17

    1.6. Diseo de Experimentos estadsticos. .................................................................................... 18 1.7. Gua de ejercicios N 1........................................................................................................... 18

    Captulo 2. Distribuciones de frecuencias y sus representaciones

    grficas ..................................................................................................................................... 20

    2.1. Estadstica Descriptiva con una variable ............................................................................... 20

    2.1.1. Distribucin de frecuencias ............................................................................................. 20 2.1.2. Descripcin de Variables Cualitativas ............................................................................ 21 2.1.3. Variables cuantitativas discretas. .................................................................................... 29

    2.2. Distribucin de frecuencias agrupadas. .................................................................................. 30

    2.2.1 Representacin grfica de variables continuas ................................................................ 32 2.3. Gua de ejercicios N 2........................................................................................................... 33

    Captulo 3. Medidas Caractersticas de una Distribucin Cuantitativa

    Emprica. ................................................................................................................................... 35

    3.1 Medidas de posicin ........................................................................................................... 35 3.2 Medidas de Dispersin ....................................................................................................... 42 3.3 Medidas de forma ............................................................................................................... 43

    3.4. Gua de Ejercicios N 3. ......................................................................................................... 44

    Captulo 4. Distribuciones Bivariadas ...................................................................... 73

    4.1. Distribuciones bidimensionales ............................................................................................. 73 4.2. Distribuciones marginales y condicionales. ........................................................................... 74 4.3. Coeficiente de correlacin lineal ............................................................................................ 77 4.4. Introduccin al modelos de regresin lineal .......................................................................... 77

    4.5. Modelo de regresin simple. ................................................................................................. 82 4.5.1. Estimacin de los parmetros por mnimos cuadrados ................................................... 82 4.5.2. Propiedades de los estimadores por mnimos cuadrados y el modelo ajustado de

    regresin. ................................................................................................................................... 84 4.5.3. Intervalos de confianza ................................................................................................... 86

  • 3

    4.5.4. Prueba de hiptesis de la pendiente y de la ordenada al origen. ..................................... 88

    4.6. Prediccin de nuevas observaciones ...................................................................................... 89

    4.7. Ejercicios. ............................................................................................................................... 98

    Captulo 5. Los Valores Relativos ............................................................................ 101

    5.1. Razones, Proporciones, Porcentajes y Tasas. ....................................................................... 101 5.2. Diferencia Relativa ............................................................................................................... 103

    5.3. Los nmeros ndices ............................................................................................................. 104 5.3.1. Relacin entre ndices de base fija y variable. .............................................................. 106 5.3.2. ndices agregativos simples ........................................................................................... 107 5.3.3. ndices de precios .......................................................................................................... 108 5.3.4. ndices de cantidad. ....................................................................................................... 109

    5.3.5. Clculo del salario e ingreso real. ................................................................................. 111

    5.4. Gua de ejercicios N 5. ........................................................................................................ 112

    Captulo 6. Mtodos de Conteo. ............................................................................... 114

    6.1 Introduccin .......................................................................................................................... 114 6.2 Muestras ordenadas. .............................................................................................................. 114

    6.3 Variaciones, combinaciones y permutaciones. ..................................................................... 116 6.3.1. Variaciones de N elementos tomados de n en n. ........................................................... 116

    6.3.2. Variaciones con repeticin de N elementos tomados de n en n. ................................... 116 6.3.3. Permutaciones. ............................................................................................................. 116 6.3.4. Combinaciones. ............................................................................................................. 118

    6.4. Teorema del Binomio. .......................................................................................................... 122 6.5. Gua de Ejercicios N 1. ...................................................................................................... 125

    6.6. Solucines. ........................................................................................................................... 126

    Captulo 7. Conceptos Bsicos de Probabilidad ............................................. 132

    7.1 Introduccin. ......................................................................................................................... 132

    7.2. Experimento aleatorio. ......................................................................................................... 132 7.3. Espacio Muestral. ................................................................................................................ 133

    7.4. Sucesos o Eventos ................................................................................................................ 133 7.4.1. Estructuras con subconjunto .......................................................................................... 134

    7.5. Axiomas de Probabilidad ..................................................................................................... 136 7.5.1. Probabilidad (Axiomtica). ........................................................................................... 136

    7.6. Resultado Igualmente Probables o Modelo Uniforme de Probabilidad ............................... 138

    7.7. Probabilidad condicional. .................................................................................................... 138

    7.8. Independencia de sucesos. ................................................................................................... 142 7.9. Ejercicios de clculo de probabilidad ................................................................................... 142

    7.9.1. Problemas variados de probabilidad ............................................................................. 147 7.9.2. Hoja 4. Ejercicios de probabilidad (Repaso, Captulo 6 y 7) ........................................ 153

    Captulo 8. Variables aleatorias y distribuciones de probabilidad ......... 155

    8.1. Nociones bsicas .................................................................................................................. 155 8.2. Distribucin de probabilidad binomial ................................................................................. 159 8.3. Distribucin de Poisson ........................................................................................................ 161

  • 4

    8.4. Distribucin geomtrica ....................................................................................................... 165

    8.5. Distribucin hipergeomtrica ............................................................................................... 166

    8.6. Densidad uniforme ............................................................................................................... 169 8.7. Densidad normal o de Gauss ................................................................................................ 172 8.8. Aproximacin de la binomial por medio de la normal ......................................................... 175 8.9. Ejercicios. ............................................................................................................................. 175

    Captulo 9. Estimacin de Parmetros. ................................................................. 178

    9.1. Distribucin de la medida de la muestra. ............................................................................. 178 9.2. Distribucin de la diferencia entre las medias de dos muestras. .......................................... 180 9.3. Distribucin de la proporcin de la muestra. ....................................................................... 184 9.4. Distribucin de la diferencia entre las proporciones de dos muestras. ................................ 186

    9.5. Intervalos de confianza ......................................................................................................... 188

    9.5.1. Seleccin del tamao de la muestra .............................................................................. 192

    Captulo 10. Contraste de hiptesis. ...................................................................... 198

    10.1.- Introduccin ...................................................................................................................... 198 10.2. Nociones bsicas ................................................................................................................ 198

    10.3. Procedimiento sistemtico para una prueba de hiptesis de una muestra. ......................... 199 10.4. Procedimiento sistemtico para una prueba de hiptesis de dos muestras independientes.202

    10.5. Prueba de hiptesis para una y dos proporcin independientes ........................................ 202

    Bibliografa ............................................................................................................................ 206

  • 5

    Introduccin.

    La estadstica como herramienta para el anlisis de los datos es esencial en los profesionales que

    con frecuencia tienen la necesidad de realizar anlisis de datos para la toma de decisiones.

    Este libro, recoge en 10 captulos conocimientos estadsticos bsicos que van desde el anlisis

    descriptivo de datos, probabilidad e inferencia estadstica.

    Debemos aclarar que los mtodos descriptivos aqu propuestos son elementales univariantes y en

    el enfoque de la probabilidad slo hemos considerado espacios probabilsticos discretos

    incluyendo dos continuas la uniforme y la normal.

    Este libro, es recomendables para principiantes en el rea de estadstica. Los conocimientos aqu

    planteados son base para ir enfrentando otros de estadstica de mayor dificultad.

  • 6

    Captulo 1. Conceptos Bsicos de Estadstica.

    1.1. La Estadstica y sus aplicaciones

    1.1.1. Qu es la Estadstica?

    La Estadstica es una ciencia que estudia las caractersticas de un conjunto de casos para hallar en

    ellos regularidades en el comportamiento, que sirven para describir el conjunto y para efectuar

    predicciones.

    La Estadstica tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos

    a un conjunto de objetos, personas, procesos, etc. A travs de la cuantificacin y el ordenamiento

    de los datos intenta explicar los fenmenos observados, por lo que resulta una herramienta de

    suma utilidad para la toma de decisiones.

    Bajo este contexto, la Estadstica se divide en dos reas: Estadstica Descriptiva y Estadstica

    Inferencial.

    ESTADSTICA DESCRIPTIVA: permite organizar y presentar un conjunto de datos de

    manera que describan en forma precisa las variables analizadas haciendo rpida su lectura e

    interpretacin. Obviamente, la materia prima de la Estadstica Descriptiva la constituyen los

    datos, que son el resultado de las observaciones y/o experimentos.

    Ejemplos:

    1. Durante los ltimos dos das se ha informado de un total de trece homicidios diarios. 2. La encuesta Gallup informa una ventaja de 25% para el candidato de izquierda.

    ESTADSTICA INFERENCIAL: Generaliza los resultados de una muestra a los de una poblacin total, es cuando de los datos estadsticos obtenidos de una muestra se infiere o se

    deduce una observacin la cual se generaliza sobre la poblacin en total. Para determinar la

    confiabilidad de la inferencia de los datos estadsticos de una muestra, se hace necesario

    comprobar la misma para poder asegurar que lo que se observa en una muestra se observar

    tambin en la poblacin. Generalmente el anlisis estadstico inferencial se lleva a cabo para

    mostrar relaciones de causa y efecto, as como para probar hiptesis y teoras cientficas.

    1.1.2. Aplicaciones de la Estadstica.

    Mucha gente piensa que la Estadstica no tiene nada que ver con otras disciplinas que no sean las

    ingenieras y economa. Otros nunca le encuentran aplicaciones tiles, y por eso tampoco les

    gusta. Pero, en realidad tiene infinitas aplicaciones en todo el conocimiento adquirido por la

    humanidad, partiendo ante todo, lo relacionado con las ingenieras, economa, las ciencias

    biolgicas, ciencias sociales e incluso en algunas ramas del rea Jurdica. Y, en definitiva, casi

    todos los campos de las ciencias emplean instrumentos estadsticos de importancia fundamental

    para el desarrollo de sus modelos de trabajo.

  • 7

    En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con

    exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y

    fsicos, entre otros, y sirven como herramienta para relacionar y analizar dichos datos. El trabajo

    del experto estadstico no consiste ya slo en reunir y tabular los datos, sino el proceso de

    interpretacin de esa informacin a travs de modelos estadsticos-matemticos, aumentando el

    alcance de las aplicaciones de la estadstica, esto se ha logrado, gracias al desarrollo de la teora

    de probabilidad.

    Dentro de las Aplicaciones de la Estadstica se destacan las siguientes:

    1. La Estadstica en el Periodismo

    En general, los periodistas adems de dedicarse al mbito de la noticia, realizan crnicas y

    estudios de investigacin, que nos entregan preguntas y respuestas frente a determinados sucesos

    o situaciones de inters pblico. Algunos de los estudios ms frecuentes realizados por los

    periodistas son sobre alcoholismo, enfermedades, sexualidad, delincuencia, poltica, etc. Para

    ello, hacen uso de las encuestas u otros instrumentos tcnicos de medicin propios de la

    estadstica, a travs de dichos estudios es posible conocer la opinin de la gente y con ello

    informar a la opinin pblica, a travs de los medios de comunicacin, desde donde las

    autoridades pertinentes e interesadas en estos estudios pueden adoptar las medidas correctivas, si

    es el caso. Tal es as, que la estadstica forma parte importante del periodismo investigativo.

    1. La Estadstica en la Poltica

    Conocidas son las famosas encuestas de tipo poltico, que entregan una orientacin de la

    intencin de voto, de la aceptacin de un candidato, del impacto de un programa o proyecto de

    estado, etc. de una muestra estadstica representativa, sobre la opinin de las personas en un

    tiempo determinado, teniendo esta herramienta una gran confiabilidad. As es que el uso de la

    estadstica es imprescindible para determinar caminos a seguir para los candidatos de eleccin

    popular.

    2. La Estadstica en la Publicidad

    Cuando las grandes marcas trasnacionales y/o nacionales como Coca-cola, Pepsi, Nice, Adidas,

    Laboratorios Lpez, etc. nos llenan de slogans, msica y colores en sus comerciales, lo nico que

    buscan es que la gente adquiera los productos y/o servicios que ofrecen.

    Se dedican, entonces, a realizar las llamadas campaas publicitarias, y, antes de lanzar una

    campaa, hacen un estudio de mercado para encontrar las mejores alternativas posibles a fin de

    lograr el xito de ventas deseado. Estos estudios son de carcter estadstico, es decir, hacen un

    diseo muestral y seleccionan una muestra para inferir las caractersticas de la poblacin.

    3. La Estadstica en la economa y las finanzas.

    En la administracin es una herramienta del control, como parte del proceso administrativo (o lo

    que es lo mismo: planeacin, organizacin, direccin y control) ya que la estadstica ayuda a

  • 8

    recolectar, estudiar y al final interpretar los datos que obtienen al terminar el proceso

    administrativo, retroalimenta con esta informacin y al final se observa en que pueden mejorar y

    que se est haciendo bien.

    En la mercadotecnia es una herramienta muy importante cuando tienes la necesidad de trabajar

    con datos de muestreo para conocer los gustos y preferencias de las personas. Igualmente en la

    auditoria administrativa cuando recabas datos para conocer en que puede mejorar una

    organizacin. En pocas palabras te puede servir en cualquier rea de una organizacin debido a

    que muestra los resultados de las actividades que bienes realizando.

    En la economa se utiliza como una herramienta de prediccin para pronosticar el

    comportamiento futuro, por ejemplo, de los precios de los metales (oro, plata, cobre) tomando

    como base el comportamiento pasado de los precios de los mismos. Tambin puede servir para

    estudiar el comportamiento de la bolsa de valores, de ciertos productos bsicos, los economistas

    por lo regular se sienten magos que creen predecir cosas. En general, la Estadstica suministra los

    valores que ayudan a descubrir interrelaciones entre mltiples parmetros macro y

    microeconmicos, a travs de la evaluacin de modelos economtricos para el establecimiento de

    polticas econmicas; anlisis del costo de la canasta bsica, el poder adquisitivo de la poblacin,

    etc.

    5. La estadstica en la Banca y Seguros

    El profesional del seguro de vida ha de ser capaz de asignar primas suficientes para cubrir las

    cantidades que habr de pagar la compaa en el caso de muerte del asegurado. En consecuencia,

    la prediccin adecuada de las probabilidades de muerte constituye uno de los ejes centrales de la

    reduccin del riesgo que se asume. Por ello, el objetivo de la Estadstica de Seguros es una

    presentacin exhaustiva de los mtodos disponibles para ajustar tablas de mortalidad y tablas de

    seguros no vida, ejemplo, aseguramiento de vehculos, viviendas, etc.

    Por otra parte, algunas de las aplicaciones concretas de la Estadstica en el sistema bancario son

    las siguientes:

    Sistemas de concesin de tarjetas de crdito y fijacin de su lmite.

    Sistemas de estimacin del potencial econmico de los clientes.

    Definicin de tipologas comerciales de clientes.

    Determinacin del pblico objetivo en campaas comerciales.

    Modelizacin del riesgo segn las caractersticas de los clientes.

    Aplicacin de la teora de colas para brindar un servicio de calidad.

    Finalmente, es de mucha utilidad la tcnica de minera de datos para el anlisis de bases de datos del sistema bancario.

    6. La estadstica en ciencias humanas y sociales

    La investigacin en Psicologa, Sociologa y Educacin, al igual que ocurre en otras ciencias, en

    buena medida se basa en el manejo de recursos estadsticos como elementos indispensables para

  • 9

    llegar a conclusiones aceptables por el resto de la comunidad cientfica. Dada la peculiaridad de

    su objeto de estudio, inabordable en la mayora de los casos sino es a travs de perspectivas

    complejas de relacin entre variables, la atencin de los investigadores en las ciencias humanas y

    sociales se concentra cada vez ms en la llamada Estadstica Multivariante (Anlisis Cluster,

    Factorial, Discriminante, etc.).

    Las ciencias sociales se han visto apabulladas en los ltimos aos por avances vertiginosos en

    informtica y aplicaciones estadsticas, por ejemplo, en El Salvador, se ha elaborado el Mapa de

    Pobreza, donde se ha interrelacionado una gran variedad de variables de diferentes reas:

    Educativas, Econmicas, Salud, entre otras. Tambin, se ha hecho investigacin sobre los

    factores que estn asociados al rendimiento acadmico de los estudiantes, finalmente, se han

    utilizado diferentes tcnicas para el anlisis de los resultados acadmicos de los estudiantes.

    Las ciencias sociales: es un pilar bsico del desarrollo de la demografa y la sociologa aplicada,

    lo que conlleva a:

    Definicin de indicadores de fenmenos sociales.

    Medicin de constructos o variables no directamente observables (la satisfaccin, la inteligencia, ...)

    Medicin de los efectos entre constructos no observables para establecer polticas sociales.

    Estudio de la evolucin de la demografa.

    Estudios sociales sobre la integracin de la poblacin inmigrada.

    Fenmenos sociales como las pandillas, criminalidad, delincuencia, contaminacin, entre otros.

    7. La estadstica en las ciencias qumicas.

    En Qumica, la estadstica se aplica en varias reas: En el diseo de experimentos se usan

    mtodos estadsticos, en el control de procesos y control de calidad (o gerenciamiento de calidad)

    de procesos y productos. En EEUU est muy de moda el sistema seis sigma, creado por general

    electric, que utiliza algunos conceptos estadsticos para lograr el aseguramiento de la calidad.

    Por otra parte la produccin qumica tiene su costo econmico y financiero que tambin requiere

    mucho uso de estadstica, por ejemplo, si no se elabora un buen diseo experimental, se

    necesitarn muchas rplicas para validar una formulacin qumica.

    Algunas de las aplicaciones concretas que podemos mencionar:

    Utilizacin de diseos experimentales para optimizar la composicin de productos alimenticios.

    Evaluacin de la superficie de respuesta de una reaccin qumica segn determinados factores.

    Prediccin del comportamiento de un componente no sintetizado a partir de las propiedades moleculares de sus descriptores.

    Control de procesos de produccin para detectar problemas evitando a su vez falsas alarmas.

  • 10

    8. La estadstica en Ciencias biolgicas.

    En el rea de las ciencias biolgicas, interesa estudiar el comportamiento de ciertas plantas y sus

    cruces a fin de determinar cmo se relacionan genticamente los padres con los hijos, hablando

    de Genotipo y Fenotipo. En esta categora es tambin donde se realizan los mayores avances de la

    humanidad, en descubrimientos. Cada ao se descubren miles de frmulas cientficas que

    relacionan fenmenos de la naturaleza con modelos matemticos.

    Los cientficos se dedican a realizar estudios estadsticos, recogiendo datos y muestras,

    investigando el tiempo de reproduccin de un virus, el comportamiento migratorio de algunas

    aves o insectos, adems de factores de tamao y volumen del crecimiento de ciertas especies de

    animales o vegetales. Todo esto funciona con la idea de recopilar informacin, muestrear ciertas

    reas para ver cmo se han comportado algunas aves, por ejemplo, se pueden dibujar o simular

    curvas que se supone que son relativamente parecidas al comportamiento migratorio de aves. Con

    esta herramienta se podran determinar tambin las pocas de mayor probabilidad de contagio,

    diseminacin de algn virus o bien enfermedades transmitidas por insectos.

    Algunas aplicaciones concretas en esta rea son: Determinacin del tamao de poblaciones

    naturales en una regin; efectividad de la utilizacin de barreras naturales (filas de rboles

    plantados en los lmites del terreno) como medio de prevenir las plagas de insectos o aves sobre

    las plantaciones y as disminuir la utilizacin de pesticidas: y, determinacin de los niveles

    ptimos de utilizacin de los fertilizantes. Obviamente, en esta rea es donde ms se hace usos de

    la teora de Diseos de Experimentos.

    9. La estadstica en las ciencias mdicas.

    Permite establecer pautas sobre la evolucin de las enfermedades y los enfermos, los ndices de

    mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etctera.

    Bajo este conjunto de ideas, se ha presentado un panorama de la utilidad de la estadstica,

    haciendo un recorrido por diversas reas del conocimiento humano, con el fin, de conocer cmo

    se relacionan con las diversas ciencias, formando una sola verdad. Evidentemente, existen,

    muchas disciplinas donde se aplica la estadstica, que no han sido consideradas en este apartado,

    por ejemplo, las ingenieras, la pintura, la msica, etc. Finalmente, es de resaltar que en todos los

    temas donde se analice informacin est presente la estadstica.

    1.2. Poblacin, Muestra y tcnicas de muestreo.

    Las estadsticas de por s no tienen sentido si no se considera o se relaciona dentro del contexto

    con que se trabajan. Por lo tanto es necesario entender los conceptos de poblacin y de muestra

    para lograr comprender mejor su significado en la investigacin educativa o social que se lleva a

    cabo.

    POBLACIN - es el conjunto total de individuos, objetos o medidas que poseen algunas

    caractersticas comunes observables en un lugar y en un momento determinado. Cuando se vaya a

    llevar a cabo alguna investigacin debe de tenerse en cuenta algunas caractersticas esenciales al

    seleccionarse la poblacin bajo estudio. Entre stas tenemos:

  • 11

    Homogeneidad - que todos los miembros de la poblacin tengan las mismas caractersticas

    segn las variables que se vayan a considerar en el estudio o investigacin. Por ejemplo, si se

    fuera a investigar la incidencia de la drogadiccin entre jvenes mujeres adolescentes, entonces

    hay que definir claramente las edades que comprenden la adolescencia y cuando se seleccione la

    poblacin asegurarse de que todas las personas entrevistadas sean de la edad determinada y del

    sexo femenino. (La adolescencia se define operacionalmente como el periodo comprendido de

    edad que flucta entre 12 y 21 aos.)

    Tiempo - se refiere al perodo de tiempo donde se ubicara la poblacin de inters. Determinar si

    el estudio es del momento presente o si se va a estudiar a una poblacin de cinco aos atrs o si

    se van a entrevistar personas de diferentes generaciones.

    Espacio - se refiere al lugar donde se ubica la poblacin de inters. Un estudio no puede ser muy abarcador y por falta de tiempo y recursos hay que limitarlo a un rea o comunidad en especfico.

    Cantidad - se refiere al tamao de la poblacin. El tamao de la poblacin es sumamente importante porque ello determina o afecta al tamao de la muestra que se vaya a seleccionar,

    adems que la falta de recursos y tiempo tambin nos limita la extensin de la poblacin que se

    vaya a investigar.

    MUESTRA - la muestra es un subconjunto fielmente representativo de la poblacin.

    Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione depender de la calidad y

    cun representativo se quiera que sea el estudio de la poblacin, en este sentido, la muestra puede

    ser:

    ALEATORIA - cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser

    incluido.

    Un procedimiento de extraer una muestra aleatoria de una poblacin finita es: enumerar todos

    los elementos que conforman la poblacin, escribir esos nmeros en papelitos y echarlos en una

    urna o bolsa mezclarlos bien removindolos y sacar uno a uno tantos como lo indique el tamao

    de la muestra. En este caso los elementos de la muestra lo constituirn los elementos de la

    poblacin cuyos nmeros coincidan con los extrados de la bolsa o urna.

    El tamao de la muestra (MAS):

    Al realizar un muestreo probabilstica nos debemos preguntar Cul es el nmero mnimo de

    unidades de anlisis (personas, organizaciones, captulo de telenovelas, etc), que se necesitan

    para conformar una muestra n que me asegure un error estndar menor que 0.01 ( fijado por el

    muestrista o investigador), dado que la poblacin es aproximadamente de N elementos.

    En el tamao de una muestra de una poblacin se debe tener presente la varianza poblacional,

    error mximo permisible prefijado (diferencia del parmetro y estimador), con un nivel de

    confianza de 1 . Simblicamente se refiere a lo siguiente: 1P X d

    , bajo este

    contexto podemos utilizar la frmula:

  • 12

    Ejemplo. Se desea estimar la estatura promedio de los estudiantes de la asignatura de

    Tratamiento de la Informacin Estadstica. Se sabe que la estatura de un estudiante es una

    variable aleatoria con distribucin normal. Determine el tamao de muestra aleatoria necesaria

    para garantizar una probabilidad igual a 0.95 de que el estimador y el parmetro se diferencien en

    menos de 10cm.

    Solucin.

    Datos conocidos.

    d= 10cm

    Calcular: , 1

    2

    Z

    =1.96

    : Para calcular la desviacin estndar hay que solicitar la estatura de cada estudiante y luego

    calcular la varianza utilizando la siguiente frmula: 2

    2

    1

    1 n

    X i

    i

    S x xn

    , posteriormente se

    obtiene la raz cuadrada y ese es el valor que se debe utilizar en esta ecuacin. Supongamos que =12cm, entonces:

    Determinar:

    2

    21

    2 12(1.96) 5.53 610

    Z

    n n nd

    , se requiere una muestra de 6

    estudiantes para cumplir las hiptesis del problema.

    ESTRATIFICADA - cuando se subdivide en estratos o subgrupos segn las variables o

    caractersticas que se pretenden investigar. Cada estrato debe corresponder proporcionalmente a

    la poblacin.

    El nmero determinado de elementos muestrales es: 1

    k

    i

    i

    n n

    , donde ni es el nmero de

    elementos en el estrato i=1, 2, , k . No se entrar en detalle del clculo del tamao muestral, ya

    que supera el alcance de esta asignatura.

  • 13

    SISTEMTICA - cuando se establece un patrn o criterio al seleccionar la muestra. Ejemplo: se

    entrevistar una familia por cada diez que se detecten.

    El muestreo es indispensable para el investigador ya que es imposible entrevistar a todos los

    miembros de una poblacin debido a problemas de tiempo, recursos y esfuerzo. Al seleccionar

    una muestra lo que se hace es estudiar una parte o un subconjunto de la poblacin, pero que la

    misma sea lo suficientemente representativa de sta para que luego pueda generalizarse con

    seguridad de ellas a la poblacin.

    El tamao de la muestra depende de la precisin con que el investigador desea llevar a cabo su

    estudio, pero por regla general se debe usar una muestra tan grande como sea posible de acuerdo

    a los recursos que haya disponibles. Es de especificar que para cada mtodo de muestreo existen

    frmulas para determinar el tamao de muestra.

    1.3. Unidad de estudio y unidad de muestreo

    La unidad de anlisis o estudio corresponde a la entidad mayor, primaria o representativa de lo

    que va a ser objeto especfico de estudio en una medicin y se refiere al qu o quin es objeto de

    inters en una investigacin. Por ejemplo: Condiciones de hacinamiento de las familias del

    Municipio de Soyapango, San Salvador. Unidad de Anlisis: Familias del Municipio de

    Soyapango.

    Debe estar claramente definida en un protocolo de investigacin y el investigador debe obtener la

    informacin a partir de la unidad que haya sido definida como tal, aun cuando, para acceder a

    ella, haya debido recorrer pasos intermedios. Las unidades de anlisis pueden corresponder a las

    siguientes categoras o entidades:

    Personas

    Grupos humanos

    Poblaciones completas

    Unidades geogrficas determinadas

    Eventos o interacciones sociales (enfermedades, accidentes, casos de infecciones

    intrahospitalarias, etc)

    Entidades intangibles, susceptibles de medir (exmenes, das, camas)

    El tipo de anlisis al que se someter la informacin es determinante para elegir la unidad de

    anlisis. Por ejemplo, si el objetivo es dar cuenta de la satisfaccin del usuario de un servicio

    mdico, la unidad de anlisis natural es el paciente atendido, o la persona que se atiende en ese

    servicio mdico. Si el objetivo es dar cuenta de la satisfaccin del alumno sobre el desempeo

    docente, la unidad de anlisis es el alumno que recibe clases con el docente evaluado.

  • 14

    La unidad de muestreo corresponde a la entidad bsica mediante la cual se acceder a la unidad

    de anlisis. En algunos casos, ambas se corresponden. Por ejemplo, si se desea estimar la

    prevalencia de dao auditivo en relacin con niveles de ruido ambiental en una muestra de

    trabajadores de una fbrica, la unidad de muestreo puede corresponder a la entidad "sujeto", si se

    dispone de un registro detallado de cada sujeto. La unidad de anlisis es por cierto el trabajador

    de la fbrica.

    1.4. Variables y datos

    VARIABLES Las variables son las caractersticas observables de un objeto, problema o evento que se puede

    describir segn un esquema de medicin bien definido. Cada rasgo o aspecto de una poblacin

    constituye una variable. La edad de unas personas, su sexo, color de su piel, nacionalidad, su

    nivel de motivacin, niveles de ansiedad, el nmero de nacimientos, nmero de matrimonios,

    frecuencia de suicidios, estatura, peso, niveles de inteligencia, actitudes, entre muchas otras.

    Las variables pueden adquirir diferentes valores o clasificarse en diferentes categoras segn la

    naturaleza o tipo de estudio que se lleve a cabo. Entre stas tenemos las siguientes

    clasificaciones:

    VARIABLES CUALITATIVAS - son aquellas que se expresan en forma verbal como

    categoras o atributos. Por ejemplo, el sexo, color, afiliacin poltica, nacionalidad, motivacin,

    rea acadmica o profesin de una persona.

    VARIABLES CUANTITATIVAS - son las que varan en trminos de cantidad y se registran o

    expresan en forma numrica. Por ejemplo, edad, promedio acadmico, puntuaciones de

    exmenes, frecuencia de delitos, temperatura, ingresos anuales o salarios por hora. Hay algunas

    caractersticas que pueden clasificarse o expresarse como variable cuantitativa y transformarla a

    cualitativa o viceversa. Por ejemplo, nivel de aprovechamiento acadmico estudiantes de 4:00

    puntos, o estudiantes de 3:00 puntos y as sucesivamente. El investigador puede expresar

    mediante una escala numrica el aprovechamiento acadmico al clasificar a los estudiantes, como

    tambin puede clasificarlos como variable cualitativa en las categoras de excelentes, buenos,

    regulares y deficientes.

    VARIABLES DISCRETAS - son aquellas que slo adquieren un valor absoluto o especfico

    que nunca cambian. Pueden ser cualitativas. Ejemplo: el sexo, nacionalidad, grupo tnico, entre

    otras.

    VARIABLES CONTINUAS - que siempre son cuantitativas, son las que pueden asumir

    cualquier valor. Por ejemplo, la edad, altura, peso, ndice acadmico.

    En el campo de la investigacin, que se suele examinar las relaciones entre dos o ms variables al

    investigar un asunto o problema, se clasifican las variables como:

    VARIABLES INDEPENDIENTES - son las caractersticas controladas por el investigador y

    que se supone tendrn efectos sobre otras variables.

  • 15

    VARIABLES DEPENDIENTES - son las caractersticas o aspectos que se alteran por

    consecuencia del control que ejerce el investigador sobre otras variables.

    Estos dos ltimos tipos de variables suelen darse ms en estudios o investigaciones

    experimentales, pero tambin podemos considerarlas en estudios descriptivos. Por ejemplo, en un

    estudio experimental se investiga si un nuevo medicamento mejora las condiciones del sida. A

    tales efectos se seleccionaron 30 pacientes, de los cules 15 reciban el nuevo medicamento

    (grupo experimental) y otros 15 continuaban con su tratamiento tradicional (grupo control). El

    nuevo medicamento viene a ser la variable independiente porque es la que los investigadores

    controlan y que luego examinarn sus efectos en la condicin del sida, la cual viene a ser la

    variable dependiente, porque es la condicin que se va alterar o quedar afectada por el nuevo

    medicamento.

    En un estudio descriptivo donde interesa saber si la clase social es factor determinante en el

    aprovechamiento acadmico en las escuelas, entonces la clase social es la variable independiente

    y el aprovechamiento acadmico la dependiente.

    Una variable puede ser independiente en una investigacin y dependiente en otra, todo depender

    de la finalidad de la investigacin. Por ejemplo, si se lleva a cabo un estudio para determinar

    cmo las condiciones socio-econmicas influyen a la drogadiccin, en este caso, status socio-

    econmico es una variable independiente. Por el contrario, si se lleva a cabo una investigacin

    para saber cmo la drogadiccin afecta las condiciones sociales y econmicas, entonces, el status

    socio-econmico resultara ser la variable independiente.

    DATOS: son los hechos que describen sucesos y entidades.

    1.5. Escalas de medicin

    Una escala es un esquema especfico para asignar nmeros o smbolos con el objeto de designar

    caractersticas de una variable. Las escalas de medicin comnmente conocidas son: nominales,

    ordinales, de intervalos y de razn. A continuacin veamos los cuatro tipos de escalas de

    medicin.

    1.5.1. Escalas nominales

    Las escalas nominales son aquellas donde se clasifican los objetos, personas o variables en

    categoras cualitativamente distintas. Consiste simplemente en agrupar objetos en clases o asignar

    las personas de acuerdo a alguna cualidad una vez que los objetos o personas posean

    caractersticas comunes que lo hagan pertenecer a una categora. Por ejemplo, todos los

    estudiantes que obtuvieron sobre 9 puntos fueron clasificados como excelentes, los que

    obtuvieron menos de 8.9 pero ms de 8.0 como muy buenos y de 7.0 a 7.9 como buenos. En una

    redada de drogas se arrestaron 22 mareros, cuatro acusados de homicidios, ocho acusados de

    violacin y diez por extorciones.

    Se pueden utilizar nmeros en las escalas nominales, pero stos no representan magnitudes

    absolutas. Los nmeros slo se utilizan con el propsito de clasificarlos a determinada categora.

  • 16

    Por ejemplo, si vas a comprar pintura azul en la ferretera te presentan una escala con diferentes

    tonalidades del color azul y cada tonalidad posee un nmero, pero este nmero slo es para

    facilitar al vendedor identificar el color solicitado entre cientos de colores. De igual modo en

    muchas solicitudes se le asigna el nmero 1 al sexo masculino y nmero dos al femenino y esta

    clasificacin slo es para facilitar los cmputos y manejos de informacin estadstica, pero no

    quiere decir que los masculinos tengan ms o menor valor que las del sexo femenino. Los

    nmeros que se utilizan para efectos de identificacin en una escala nominal nunca se utilizarn

    para llevar a cabo los procedimientos matemticos de suma, resta, multiplicacin y divisin.

    1.5.2. Escalas ordinales

    Las escalas ordinales son las que clasifican a las personas, eventos u objetos en una posicin con

    relacin a cierto atributo, pero sin indicar la distancia que hay entre las posiciones. Cuando se

    asignan nmeros es slo para indicar el orden de las posiciones de lo que se est clasificando. Por

    ejemplo, en un determinado grupo escolar se decidi seleccionar los cinco estudiantes con el

    promedio ms alto para premiarlos con un viaje al Lago de Coatepeque y result que Esteban

    qued tercero con un promedio de 8.90, seguido de Jorge con 8.88 y, luego Leticia con 8.75.

    Esteban como tercero se le asigna el nmero tres, pero sta designacin numrica slo indica su

    posicin con relacin a los otros cuatro alumnos. Sabemos que Esteban tiene un mejor promedio

    que Jorge y que su promedio es superior que el de Leticia. Sin embargo, no podremos saber hasta

    qu punto es mejor su promedio comparado con los otros.

    Con las escalas ordinales tampoco se pueden llevar a cabo las operaciones aritmticas de suma,

    resta, multiplicacin y divisin. La diferencia que puede haber entre unas personas u objetos en

    este tipo de escala no necesariamente constituye unidades iguales o absolutas que puedan

    utilizarse para determinar si el que tiene un segundo lugar posee el doble valor que el que queda

    en cuarta posicin. Por ejemplo, en un evento atltico de una carrera que no haya sido

    cronometrada, podemos saber quin lleg primero, segundo y tercer lugar, pero no podemos

    saber con precisin la velocidad entre un corredor y otro. La diferencia que hay entre el primero y

    el segundo no necesariamente es igual a la que hubo entre el segundo y el tercero.

    1.5.3. Escalas de intervalos

    Las escalas de intervalos son aquellas que ordenan los objetos o eventos segn la magnitud del

    atributo que representan y proveen intervalos iguales entre las unidades de medida. Adems, no

    poseen un punto cero absoluto o verdadero ya que el mismo es establecido por convencin de

    forma arbitraria por los expertos en el rea o materia de estudio y no implica la ausencia del

    atributo o la propiedad en cuestin. Por ejemplo, la escala de inteligencia posee un punto cero,

    pero administrando cualquier tipo de prueba que intente medir la inteligencia, nunca va a

    encontrar un ser humano con cero inteligencia. De igual modo si el agua est en 0 grado C, esto

    no quiere decir que carezca de temperatura, ya que en una escala de intervalos, como se ha

    indicado, es una designacin arbitraria y convencional.

    Una diferencia de cierta magnitud en una escala de intervalos significa lo mismo en todos los

    puntos de la escala. As por ejemplo, en los termmetros de grados Fahrenheit y centgrados que

  • 17

    utilizan este tipo de escalas, estn divididos en unidades iguales, la diferencia en la temperatura

    entre 100 grados y 101 grados es equivalente a la diferencia entre 110 grados y 111 grados.

    La numeracin de los aos en nuestro calendario utiliza tambin una escala de intervalos. Las

    autoridades eclesisticas y gubernamentales de la poca decidieron arbitrariamente fijar como el

    ao 1 el del nacimiento de Cristo y como unidad de medida un lapso de 365 das. Por lo tanto, el

    lapso de tiempo que estuvo Bill Clinton como presidente de los Estados Unidos desde 1993

    2001 es igual al que transcurri George Bush desde 2001 2009.

    1.5.4. Escalas de razones o cocientes

    Las escalas de razones o cocientes se diferencian de las de intervalos solamente en que la de

    razones el punto cero no es arbitrario y corresponde a una total ausencia del asunto o propiedad

    estudiada. La escala de una simple regla de 12 pulgadas posee una escala de razones la cual est

    dividida en 12 unidades cada una de igual magnitud y parte de un punto cero absoluto y

    verdadero.

    La mayora de las variables con las cuales se utiliza este tipo de escalas se refieren ms a la

    ejecucin de tareas motoras, a las medidas de objetos y de aspectos fisiolgicos.

    Dos ejemplos de las escalas de razones y cocientes son: las medidas de la estatura y el peso. Si

    una columna mide seis metros es el doble de alto de otra columna que mide tres metros. Si

    Enrique pesa 180 libras, entonces pesa el doble que Mara quin pesa 90 libras. Las razones de

    los nmeros en estas escalas tienen un determinado sentido, lo que hace posible que se

    interpreten los valores numricos entre las cantidades obtenidas de los objetos.

    Adems pueden llevarse a cabo las diferentes operaciones matemticas.

    RESUMEN: CARACTERSTICAS, EJEMPLOS Y LIMITACIONES

    DE LAS ESCALAS DE MEDICIN ESCALA CARACTERSTICAS USOS/EJEMPLOS LIMITACIONES

    Nominal Se clasifican las personas, eventos u

    objetos en categoras.

    Denominaciones religiosas, afiliacin

    poltico partidista, codificaciones en

    la clasificacin de objetos, pinturas,

    movimientos literarios.

    No se pueden precisar diferencias

    cuantitativas entre las categoras.

    Ordinal Se clasifican u ordenan las

    personas, objetos y eventos en

    determinada posicin.

    Orden de llegada de atletas en una

    carrera, puntuaciones de una prueba,

    rangos militares, nivel de popularidad

    de estudiantes en una escuela.

    Restringida para Identificar

    diferencias relativas, pero no

    precisa diferencias en cantidad

    absoluta entre personas u objetos.

    Intervalo Escala que posee unidades de igual

    magnitud. El punto cero de la escala

    es arbitrario y no refleja la ausencia

    del atributo.

    Temperaturas (Celsius y Fahrenheit),

    fechas del calendario, escala de

    inteligencia.

    Razones no tienen sentido ya que el

    punto cero es establecido

    convencionalmente.

    Razones Escala que posee un punto

    cero absoluto e intervalos de igual

    magnitud.

    Distancia, peso, estatura, tiempo

    requerido para realizar una tarea

    escolar.

    Ninguna, excepto que su uso se

    supedita mayormente a medir

    cualidades fsicas ms que para la

    medicin de aspectos psicolgicos.

  • 18

    1.6. Diseo de Experimentos estadsticos.

    El diseo de un experimento es la secuencia completa de los pasos que se deben tomar de

    antemano, para planear y asegurar la obtencin de toda la informacin relevante y adecuada al

    problema bajo investigacin, la cual ser analizada estadsticamente para obtener conclusiones

    vlidas y objetivas con respecto a los objetivos planteados.

    Un Diseo Experimental es una prueba o serie de pruebas en las cuales existen cambios

    deliberados en las variables de entrada de un proceso o sistema, de tal manera que sea posible

    observar e identificar las causas de los cambios que se producen en la respuesta de salida.

    El propsito de cualquier Diseo Experimental, es proporcionar una cantidad mxima de

    informacin pertinente al problema que se est investigando. Y ajustar el diseo que sea lo ms

    simple y efectivo; para ahorrar dinero, tiempo, personal y material experimental que se va a

    utilizar. Es de acotar, que la mayora de los diseos estadsticos simples, no slo son fciles de

    analizar, sino tambin son eficientes en el sentido econmico y en el estadstico.

    De lo anterior, se deduce que el diseo de un experimento es un proceso que explica tanto la

    metodologa estadstica como el anlisis econmico.

    DISEO: Consiste en planificar la forma de hacer el experimento, materiales y mtodos a usar,

    etc.

    EXPERIMENTO: Conjunto de pruebas o ensayos cuyo objetivo es obtener

    informacin, que permita mejorar el producto o el proceso en estudio.

    1.7. Gua de ejercicios N 1. 1. Contestar verdadero o falso y comentar su respuestas segn sea el caso:

    a) La Estadstica es una ciencia que estudia y describe las caractersticas de un conjunto de

    casos.

    b) La estadstica inferencial generaliza los resultados de una muestra a los de la poblacin

    total.

    c) Durante los ltimos dos das se ha informado de un total de cinco homicidios diarios en

    San Salvador, este es un ejemplo de estadstica inferencial.

    d) A las medidas que se obtienen de una muestra se les da el nombre de parmetro.

    e) En una muestra aleatoria ciertos elementos tienen mayor probabilidad que otros de ser

    seleccionados.

    2. Mediante ejemplos, explicar la diferencia entre la estadstica descriptiva y estadstica

    inferencial.

  • 19

    3. POBLACIN - es el conjunto total de individuos, objetos o medidas que poseen algunas

    caractersticas comunes observables en un lugar y en un momento determinado. A partir

    de esta definicin enumere las caractersticas de una poblacin.

    4. Describir dos ejemplos de poblacin.

    5. Describir dos ejemplos de muestra de una poblacin.

    6. Definir al menos dos tipos de muestreo y dar ejemplos de aplicacin de cada uno.

    7. Se desea estimar la edad promedio de los estudiantes de la asignatura de Tratamiento de

    la Informacin Estadstica. Se sabe que la edad de un estudiante es una variable aleatoria

    con distribucin normal con desviacin estndar de 6aos. Determine el tamao de

    muestra aleatoria necesaria para garantizar una probabilidad igual a 0.95 de que el

    estimador y el parmetro se diferencien en menos de 5aos.

    8. Establecer las diferencias entre la unidad de anlisis y la unidad muestral.

    9. Establecer las diferencias entre variables cualitativas y cuantitativas.

    10. Definir al menos dos ejemplos de variables cualitativas y de variables cuantitativas.

    11. Establecer las diferencias entre variables discretas y continuas.

    12. Definir al menos dos ejemplos de variables discretas y de variables continuas.

    13. Definir las siguientes escalas de Medicin y presentar dos ejemplos de cada una de ellas:

    Escala nominal

    Escala ordinal

    Escala de intervalo.

    Escala de razn

  • 20

    Captulo 2. Distribuciones de frecuencias y sus

    representaciones grficas.

    2.1. Estadstica Descriptiva con una variable

    La estadstica descriptiva permite organizar y presentar un conjunto de datos de manera que

    describan en forma precisa las variables analizadas haciendo rpida su lectura e interpretacin.

    Obviamente, la materia prima de la Estadstica Descriptiva la constituyen los datos, que son el

    resultado de las observaciones y/o experimentos. Se denomina variable al carcter o fenmeno de

    la realidad objeto de estudio. Las variables pueden ser de diferentes tipos, dependiendo de los

    datos que la forman.

    :

    Cualitativas o atributosVariables

    Cuantitativas Discretas o Continuas

    Las variables cualitativas o atributos son aquellas que no toman valores numricos. Describen

    diferentes cualidades denominadas modalidades. Ejemplo: Sexo, estado civil, color de los ojos,

    etc. Las variables cualitativas estn formadas por datos que toman valores numricos y pueden

    ser discretas, si slo toman un nmero entero de valores, y continuas, si pueden tomar cualquier

    valor real dentro de un intervalo.

    Entre los sistemas para ordenar los datos se encuentran principalmente dos: a) la distribucin de

    frecuencias y b) la representacin grfica.

    2.1.1. Distribucin de frecuencias

    Supongamos que hemos recogido un conjunto de n datos englobados en una variable X. La tabla

    que recoge de modo sistemtico estos datos se denomina distribucin de frecuencias. La

    Distribucin de Frecuencias (Simples o agrupadas en intervalos). Comnmente llamada tabla de

    frecuencias, se utiliza para hacer la presentacin de datos provenientes de las observaciones

    realizadas en el estudio, estableciendo un orden mediante la divisin en clases y registro de la

    cantidad de observaciones correspondientes a cada clase. Lo anterior facilita la realizacin de un

    mejor anlisis e interpretacin de las caractersticas que describen y que no son evidentes en el

    conjunto de datos brutos o sin procesar.

  • 21

    La siguiente tabla recoge las principales caractersticas de una distribucin de frecuencias simple

    o no agrupada.

    Datos Frecuencias Absolutas Frecuencias Relativas

    Simples Acumuladas Simples Acumuladas

    1

    2

    .

    .

    .

    k

    x

    x

    x

    1

    2

    .

    .

    .

    k

    n

    n

    n

    1 1

    2 1 2

    1

    .

    .

    .

    k

    k i

    i

    N n

    N n n

    N n

    1 1

    2 2

    /

    /

    .

    .

    .

    /k k

    f n n

    f n n

    f n n

    1 1

    2 2

    /

    /

    .

    .

    .

    /k k

    F N n

    F N n

    F N n

    Total

    1

    k

    i

    i

    n n

    1

    1k

    i

    i

    f

    La primera columna representa los distintos valores de esos datos y la segunda la frecuencia

    simple, es decir, el nmero de veces que se ha observado el correspondiente valor; la tercera

    columna recoge la frecuencia acumulada (nmero de veces que se han observado valores

    menores o iguales que el que corresponde a dicha fila). Las frecuencias relativas se obtienen a

    partir de las frecuencias absolutas, dividiendo por el tamao de la muestra.

    2.1.2. Descripcin de Variables Cualitativas

    DISTRIBUCIN DE FRECUENCIAS

    Supongamos que tenemos N observaciones de una variable cualitativa.

    Supongamos que la variable puede tomar valores pertenecientes a k clases o categoras:

    4

    Verde

    AzulColor de ojos k

    Marron

    Negro

    Representamos mediante n1, n2, , nk el nmero de datos que aparecen en cada una de las k

    categoras.

    Frecuencia absoluta de la clase i-sima (ni): nmero de observaciones en la clase i.

  • 22

    Frecuencia relativa de la clase i-sima (fi): es la proporcin de datos en la clase i-sima, es

    decir, fn

    Ni

    i .

    - La suma de las k frecuencias relativas es igual a la unidad: f1 + f2 ++ fk=1

    - Nos permiten comparar las frecuencias de las categoras en conjuntos de datos con distinto nmero de observaciones

    Distribucin de frecuencias: es la tabla que presenta las categoras de una variable y sus

    respectivas frecuencias.

    - Nos indica cmo se distribuye la frecuencia total entre las categoras - Es el resumen ms importante de la informacin contenida en una variable cualitativa Ejemplo 1: nivel educativo

    Se ha clasificado a 20 individuos segn su nivel de estudios que puede tomar valores:

    1 sin

    2

    3

    4 sup

    estudios

    primariosNivel educativo

    medios

    eriores

    y se han obtenido los siguientes datos:

    1 1 4 3 3 3 2 2 4 2 2 1 4 2 3 2 3 4 2 3;

    N=20; k=4

    Frecuencias absolutas:

    n1=3; n2=7; n3=6; n4=4 N n n n n 1 2 3 4 3 7 6 4 20

    Frecuencias relativas:

    f f f f1 2 3 43

    200 15

    7

    200 35

    6

    200 3

    4

    200 2 , ; , ; , ; ,

    f f f f1 2 3 4 0 15 0 35 0 3 0 2 1 , , , ,

  • 23

    Distribucin de frecuencias:

    Categoras ni fi

    1. Sin estudios 3 0,15

    2. Primaria 7 0,35

    3. Media 6 0,3

    4. Superior 4 0,2

    N=20 1

    La categora ms frecuente es la de estudios primarios y la menos frecuente la de sin estudios

    REPRESENTACIN GRFICA DE LA DISTRIBUCIN DE FRECUENCIAS

    A) Diagrama de barras: Permite visualizar de forma sencilla la distribucin de una variable cualitativa. Se dibuja sobre cada categora una barra (o rectngulo) cuya altura coincida

    con la frecuencia absoluta o relativa de dicha clase.

    Ejemplo: Nivel de estudios (Continuacin ejemplo 1)

    Frecuencias relativas fi

    0.10

    0.15

    0.20

    0.25

    0.30

    0.35

    0.40

    1 2 3 4

    B) Diagrama de Pareto: Es como un diagrama de barras en el que se ordenan las clases de mayor a menor frecuencia (absoluta o relativa). En la parte superior de la figura suele

    trazarse una lnea que representa la suma de la frecuencia de cada clase y las que la

    preceden, esto se usa para identificar la minora de las caractersticas que representan la

    mayora de casos.

  • 24

    A principios del Siglo XX, Vilfredo Pareto (1848-1943), un economista italiano, realiz

    un estudio sobre la riqueza y la pobreza. Descubri que el 20% de las personas

    controlaba el 80% de la riqueza en Italia.

    La grfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar

    visualmente en una sola revisin las minoras de caractersticas vitales a las que es importante

    prestar atencin.

    Algunos ejemplos de tales minoras vitales son:

    La minora de clientes que representan la mayora de las ventas.

    La minora de productos, procesos, o caractersticas de la calidad causantes del grueso de desperdicio de los costos de retrabajos.

    Ejemplo: Nivel educativo (Continuacin ejemplo 1)

    Frecuencias relativas fi (Grfico de Pareto)

    0.10

    0.15

    0.20

    0.25

    0.30

    0.35

    0.40

    2 3 4 1

    f2=0,35

    f2+ f3=0,35+0,3=0,65

    f2+ f3+ f4=0,35+0,3+0,2=0,85

    f2+ f3+ f4+f1=0,35+0,3+0,2+0,15=1

    Un 35 por ciento de la poblacin llega hasta la educacin primaria y el 65 por ciento de la

    poblacin tiene un nivel educativo primario o media.

  • 25

    Diagrama de Pareto

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    2 3 4 1

    En el diagrama anterior se observa que el 65 por ciento de la poblacin, tiene un nivel

    educativo primaria o media.

    C) Pictograma: Es una forma de representar las cantidades estadsticas por medio de

    dibujos, utilizando para ello objetos y figuras. Las figuras empleadas deben explicarse por

    s mismas.

    Ejemplo: Nivel de educativo (Continuacin).

    a) Distribucin de frecuencias:

    Categoras ni fi

    1. Sin estudios 3 0,15

    2. Primario 7 0,35

    3. Medio 6 0,3

    4. Superior 4 0,2

    N=20 1

    b) Elaboracin del Pictograma (Ejercicio para el estudiante)

  • 26

    Ejemplo: Variable socioeconmica (SOC): La variable SOC describe la categora

    socioeconmica:

    1

    2

    3

    4

    5

    6

    7

    trabajadores agrarios

    empresarios agrarios

    obreros

    SOC autonomos

    clase media

    clase alta

    retirados

    Los datos de 75 hogares (o unidades de gasto) son:

    3 7 3 5 3 5 1 5 7 5 5 3 3 5 1 1 3 2 2 3 1 3 7 5 3 3 3 5 5 5 7 7 5 1 4 2 1 7 3 4 3 3 3 5 3 3 6

    6 7 2 7 1 3 3 2 5 3 7 2 2 7 5 2 2 7 6 1 5 3 5 3 3 3 4 3

    (a) Obtener las frecuencias absolutas de cada una de las categoras.

    n1=8 n2=9 n3=25 n4=3 n5=16

    n6=3 n7=11

    (b) Calcular las frecuencias relativas y mostrar la distribucin de frecuencias

    fn

    N1

    1 8

    750 11 , f

    n

    N2

    2 9

    750 12 ,

    fn

    N3

    3 25

    750 33 , f

    n

    N4

    4 3

    750 04 ,

    fn

    N5

    516

    750 21 , f

    n

    N6

    6 3

    750 04 ,

    fn

    N7

    7 11

    750 15 ,

    Ntese que:

    f f f f f f f fii

    1 2 3 4 5 6 7

    1

    7

    1

  • 27

    Distribucin de frecuencias:

    Categora ni fi

    1. Trabajadores agrarios 8 0,11

    2. Empresarios agrarios 9 0,12

    3. Obreros 25 0,33

    4. Autnomos 3 0,04

    5. Clase media 16 0,21

    6. Clase alta 3 0,04

    7. Retirados 11 0,15

    N=75 1

    (c) Construir el diagrama de Pareto

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    3 5 7 2 1 4 6

    f3=0,33; f3+f5=0,33+0,21=0,54

    f3+f5+f7=0,33+0,21+0,15=0,69

    f3+f5+f7+f2=0,33+0,21+0,15+0,12=0,81

    f3+f5+f7+f2+f1=0,33+0,21+0,15+0,12+0,11=0,92

    f3+f5+f7+f2+f1+f4=0,33+0,21++0,11+0,04=0,9

    F3+F5+F7+F2+F1+F4+F6=0,33+0,21++0,04+0,04=1

    El 33 por ciento de la poblacin son obreros y el 54 por ciento de la poblacin son obreros o clase

    media, y as sucesivamente.

  • 28

    Grfico de sectores:

    En el caso de variables cualitativas el diagrama circular se utiliza con mucha frecuencia. Consiste

    en representar sobre un crculo los diferentes atributos, mediante un sector circular de ngulo

    proporcional a la correspondiente frecuencia. El ngulo de cada sector circular se calcula

    multiplicando por 360 la frecuencia relativa.

    Los grficos de sectores, tambin conocidos como diagramas de "tartas o pastel", se divide un

    crculo en tantas porciones como clases tenga la variable, de modo que a cada clase le

    corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa. Si el nmero de

    categoras es excesivamente grande, la imagen proporcionada por el grfico de sectores no es lo

    suficientemente clara y por lo tanto la situacin ideal es cuando hay alrededor de cuatro

    categoras. En este caso se pueden apreciar con claridad dichos subgrupos.

    Ejemplo.

    La poblacin segn nivel de estudio del Municipio de Ayutuxtepeque se presenta en el siguiente

    cuadro:

    Parvularia Primaria o bsica

    Educacin media

    Superior no universitaria

    Tcnico universitario

    Superior universitaria Maestra Doctorado Total

    1168 15895 6842 499 363 4556 70 7 29400 Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.

    Elaborar un grfico de sectores.

    Se tienen 8 categoras, por lo tanto debe aparecer el crculo dividido en 8 porciones. La tabla

    anterior presenta las frecuencias absolutas, habr que dividir cada dato por el total (29,400) a fin

    de obtener la frecuencia relativa y luego multiplicar esta ltima por 100. Por ejemplo, para la

    categora de educcin bsica: (15,895/ 29,400)*100 = 54,06%. Observe que no se ha

    multiplicado por 360, ya que es ms ilustrativo el porcentaje (As trabaja Excel).

    Figura 2. Nivel educativo de la poblacin de Ayutuxtepeque, por ciento.

    Es evidente que la mayora de la poblacin tiene un nivel educativo bsico o media con el

    54.06% y 23.27% respectivamente. En general la poblacin de Ayutuxtepeque tiene un nivel

    educativo relativamente bajo, son muy pocos los que llegan a hacer estudios universitarios.

  • 29

    2.1.3. Variables cuantitativas discretas.

    Diagrama de Barras:

    Para el caso de distribuciones de frecuencias no agrupadas en intervalos, el diagrama de barras es

    el grfico ms empleado. Que se usa cuando se pretende resaltar la representacin de porcentajes

    o frecuencias de datos que componen un total. Una grfica de barras contiene barras verticales

    que representan valores numricos. Las frecuencias estn asociadas con categoras. Una grfica

    de barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de

    largo (alto si es horizontal) igual a la frecuencia. La grfica de barras sirve para comparar y tener

    una representacin grfica de la diferencia de frecuencias o de intensidad de la caracterstica

    numrica de inters. Si en vez de frecuencias simples utilizamos frecuencias acumuladas,

    tenemos el llamado diagrama de escalera.

    Ejemplo. Con la informacin del VI Censo de Poblacin y V de Vivienda, El Salvador, 2007, se

    han clasificado las mujeres de El Salvador de 12 aos y ms, segn el nmero de hijos varones,

    resultando los siguientes datos.

    Construir un grfico de barras para el nmero de hijos varones de las

    mujeres salvadoreas.

    Ejemplo.

    La poblacin segn condicin de ocupacin del Municipio de Ayutuxtepeque se presenta en el

    siguiente cuadro:

    OCUPADOS DESOCUPADOS INACTIVOS Total

    REA URBANA 10966 2832 8531 22329

    EL ZAPOTE 329 42 477 848

    LOS LLANITOS 2410 227 2550 5187

    Total 13705 3101 11558 28364 Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.

    Elaborar un grfico de barras para la poblacin total de Ayutuxtepeque segn su condicin de

    ocupacin.

    N Hijos Varones Madres

    0 278290

    1 509469

    2 339180

    3 177050

    4 92233

    5 50916

    6 27791

    7 15004

    8 7328

    9+ 7366

  • 30

    2.2. Distribucin de frecuencias agrupadas.

    Cuando en la muestra existen muchos valores diferentes y mucha variabilidad se recomienda, an

    a costa de perder informacin, agrupar los datos en clases, en lo que se denomina distribucin de

    frecuencias agrupada en intervalos.

    Clase Marca Frecuencias Absolutas Frecuencias Relativas

    Clase Simples Acumuladas Simples Acumuladas

    0 1

    1 2

    1

    .

    .

    .

    k k

    L L

    L L

    L L

    1

    2

    .

    .

    .

    k

    x

    x

    x

    1

    2

    .

    .

    .

    k

    n

    n

    n

    1 1

    2 1 2

    1

    .

    .

    .

    k

    k i

    i

    N n

    N n n

    N n

    1 1

    2 2

    /

    /

    .

    .

    .

    /k k

    f n n

    f n n

    f n n

    1 1

    2 2

    /

    /

    .

    .

    .

    /k k

    F N n

    F N n

    F N n

    Total

    1

    k

    i

    i

    n n

    1

    1k

    i

    i

    f

    A cada uno de los intervalos se les denomina clase y al punto medio marca de clase. A efectos de

    clculo la marca de clase se elige como representante del intervalo. El nmero de clases en que se

    dividen los datos no debe ser excesivo. A modo orientativo, el nmero de clases se puede obtener

    mediante la siguiente frmula emprica, llamada de Sturges:

    3 log( )

    2 log(2)

    nnmero de clases (Tomar la parte entera)

  • 31

    Ejemplo. Poblacin de El Salvador, por sexo y edad, ao 2007..

    Edad Hombre Mujer Total Edad Hombre Mujer Total Edad Hombre Mujer Total

    < 1 51787 50097 101884 36 31398 40111 71509 72 8591 10717 19308

    1 53230 51477 104707 37 31414 38801 70215 73 7461 9522 16983

    2 55845 54261 110106 38 29639 37419 67058 74 8011 10030 18041

    3 59752 57127 116879 39 29435 37454 66889 75 8067 9886 17953

    4 62658 59659 122317 40 31769 39411 71180 76 7535 9745 17280

    5 62274 59738 122012 41 24732 32964 57696 77 6897 8872 15769

    6 69088 66249 135337 42 26840 34653 61493 78 5825 7123 12948

    7 75310 72672 147982 43 24578 32639 57217 79 5334 6700 12034

    8 71525 68511 140036 44 24299 31746 56045 80 5717 7089 12806

    9 70953 68407 139360 45 24451 31422 55873 81 4124 5274 9398

    10 74244 70664 144908 46 21989 29308 51297 82 3841 5220 9061

    11 71744 69499 141243 47 22251 28713 50964 83 3438 4508 7946

    12 74093 72835 146928 48 20682 26481 47163 84 3281 4378 7659

    13 68251 66194 134445 49 20584 26241 46825 85 3263 4413 7676

    14 71191 67632 138823 50 22897 28057 50954 86 3096 4286 7382

    15 64523 63752 128275 51 17664 22874 40538 87 2750 3758 6508

    16 61880 61630 123510 52 19081 24360 43441 88 1767 2358 4125

    17 61255 61624 122879 53 17671 22344 40015 89 1595 2219 3814

    18 57590 58584 116174 54 17962 22824 40786 90 1405 2091 3496

    19 53136 56591 109727 55 17848 22561 40409 91 786 1143 1929

    20 50243 55085 105328 56 17114 21361 38475 92 826 1206 2032

    21 45994 51623 97617 57 16816 20974 37790 93 673 990 1663

    22 46006 51429 97435 58 14462 17853 32315 94 559 869 1428

    23 42864 49278 92142 59 15478 18608 34086 95 482 816 1298

    24 42894 51126 94020 60 17461 19979 37440 96 416 674 1090

    25 42616 50552 93168 61 12470 15424 27894 97 356 588 944

    26 41993 50707 92700 62 13590 17093 30683 98 + 526 948 1474

    27 43473 52214 95687 63 12274 15528 27802

    28 39209 48076 87285 64 12412 15633 28045

    29 39672 49378 89050 65 12802 15513 28315

    30 41911 50744 92655 66 11774 14915 26689

    31 33494 42933 76427 67 11864 14597 26461

    32 35940 45312 81252 68 9694 12291 21985

    33 33124 41990 75114 69 9647 12060 21707

    34 33931 42870 76801 70 10861 13101 23962

    35 34628 42848 77476 71 8525 10638 19163 Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.

    Elabore una tabla de frecuencias agrupadas por edad.

  • 32

    2.2.1 Representacin grfica de variables continuas

    Histogramas y polgono de frecuencias.

    El histograma y el polgono de frecuencias son las representaciones grficas usadas para

    distribuciones de frecuencias agrupadas en intervalos. El histograma se construye dibujando en

    cada clase un rectngulo de base la amplitud del intervalo y de altura se representan las

    frecuencias. Si desde el extremo superior de cada una de las barras que representan los intervalos

    de clase se hace una marca en el punto medio y luego se unen los puntos por lnea recta se

    obtiene el polgono de frecuencias.

    El polgono de frecuencias se lleva hasta el eje horizontal en los extremos hasta los puntos que

    seran los puntos medios si hubiera una clase adicional en cada extremo del histograma

    correspondiente. Esto permite que el rea total quede incluida. Es decir, el rea total bajo el

    polgono de frecuencias equivale al rea bajo el histograma.

    Ejemplo: Estatura de los estudiantes de clase (ejercicio prctico)

    Ejemplo:

    El siguiente cuadro presenta el nmero de homicidios para los aos 2004, 2005, 2006, 2007 y

    2008, para los municipios de Soyapango, Ilopango y San Martn.

    Grupos de

    edades

    SOYAPANGO ILOPANGO SAN MARTN

    Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total

    AO 2004

    Total 15 167 182 12 78 90 11 42 53

    AO 2005

    Total 14 228 242 5 74 79 11 75 86

    AO 2006

    Total 16 246 262 15 69 84 6 48 54

    AO 2007

    Total 20 179 199 10 67 77 8 71 79

    AO 2008

    Total 10 128 138 9 66 75 7 54 61

    Fuente: Fuente estadsticas de homicidios de Instituto de Medicina Legal. Los cadveres que no se pudo identificar el sexo, no aparecen registrados en el cuadro anterior.

    Utilizar la mejor representacin grfica para la informacin anterior (Diagrama de barras e

    histogramas)

  • 33

    2.3. Gua de ejercicios N 2.

    Distribucin de frecuencias y sus representaciones grficas.

    1. Las calificaciones de 50 alumnos en Matemticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7,

    6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.

    Construir la tabla de distribucin de frecuencias y dibuja el diagrama de barras.

    2. Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla:

    Peso [50,

    60)

    [60,

    70) [70, 80) [80,90)

    [90,

    100)

    [100,

    110)

    [110,

    120)

    fi 8 10 16 14 10 5 2

    a) Construir la tabla de frecuencias.

    b) Representar el histograma y el polgono de frecuencias.

    3. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Fsica.

    3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,

    22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

    a) Construir la tabla de frecuencias agrupadas en intervalos de amplitud 5 unidades.

    b) Dibujar el histograma y el polgono de frecuencias.

    4. Se ha realizado una encuesta en 30 hogares en la que se les pregunta el n de individuos

    que conviven en el domicilio habitualmente. Las respuestas obtenidas han sido las

    siguientes: 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3.

    a) Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas.

    b) Qu proporcin de hogares est compuesto por tres o menos personas? Qu proporcin de individuos vive en hogares con tres o menos miembros?

    c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera.

    5. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el nmero de empleados que hay en cada una de ellas para un estudio posterior. Las

    observaciones obtenidas han sido: 12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,14,15, 11, 11,

    12, 16, 17, 17,16,16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10,

    11, 12, 12, 11, 13, 13, 15, 13, 11, 12.

    a) Calcule la distribucin de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas.

    b) Qu proporcin de sucursales tiene ms de 15 empleados?

  • 34

    c) Dibuje el diagrama de barras y el diagrama en escalera correspondientes. d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su distribucin

    de frecuencias y represente su histograma y su polgono de frecuencias.

    6. Los siguientes valores son los niveles de glucosa en sangre extrada a 100 nios en ayunas:

    56 61 57 77 62 75 63 55 64 60

    60 57 61 57 67 62 69 67 68 59

    65 72 65 61 68 73 65 62 75 80

    66 61 69 76 72 57 75 68 81 64

    69 64 66 65 65 76 65 58 65 64

    68 71 72 58 73 55 73 79 81 56

    65 60 65 80 66 80 68 55 66 71

    72 73 73 75 75 74 66 68 73 65

    73 74 68 59 69 55 67 65 67 63

    67 56 67 62 65 75 62 63 63 59

    a. Elabore una distribucin de frecuencias b. Un histograma y un polgono de frecuencias.

    7. Los siguientes datos representan las ventas de tabaco en Espaa durante el ao 1992, en millones de cajetillas, segn marcas:

    Marcas Ventas

    Ducados

    Fortuna

    Marlboro

    Winston (1)

    Lucky Strike (1)

    Chesterfiel

    Otros marcas

    1,107

    1,041

    535

    333

    164

    110

    725

    a. Calcular el porcentaje de ventas de cada marca sobre el total. b. Representar los datos anteriores mediante un diagrama circular

    8. Las edades de los empleados de una determinada empresa son las que aparecen en la siguiente tabla:

    Edad N de empleados

    Menos de 25 22

    Menos de 35 70

    Menos de 45 121

    Menos de 55 157

    Menos de 65 184

    Sabiendo que el empleado ms joven tiene 18 aos, escrbase la distribucin de frecuencias para

    datos agrupados (amplitud del intervalo definida segn su conveniencia).

  • 35

    Captulo 3. Medidas Caractersticas de una

    Distribucin Cuantitativa Emprica.

    3.1 Medidas de posicin

    Los promedios o medidas de posicin proporcionan valores tpicos o representativos de la

    variable en estudio. Podemos hablar de medidas de posicin centrales, como la media (aritmtica,

    geomtrica y armnica), la mediana y la moda y medidas de posiciones no centrales, como los

    cuartiles, quintiles, deciles y percentiles.

    La media aritmtica es la medida de posicin ms utilizada (esta muy influenciada por los valores

    extremos de la variable). Viene definida como la suma de los datos divido por el nmero de ellos.

    Dependiendo de la naturaleza de los datos que pretendemos promediar, ser conveniente el uso

    de otro tipo de medidas, como son la media geomtrica (Todos los datos son positivos y hay

    mucha dispersin; ejemplo: porcentajes, tasas de crecimiento, razones, nmeros ndices, inters

    anual, inflacin, etc.) y la media armnica (resulta poco influida por la existencia de

    determinados valores muy grandes que el conjunto de los otros, siendo en cambio sensible a

    valores muy pequeos), cuyas frmulas se presentan en la siguiente tabla. Si a cada observacin

    se le asigna un valor diferente, dado en forma de peso, y a continuacin se calcula la media, nos

    encontramos con una media ponderada. La moda de un conjunto de valores es aquel valor que

    ocurre con ms frecuencia. Si todos los valores son distintos, no hay moda, por otra parte, un

    conjunto de datos puede tener ms de una moda.

    Medidas de tendencia central

    Media aritmtica 1 1 2 2

    1. . . k kx x n x n x n

    n

    Media geomtrica 1 2

    1/

    1 2 . . .k

    nnn n

    kG x x x

    Media armnica

    1 2

    1 2

    . . . k

    k

    nH

    nn n

    x x x

    3.1.1. Media aritmtica.

    Es la medida ms conocida, la ms fcil de calcular y con la que siempre estamos ms

    familiarizados, ya que siempre hemos calculado el promedio de calificaciones obtenidas en cada

    periodo escolar (Ciclo, ao, etc.) A veces se le denomina simplemente media o promedio, y es

    utilizada con tanta frecuencia, que en algunas ocasiones nos conduce a resultados que no revelan

  • 36

    lo que se pretende presentar, ya que la distribucin de los datos puede requerir de la aplicacin de

    un promedio diferente a la media, ya sea, media geomtrica o media armnica.

    Le media es altamente sensible a cualquier cambio en los valores de la distribucin. No es

    recomendable su uso cuando la variable est dada en forma de tasas o porcentajes. La media es

    representativa del conjunto de datos si se quiere promediar cantidades semejantes, que presentan

    variaciones dentro de un margen razonable.

    Media Aritmtica simple. Se define como el cociente que se obtiene al dividir la suma de los

    valores de la variable por el nmero total de observaciones. Su frmula est dada por:

    1

    n

    i

    i

    x

    xn

    Ejemplo. Supongamos que en un almacn tienen empleados a 12 vendedores, y sus ingresos

    mensuales son: $ 585, $ 521, $ 656, $ 465, $ 536, $ 487, $ 564, $ 490, $ 563, $ 1234, $ 469 y $

    547. Se pide determinar la media de los ingresos de los 12 vendedores.

    Solucin.

    Ejemplo. Consideremos las utilidades y prdidas de un almacn por departamentos, como se

    muestra en la siguiente tabla.

    OBSERVACIN. El promedio por departamento se

    mantiene de un ao a otro, pero nos oculta los cambios que

    se han producido por departamentos donde ha habido un

    desplazamiento de los beneficios. Para superar estas

    deficiencias se requiere trabajar con la media ponderada.

    Media aritmtica ponderada

    Cuando el nmero de observaciones es grande, las operaciones para calcular la media se

    simplifican si agrupamos los datos en una tabla de frecuencias. La frmula matemtica est dada

    por:

    1

    k

    i i

    i

    x f

    xn

    Si los datos estn agrupados en clase, no se conoce el valor de x, por lo tanto se toma el punto

    medio de cada clase en vez de x (marca de clase).

    Propiedades de la media.

    Dada la importancia de la media y su uso frecuente, conviene considerar algunas de sus

    propiedades:

    1. La suma de las desviaciones respecto a la media es cero, esto es:

    Departamentos 2008 2009

    Calzado -10 20

    Electrodomsticos 153 58

    Juguetera -40 -20

    Ropa 130 152

    Miscelneos -13 10

    Promedio 44 44

  • 37

    Para datos no agrupados:1

    ( ) 0n

    i

    i

    x x

    Para datos agrupados: 1

    ( ) 0n

    i i

    i

    x x n

    . La verificacin de esta propiedad es inmediata.

    2. La media aritmtica de una constante es igual a la constante. 3. La media del producto de una constante por una variable, es igual a multiplicar a la

    constante por la media de la variable.

    4. La media de una variable ms (o menos) una constante ser igual a la media de la

    variable, ms (o menos) la constante, es decir, 1( )

    k

    i i

    i

    x c n

    x cn

    5. La media aritmtica de una muestra dividida en submuestras, es igual, a la media ponderada de las submuestras, tomando como ponderacin los tamaos de las

    submuestras. Esto es, 1

    1 2 ...

    m

    i i

    im

    x n

    x donde n n n nn

    Ejemplo: Un inversionista tiene 1,200 acciones de un precio inferior a $3,490 dlares

    siendo su valor promedio de $ 2,905; adems, 800 acciones cuyo valor unitario es

    superior a $ 3,490 y su valor promedio de $ 4,275. Calcular el valor promedio de las

    2,000 acciones.

    Solucin.

    1 21 2

    1 2

    2905(1200) 4275(800)3,453

    1200 800

    x n x nx

    n n

    En promedio el inversionista gasta $ 3,453 dlares en las 2000 acciones.

    3.1.2. La media geomtrica (Mg)

    La media geomtrica se define como la raz n-sima de la multiplicacin de los n valores de la

    variable. Se utiliza cuando se quiere dar importancia a valores pequeos de la variable o cuando

    se desea obtener el promedio de valores que estn dados en progresin geomtrica.

    En el campo industrial y comercial se utiliza para obtener promedios sobre el crecimiento o

    decrecimiento de una variable. Por ejemplo, un capital ahorrado a una tasa de inters compuesto,

    durante un periodo de tiempo.

    La media geomtrica se calcula utilizando la siguiente frmula: 1 2

    1 2 . . .knn nn

    kMg x x x donde los ni es el nmero de veces que se repite cada dato, en caso que los datos no se repitan los

    ni=1.La frmula de la media geomtrica tal como se ha presentado tiene el inconveniente de que

  • 38

    tanto el producto de los xi como su raz n-sima, pueden ser un valor demasiado alto que dificulte

    las operaciones. Para obviar esta dificultad se transforma la ecuacin anterior en:

    1

    ln

    exp

    k

    i i

    i

    n x

    Mgn

    . Es obvio que las dos ecuaciones son equivalentes, esta ltima

    ecuacin es la ms utilizada en el clculo de la media geomtrica.

    Ejemplo (Media geomtrica)

    Las tasas de inters de tres bonos son 5%, 7% y 4%.

    La media geomtrica es: 3 7 5 4 5.192G x x

    La Mg da una cifra de ganancia ms conservadora porque no tiene una ponderacin alta para la

    tasa de 7%.

    3.1.3. La media armnica (Ma)

    Iniciamos diciendo que el inverso de la media armnica es igual a la media aritmtica del inverso

    de los valores de la variable, esto es:

    1

    1

    1

    ki

    i i

    ki

    i i

    n

    x nMa

    nMa n

    x

    Ejemplo: Se sabe que dos obreros A y B, se tardan 50 y 40 minutos respectivamente en reparar

    un par de zapatos. Cul es el tiempo requerido para reparar un par de zapatos?

    Solucin.

    1 2

    244.44

    1 1 1 1

    50 40

    nMa Ma

    x x

    , es el tiempo requerido para reparar un

    par de zapatos.

    El mayor uso de la media armnica es para calcular la velocidad promedio. Recordemos que:

  • 39

    ndista ciaVelocidad

    tiempo , supongamos que se han recorrido k trayectos (distancias) a cierta

    velocidad cada trayecto, entonces la velocidad media vendr dada por:

    1 1

    tank k

    i i

    i ii i

    dis cia total dVm

    d d

    V V

    Ejemplo. Supongamos que la distancia entre dos ciudades, A y B, es de 80 kilmetros y entre B

    y C de 120 kilmetros. Si un automovilista recorre de A a B a una velocidad de 100Km/h y de B

    a C a una velocidad de 80Km/h. Cul es la velocidad promedio?

    Solucin.

    1

    20086.956

    80 120

    100 80

    ki

    i i

    dVm

    d

    V

    3.1.4. La moda

    La moda es una medida de posicin, menos importante que los promedios y su uso es bastante

    limitado. Se utiliza en distribuciones cuando la variable o el atributo presentan una frecuencia

    demasiado grande con respecto a las dems.

    La moda se define aquel valor de la variable o del atributo que presenta la mayor densidad, es

    decir, la mayor frecuencia.

    Si se tiene un atributo o una variable con mxima frecuencia, la distribucin es unimodal. Si hay

    dos valores en la variable con la misma frecuencia mxima, la distribucin es bimodal. Si hay

    ms de dos, la distribucin es multimodal. Cuando ninguno de los valores que toma la variable se

    repite, no existe moda.

    Datos agrupados.

    Cuando la moda se aplica a una variable continua, se requiere que la amplitud de los intervalos

    sea constante. A se presenta una frmula para obtener una aproximacin del valor modal:

    11

    1 1

    ii

    i i