nieves - probabilidad y estadistica capitulo i

20
Distribucción binomial 1 Introducción La estadística se concibe popularmente como cifras numéricas y gráficas; éstas, más bien, son algunos de los resultados de emplear una colección de ideas y métodos que configuran dicha disciplina. La estadística ayuda a tomar decisiones ante circunstancias cuyas características distin- tivas son incertidumbre y variabilidad. La primera característica se origina en la imposibi- lidad de considerar todos los factores involucrados, dada la complejidad del entorno en general. La segunda, se debe a la variación inherente en todo aquello que ocurre natural Antecedentes Concepto de variable. Manejo básico de una computadora para acceder a Excel y a Internet. Objetivos Proporcionar elementos para: Exponer las características distintivas de los diversos escenarios donde se usa la estadística. Presentar algunas de las ideas esenciales en que se sustenta y describir las ramas en que se divide. Analizar el origen y el tipo de datos con los que se trabaja, así como sus distin- tas escalas de medición. Proporcionar, mediante algunos ejemplos, una introducción a los métodos de Monte Carlo. Capítulo Introducción Secciones Introducción 1.1 Ideas de la estadística 1.2 Organización de las ideas estadísticas 1.3 Datos y escalas de medición 1.4 Planeación de un estudio estadístico 1.5 Simulación (métodos de Monte Carlo) 1

Upload: angelsergio

Post on 21-Sep-2015

43 views

Category:

Documents


3 download

DESCRIPTION

La estadística se concibe popularmente como cifras numéricas y gráfi cas; éstas más bien, son algunos de los resultados de emplear una colección de ideas y métodos que configuran dicha disciplina.

TRANSCRIPT

  • Distribuccin binomial 1

    IntroduccinLa estadstica se concibe popularmente como cifras numricas y grfi cas; stas, ms bien, son algunos de los resultados de emplear una coleccin de ideas y mtodos que confi guran dicha disciplina.

    La estadstica ayuda a tomar decisiones ante circunstancias cuyas caractersticas distin-tivas son incertidumbre y variabilidad. La primera caracterstica se origina en la imposibi-lidad de considerar todos los factores involucrados, dada la complejidad del entorno en general. La segunda, se debe a la variacin inherente en todo aquello que ocurre natural

    Antecedentes

    Concepto de variable.Manejo bsico de una computadora para acceder a Excel y a Internet.

    Objetivos

    Proporcionar elementos para:

    Exponer las caractersticas distintivas de los diversos escenarios donde se usa la estadstica.

    Presentar algunas de las ideas esenciales en que se sustenta y describir las ramas en que se divide.

    Analizar el origen y el tipo de datos con los que se trabaja, as como sus distin-tas escalas de medicin.

    Proporcionar, mediante algunos ejemplos, una introduccin a los mtodos de Monte Carlo.

    C a p t u l o

    Introduccin

    Manejo bsico de una computadora para acceder a Excel y a Internet.

    SeccionesIntroduccin

    1.1 Ideas de la estadstica

    1.2 Organizacin de las ideas estadsticas

    1.3 Datos y escalas de medicin

    1.4 Planeacin de un estudio estadstico

    1.5 Simulacin (mtodos de Monte Carlo)

    C a p t u l o

    Introduccin SeccionesIntroduccin

    1.1 Ideas de la estadstica

    Secciones1

  • Captulo 1 Introduccin2

    o cotidianamente, e, incluso, en aquello que se fabrica, independientemente del rigor con que se fijen y se lleven a cabo las condiciones de produccin.

    Con el fin de abordar la incertidumbre, la estadstica se vale del clculo de probabilida-des, creando modelos que permiten estimar los riesgos implicados en la toma de decisiones.

    Si se considera que: 1) prcticamente todas las ciencias naturales, exactas, sociales, econ-micas, de la conducta y cualquier evento de la cotidianidad, pueden enmarcarse bajo incerti-dumbre y variabilidad, y 2), que la toma de decisiones es indispensable y que tiene un efecto en la vida diaria, se puede empezar a vislumbrar la importancia del estudio de la estadstica.

    1.1 Ideas de la estadsticaDebido a que la informacin es la materia prima en la toma de decisiones, y a que los resulta-dos de aplicar una tcnica estadstica no son ms exactos que los datos o hechos en los que se basa, puede entenderse que el primer paso sea la planeacin y obtencin de informacin consistente. En general, sta es voluminosa y carente de significado a primera vista. Conviene, por tanto, incorporar la idea de orden, y en consecuencia proceder a ordenarla. Una vez hecho esto se debe resumir la informacin, a fin de poderla manejar de manera ms sencilla y gil. Con esto se pueden distinguir algunas ideas de la estadstica: planeacin, obtencin, orden y resumen de informacin, que dan lugar a tcnicas o mtodos que arrojan cifras numricas, tablas y grficas, cuya interpretacin adecuada permite describir la situacin de donde vienen los datos.

    Los datos, sin embargo, no siempre son suficientes, debido a la complejidad de las si-tuaciones en general. En consecuencia, ser inevitable trabajar bajo incertidumbre, y, por lo tanto, que los resultados numricos a los que se llegue no sean puntuales o categricos! Ejemplos de esto son: el resultado del lanzamiento de una moneda, el que la bolsa de va-lores baje o suba, el que las especificaciones de un producto manufacturado estn dadas dentro de un cierto intervalo de valores, el que el candidato de un cierto partido poltico gane una eleccin popular, el resultado de una operacin quirrgica, el movimiento en el aire de una partcula de polvo, el que se presente un terremoto, etctera.

    A este tipo de fenmenos se les conoce genricamente como aleatorios o fortuitos, con el fin de diferenciarlos de los que se han estudiado previamente, por ejemplo en fsica y qu-mica, y que suelen llamarse determinsticos, ya que hay leyes bien establecidas que permiten calcular, si se cumplen ciertas condiciones, los resultados de manera exacta. No obstante, como se ver en seguida, aun en esos casos es inevitable trabajar bajo incertidumbre, debido a varias causas, como la imposibilidad de cumplir con las condiciones requeridas; otras ms son la precisin de los instrumentos con los que se trabaja, las condiciones naturales y las fallas humanas. Para ver esto, se emplea un ejemplo sencillo de la fsica elemental, cuyos resultados por lo regular pueden considerarse exactos.

    Ejemplo 1.1 La ley de Ohm establece que: V = R I, por lo cual, si I = 5 mA y R =1 k, entonces V = 0.005 1 000 = 5 volts.

    El resultado anterior es vlido siempre y cuando la resistencia que se emplee valga exactamente 1 k. Sin embargo, en la prctica se sabe que una resistencia se especifica

    por su valor nominal (que significa valor prome-dio) y su tolerancia (por ejemplo 10%, 5% o 1%). Si se asume que la resistencia que se usa tiene una tolerancia de 5%, el clculo anterior arrojara: V = 0.005(1 000 50) =5 0.25 volts. Es de-cir, que tener incertidumbre en el valor exacto de R, provoca variabilidad en los resultados (voltaje). De un resultado preciso de 5 volts se ha pasado a una estimacin mediante un rango de valores: [4.75, 5.25] volts.

    R = 1000 50

    Resistencia elctrica

  • 31.2 Organizacin de las ideas estadsticas

    Debido a la vaguedad o incertidumbre de los resultados, la estadstica se vale del clcu-lo de probabilidades, ya que ste surge y se desarrolla alrededor de fenmenos aleatorios (juegos de azar), logrando un concepto para cuantificar la incertidumbre, llamado probabi-lidad, que suele definirse como la medida de lo posible. La estadstica y el clculo de pro-babilidades proporcionan conceptos y mtodos para estudiar y modelar la variabilidad, y para medir la incertidumbre de los fenmenos aleatorios. Esto da lugar a expresar el riesgo de las decisiones que se tomen al usar los valores que se empleen como resultados.

    1.2 Organizacin de las ideas estadsticasDe acuerdo con el tipo de situacin y los objetivos del estudio, la estadstica se divide habitualmente en estadstica descriptiva e inferencial. Se busca, sin embargo, resaltar una serie de tcnicas estadsticas conocidas como anlisis exploratorio de datos, ya que tienen elementos, mtodos y objetivos propios que pueden complementar la estadstica descrip-tiva e inferencial. Se empezar entonces con el anlisis exploratorio de datos y luego con las divisiones tradicionales.

    Anlisis exploratorio de datosEl anlisis exploratorio de datos (AED) es la parte ms actual de las tcnicas estadsticas, caracterizada por su sencillez debida principalmente a: 1) el empleo de grficas y la reduccin del uso de frmulas algebraicas, y 2) a que requiere muy pocas consideraciones previas sobre los datos. Estos dos aspectos hacen del AED un elemento ideal en la ex-ploracin preliminar de un conjunto de datos.

    El AED enfatiza la importancia de organizar y desplegar los datos grficamente, de modo tal que se puedan percibir valores distintivos, como valores extremos, atpicos (valores especiales), conglomerados (grupos de datos muy cercanos entre s) y brechas (se-paraciones de magnitud considerable entre conglomerados), as como la identificacin de patrones globales. Esto da lugar al planteamiento de preguntas que quiz no hubieran surgido antes.

    Por ejemplo, si un conjunto de datos tiene la representacin grfica llamada de puntos:

    Independientemente de lo que representen los datos, se puede apreciar en el diagrama que hay un valor considerablemente mayor que todos (30) y que puede verse como atpico; que se tienen dos conglomerados o racimos (un grupo de 5 valores iguales y un grupo de 3 valores iguales), y que hay brechas entre los valores de 7 y 11, y 11 y 30. A partir de esto, se puede aadir que el valor atpico es prcticamente 3 veces ms grande que el va-lor ms cercano a l, y que convendra averiguar las caractersticas de los racimos y qu representan los huecos.

    En otro caso, se puede considerar que se tienen las siguientes grficas de tallos y ho-jas. La lectura de los valores se hace con el primer nmero de la columna de la izquierda y alguno de los de las columnas derechas; por ejemplo, en el arreglo de campana, en la segunda fila, el primer elemento es 6, y si se toma la tercera columna de la derecha, es 9; entonces se tiene el valor 69:

    0 5 10 15 20 25 30 35

  • Captulo 1 Introduccin4

    En el primer caso se puede ver que los valores de los datos son ms o menos simtricos, balanceados los bajos con los altos. En el segundo caso, los datos siguen una distribucin en forma de U, y puede deberse a que subyacen en realidad dos grupos, cada uno en forma de campana. Por tanto, cuando una grfica tiene forma de U, conviene ver si hay alguna razn para tratar las observaciones como dos grupos separados.

    Estadstica descriptivaLa estadstica descriptiva se emplea para describir las caractersticas bsicas de los datos en estudio. Por medio de grficas y valores numricos calculados algebraicamente (me-dia, desviacin estndar, proporcin, etc.), proporciona resmenes simples de los datos de que se dispone. En la estadstica descriptiva simplemente se describe lo que son o lo que muestran los datos. Por tanto, puede decirse que la estadstica descriptiva es una serie de mtodos para organizar, resumir y presentar datos de manera informativa.

    Por ejemplo, en un centro de verificacin vehicular se pueden registrar las emisiones de HC y CO de un lote de automviles de pasajeros. Se pueden usar estos datos para analizar el promedio de emisiones del lote, hablar acerca de los mrgenes de emisiones o presentar cualesquiera otras medidas de datos para el lote con base en el registro.

    La mayor parte de las estadsticas deportivas, como el promedio de bateo, rebotes y nmero de goles, son estadsticas descriptivas, porque se usan para describir el esfuerzo de un individuo o de un equipo. Muchos de los datos estadsticos generados en la industria y los negocios son descriptivos. Podran incluir el nmero de empleados en vacaciones durante el mes de diciembre, el promedio de salario en un rea administrativa, las ventas corporativas para 2011 y el promedio de calificacin de satisfaccin gerencial sobre un censo de las actitudes de los empleados de la compaa.

    Conjuntamente con el anlisis exploratorio de datos, la estadstica descriptiva forma hoy en da las bases de prcticamente cualquier anlisis cuantitativo de datos.

    Estadstica inferencialMientras que en la estadstica descriptiva el resumen de los datos no pretende ni implica ir ms all de los datos de que se dispone, en la estadstica inferencial el objetivo es describir la poblacin totalidad de los elementos de inters, con base en la informacin obtenida mediante la observacin de relativamente pocos elementos individuales de la poblacin (muestra). A este proceso se le llama estimacin de parmetros poblacionales.

    Una aplicacin de la estadstica inferencial puede ser en una investigacin farmacuti-ca. Para probar un nuevo medicamento, los investigadores pueden disear experimentos con un cierto nmero de pacientes, seleccionados al azar a fin de que la muestra sea re-presentativa, y as reducir (no eliminar) la incertidumbre; tratar de llegar a conclusiones y hacer inferencias acerca de la poblacin a la que va dirigido el medicamento.

    Los investigadores de mercado utilizan estadstica inferencial para estudiar la repercu-sin de la publicidad en diferentes segmentos del mercado, mediante muestras aleatorias de dichos segmentos.

    Sinnimos de Inferir:ConcluirDeducirColegirDerivarPredecirDesprender

    6|9representa 69

    4|5 representa 45

    5 46 6 9 97 2 4 4 5 5 98 1 1 79 8

    Forma de campana Forma de U

    2 5 5 8 93 2 3 4 4 5 8 94 0 3 4 5 95 46 1 1 3 87 0 1 3 4 4 5 6 8 88 2 3 59 4

  • 51.3 Datos y escalas de medicin

    Estadstica inferencial y probabilidadSe pueden distinguir dos aspectos bsicos de la estadstica inferencial: primero, el hecho de que la recoleccin de los datos debe realizarse de tal modo que la muestra obtenida sea representativa de la poblacin subyacente, y, segundo, el que los procedimientos inferen-ciales deban permitir enunciar conclusiones respecto de la poblacin, con cierto nivel de confianza.

    El primer aspecto se resuelve al tomar muestras aleatorias de la poblacin (vea captulo 2), con lo cual se prepara el camino para resolver el segundo aspecto, mediante el uso de la teo-ra de la probabilidad. Esto es as debido a que en la teora de la probabilidad se parte del he-cho de que se conocen las propiedades de la poblacin en estudio y se formulan y responden preguntas en trminos de probabilidades, en relacin con una muestra tomada aleatoria o ca-susticamente de la poblacin. Estos resultados son empleados por la estadstica inferencial, ya que se trata del proceso inverso: ir de la muestra a la poblacin con cierta probabilidad (nivel de confianza). Con esto se puede ver la importancia de que la muestra sea aleatoria, ya que de otra manera sera imposible usar la teora de la probabilidad. La figura 1.1 ilustra esto.

    Observe que en estadstica inferencial se estudia la muestra, pero el objetivo principal lo constituye la poblacin.

    Figura 1.1Relacin entre estadstica inferencial y probabilidad

    1.3 Datos y escalas de medicinSiendo los datos los hechos y nmeros que se renen, analizan e interpretan, conviene reflexionar acerca de ellos; para esto, se empezar atendiendo su origen y tipo.

    Origen de los datosEn cuanto al origen de los datos, puede ser un conjunto de personas, animales, plantas, objetos o incluso nmeros correspondientes a mediciones, dependiendo de dnde se centre el inters del estudio. Independientemente de la naturaleza de los elementos (entidades) del conjunto de estudio, a la totalidad suele llamrsele poblacin. As, una poblacin pueden

    Actividad 1.1 A una muestra aleatoria de 400 personas se les dio a probar una nueva sopa instantnea. De las 400 personas 250 dijeron que era buena; 50 opinaron que era regular y el resto de las personas no dieron ninguna opinin. Con base en los resultados de la muestra, infiera la reaccin de todos los clientes potenciales de la nueva sopa.

    Observe que en estadstica una poblacin no necesariamente es de personas.

    Muestra aleatoria

    Prob

    abilid

    ad

    Estadstica

    inferen

    cial

    Poblacin

  • Captulo 1 Introduccin6

    ser los jugadores que han ganado el ttulo de goleo en cada una de las copas del mundo que se han realizado; los coyotes de la Reserva de la Biosfera de Mapim, en Durango; la cosecha de aguacate de una huerta en el estado de Michoacn; un lote de productos ma-nufacturados en un turno en una empresa, o las concentraciones de ozono medidas cada hora en un cierto da de la semana en una ciudad altamente contaminada, como el Distrito Federal, Guadalajara o Monterrey.

    Como se ha visto anteriormente, no siempre es posible estudiar a toda la poblacin, de modo que usualmente se emplea un subconjunto de elementos, en cuyo caso se dice que se emplea una muestra.

    Ventana al conocimiento

    Desde los tiempos ms remotos, ha sido funcin de los gobier-nos llevar a cabo registros de poblacin, ganado, tierras, cose-chas, impuestos, etc. Contar y medir estos hechos, sin embar-go, genera muchas clases de datos numricos y actividades a realizar con ellos. No resulta entonces extrao saber que en el siglo XVI el trmino estadstica se deriv del vocablo italiano statista (estadista), ya que a fi n de cuentas es quien se encarga de administrar el stato (estado). A esta primera etapa del desa-rrollo de la estadstica se le conoce como de los censos.

    Los gobiernos de hoy en da siguen siendo los ms grandes recolectores de informacin, y para ello cuentan

    con diferentes secretaras e institutos; por mencionar slo dos, en Mxico se tiene la Secretara de Hacienda y Crdito Pblico (SHCP) y el Instituto Nacional de Estadstica, Geo-grafa e Informtica (INEGI).

    Despus del Estado se pueden considerar como reco-lectores importantes de informacin las universidades; las organizaciones deportivas, la industria, el comercio, las aseguradoras de vidas y bienes, las agencias especializa-das en encuestas entre las que destacan, a nivel inter-nacional, Gallup, y a nivel nacional, Demotecnia de Mara de las Heras, etctera.

    Existen algunas fuentes de datos ya recabados a donde se puede acudir a consultarlos. Se dan en seguida algunos sitios de inters.

    En resumen, 1) los datos pueden tener prcticamente cualquier origen, lo cual permite ver la universalidad de la estadstica, y 2) es importante establecer si corresponden a la poblacin o a una muestra de sta.

    Sitios en los que se pueden encontrar datos e informacin de inters:

    www.inegi.gob.mxwww.femexfut.org.mxwww.unam.mx/www.imp.mx/petroleowww.uacm.edu.mxwww.conacyt.mx

  • 71.3 Datos y escalas de medicin

    Tipo de datosEl tipo de datos lo definen los atributos en los que se tiene inters respecto a los elementos de la poblacin. As, en la poblacin de campeones de goleo, un atributo puede ser el nom-bre y otro la nacionalidad; uno ms el nmero de goles anotados, y otros dos el nmero de minutos jugados y los minutos en que anotaron sus goles. Cualquiera que sea el atributo o caracterstica, se puede esperar variacin en los resultados: es difcil que la nacionalidad de los anotadores sea la misma, que el nmero de goles con el que ganaron sea igual y, toda-va ms difcil, que las anotaciones hayan sido en el mismo minuto. Se puede entonces ver el atributo de inters como una variable. As, se tiene la variable nacionalidad, la variable minutos jugados, etctera.

    Las variables pueden clasificarse como cualitativas o cuantitativas. En una variable cuali-tativa, la medicin describe un elemento, colocndolo en una categora o grupo. En una va-riable cuantitativa, en cambio, la medicin da valores numricos con los cuales pueden rea-lizarse operaciones, como la suma o el promedio. Siguiendo el ejemplo de los campeones de goleo, variables como el nombre y la nacionalidad son cualitativas, mientras que el nmero de anotaciones y el nmero de minutos jugados corresponden a variables cuantitativas.

    Quizs hasta ahora el trmino medicin se asocie, en matemticas, con comparar una cantidad con su respectiva unidad, con el fin de averiguar cuntas veces la segunda est conte-nida en la primera. En este orden de ideas, se concibe una escala como una sucesin ordenada de valores consecutivos, cuya diferencia de dos cualesquiera es la unidad. Esto funciona bien para las variables cuantitativas en donde la medicin da lugar a nmeros; no obstante, a fin de abarcar las variables cualitativas, se amplan a continuacin los conceptos de medicin y de escalas.

    Escalas de medicin: nominal, ordinal, de intervalo y de raznLa medicin se define como el acto de asignar nombres o nmeros a los elementos de la poblacin de inters, de acuerdo con ciertas reglas; sin embargo, no siempre se tienen uni-dades de medida para establecer cuntas veces es mayor un nombre que otro. Atendiendo a la relacin entre los nombres o nmeros asignados, se tienen diferentes escalas o niveles de medicin. Tales escalas son: nominal, ordinal, de intervalo y de razn (puede usarse el recurso mnemnico no ir para recordar las escalas).

    Escala nominal

    En algunos casos los atributos de inters o las variables consisten en nombres o etiquetas, y las observaciones (mediciones) nicamente se pueden clasificar. No hay, sin embargo, un orden particular para las distintas clasificaciones o categoras. Por ejemplo, si se tiene inters en el sexo de los pollos recin nacidos, la variable sexo se puede clasificar en pollo y polla, pero el orden no tiene un significado relevante, ya que pudo haberse dado como polla y pollo. Tambin pudo haberse clasificado la variable sexo como A o B. Si por simplicidad se hubiera clasificado como 1 o 2, tales nmeros slo serviran para indicar las categoras, ya que si se realizaran clculos aritmticos con estos cdigos, los resultados no tendran un significado numrico.

    En la escala nominal la medicin consiste en asignar smbolos que pueden ser letras, nombres o incluso nmeros (sin que haya relaciones matemticas entre ellos). Se puede, sin embargo, contar el nmero de observaciones de cada clase o categora, y utilizar las fre-cuencias o porcentajes de las categoras en alguna actividad de presentacin o de anlisis. Por ejemplo, se puede contar cuntos pollos y cuntas pollas resultaron en una nidada.

    Por ejemplo, se desea conocer el tipo de calculadora que usan los estudiantes de una facultad de ingeniera. Se puede tomar como variable la marca, por lo que una clasifica-

    N O I R o r n a m d t z i i e n n r n a a v l l a l o

  • Captulo 1 Introduccin8

    cin posible (valores de la variable) es: CASIO, HP, TEXAS, OTRA. Las observaciones que se obtendran en una encuesta entre los estudiantes seran los nombres: CASIO, HP, TEXAS, OTRA.

    El nombre de los datos no permite establecer unidades, ni decir que uno es mayor o menor que otro; por tanto, no pueden ordenarse ni mucho menos realizarse clculos num-ricos con ellos (la ordenacin CASIO, HP, TEXAS, OTRA en la figura 1.2a) es arbitraria). El conteo, sin embargo, del nmero de estudiantes que usan cada tipo de calculadora (fi-gura 1.2b), puede servir para algn tipo de ordenacin o anlisis en la presentacin de los resultados de la encuesta.

    En general, las categoras de esta escala son mutuamente excluyentes, esto es, que cual-quiera de los elementos pertenece a solamente una de las categoras. Una calculadora no puede ser TEXAS y HP.

    Las categoras son tambin exhaustivas; esto es, que cada miembro de la poblacin o de la muestra debe aparecer en una de las categoras. As, si una calculadora no es CASIO, ni HP, ni TEXAS, cae entonces en la categora OTRA.

    Figura 1.2a)Escala nominal

    Mutuamente excluyenteUn elemento o su medicin pertenece nicamente a una categora.

    ExhaustivasCada elemento debe pertenecer a una de las categoras.

    Elementos ElementosEstudiantes Estudiantes

    Variable Variable

    Datos DatosCASIO CASIOHP HPTEXAS TEXASOTRA OTRA

    Ningunaa) b) 215 322 925 156

    Relacin Relacin

    Calculadora Calculadora

    Escala ordinal

    Al igual que en la escala nominal, la medicin en la escala ordinal consiste en asignar smbolos que pueden ser letras, nombres o incluso nmeros. Ejemplos de datos que co-rresponden a esta escala son las encuestas que hacen los sitios de Internet (Yahoo, Msn, Hotmail, etc.), en las que se pide categorizar una pelcula, un artculo publicado por ellos o una opinin respecto de una propuesta de ley. Otro ejemplo se da en la tabla 1.1, que es una lista de los valores del atributo o variable desempeo con que los alumnos clasificaron al profesor que les imparti el curso de probabilidad. Cada estudiante en la clase contest a la pregunta Cmo consideras el desempeo del profesor del curso de probabilidad? Se les recomend que utilizaran los siguientes criterios: asistencia y puntualidad; respeto hacia los alumnos; dominio del tema; didctica y congruencia de los exmenes que aplic. El resultado de aplicar estos criterios debera clasificar al profesor como excelente, muy bueno, bueno, regular o malo.

    En resumen, las caractersticas de las variables del nivel ordinal son:

    1. Las categoras que se usan para las variables son mutuamente excluyentes y exhaus-tivas. Un objeto pertenece a una y slo una categora.

    2. Las categoras no guardan un orden lgico entre ellas que permita, por ejemplo, ordenarlas.

  • 91.3 Datos y escalas de medicin

    A diferencia de la escala nominal, se puede distinguir una relacin entre las clasifica-ciones, ya que excelente es mejor que muy bueno, muy bueno es mejor que bueno, y as sucesivamente. Esta relacin entre los valores de la variable desempeo puede expre-sarse mediante el smbolo relacional > (se lee mayor que):

    excelente > muy bueno > bueno > regular > malo

    Sin embargo, ya que no hay unidades, no se pueden distinguir las diferencias entre atributos. Es la diferencia entre excelente y muy bueno la misma que entre muy bueno y bueno? No se puede decir.

    Si se sustituye excelente con 5 y muy bueno con 4, y as sucesivamente, se puede concluir que la calificacin de 5 es mejor que la calificacin de 4, pero no se puede agregar una connotacin numrica que indique qu tanto es mejor 5 que 4. Ms an, no se puede concluir que una calificacin de 4 (que corresponde a muy bueno) sea necesaria-mente dos veces mejor que una calificacin de 2 (que corresponde a regular). Como en la asignacin con palabras, slo se puede concluir que una calificacin de 4 es mejor que una calificacin de 2, pero no cun mejor es.

    Observe que, al igual que en la escala ordinal, el conteo de las observaciones de cada categora da la frecuencia (vea la tabla 1.1), lo cual permite un cierto manejo de las catego-ras; por ejemplo, presentarlas grficamente.

    Tabla 1.1 Resultados de la evaluacin de un profesor de probabilidad

    Desempeo Nmero de alumnos (cuenta)

    Excelente 5

    Muy bueno 25

    Bueno 6

    Regular 2

    Malo 4

    Total 42

    Escala de intervalo

    La escala de intervalo posee todas las caractersticas de la escala ordinal, con la propie-dad adicional de que los nombres o smbolos asignados son generalmente nmeros, y la diferencia entre dos de ellos da resultados significativos, ya que hay una unidad de medi-da comn y constante. Un ejemplo de medicin con escala de intervalo es la lectura de temperaturas en grados Celsius o Fahrenheit. Suponga que las temperaturas mximas en Celaya en cuatro das de invierno sean 15, 20, 16 y 21 grados Celsius. Estas tempera-turas se pueden ordenar fcilmente, pero tambin se puede determinar la diferencia entre temperaturas y darle un sentido; por ejemplo, la diferencia entre 15 y 16 grados Celsius es la misma que entre 30 y 31 grados Celsius, independientemente de la posicin que ocu-pan ambas parejas en la escala. Consecuentemente la diferencia, por ejemplo, entre 13 y 20 grados Celsius, es la misma que entre 22 y 29 grados Celsius. Asimismo, la suma y la

    En resumen, las caractersticas de las variables del nivel ordinal son:

    1. Las categoras son mutuamente excluyentes y exhaustivas.2. Las categoras pueden ordenarse de mayor a menor (o viceversa), de acuerdo con la

    caracterstica especial que poseen.

    Escalas de temperaturas.

  • Captulo 1 Introduccin10

    Escala de razn

    La escala de razn es el nivel de medicin ms alto; tiene todas las caractersticas de la escala de interva-lo, pero, adems, tiene un punto cero natural o te-rico. Por consiguiente, adems de las diferencias y las sumas, la multiplicacin y la divisin de los datos tienen significado numrico racional. Variables como unidades de produccin e ingresos de una empresa o negocio se expresan como medidas de razn. Si se tienen cero unidades de produccin no se tiene nin-guna unidad. Mediciones tales como la longitud y el peso tambin se miden en escala de razn, puesto que en ambos casos hay un cero terico que significa ausencia del atributo. La relacin entre dos nmeros tambin tiene sentido. Si Federico gana 30 000 pesos

    al mes y Antonio gana 10 000 pesos al mes, entonces Federico gana el triple de lo que gana Antonio (vea actividad 1.3).

    media aritmtica tienen sentido. Por lo tanto, suele hablarse de la temperatura media, por ejemplo en el invierno en una cierta ciudad.

    Por otro lado, para la escala de intervalo no hay un punto inicial intrnseco o natural. El cero es un punto elegido arbitrariamente y no representa la ausencia de la condicin. En la escala de temperatura Celsius, el valor de cero grados Celsius no indica la ausencia de calor. Esta falta de un cero natural impide que se pueda decir o establecer que 80 grados sea dos veces ms caliente que 40 grados, aun siendo el valor del atributo dos veces mayor (vea ejemplo 1.2).

    Escala de gramos. Escala de centmetros.

    Actividad 1.2 Los ceros de las escalas Celsius y Fahrenheit, representan la misma temperatura?

    Conoce alguna escala de medicin de temperatura con un cero que signifique au-sencia de calor?

    En resumen, las propiedades de la escala de intervalo son:

    1. Las categoras son mutuamente excluyentes y exhaustivas.2. Las categoras estn ordenadas de acuerdo con la cantidad de la caracterstica que

    poseen.3. Diferencias iguales en las caractersticas estn representadas por diferencias iguales

    en los nmeros asignados a las categoras.

    Ejemplo 1.2 Para elevar la temperatura de un cuerpo de 40 a 80C, se requiere el doble de calor que para elevar la temperatura del mismo cuerpo de 40 a 60C; sin embargo, el cuerpo no tendr el doble de calor a 80 que a 40C, debido a que a 40C tena una can-tidad de calor, digamos 100 Kcal y para llevarlo a 80C, pudieron requerirse 500 Kcal; luego entonces, tiene 500 + 100 = 600 Kcal. Para llevarlo de 40 a 60C se requirieron 250 Kcal. Consecuentemente el calor a 60C es 250 + 100 = 350 Kcal.

  • 111.3 Datos y escalas de medicin

    Por qu son importantes las escalas de medicin?La relevancia de las escalas de medicin de los datos, es que indican los clculos y las actividades grficas que se pueden realizar con ellos para poderlos explorar, organizar, resumir y presentar. De la misma forma, las diferentes pruebas de inferencia estadstica aplicables a los datos, exigen diferentes niveles de medicin. Mientras que la mayora de las pruebas estadsticas en ingeniera y ciencias exigen mediciones de intervalo o de razn (pruebas paramtricas), hay otras pruebas que se han diseado para las ciencias de la con-ducta que utilizan datos nominales u ordinales (pruebas no paramtricas).

    Actividad 1.3 Discutir con sus compaeros sobre la siguiente pregunta:Es el capital de Federico el triple del capital de Antonio?

    Ejemplo 1.3 Mostrar que en las escalas de razn (centgrada y Fahrenheit) las pro-porciones de diferencias de temperatura son independientes de la unidad de medida y del punto cero.

    Solucin

    Algunas equivalencias entre las escalas Celsius y Fahrenheit son:

    Celsius 0 10 20 30 40 100Fahrenheit 32 50 68 86 104 212

    La proporcin de las diferencias entre las lecturas de una escala es igual a la propor-cin entre las diferencias correspondientes de la otra. Por ejemplo, en la escala centgrada la proporcin de las diferencias entre 40 y 20, y 10 y 0 es

    40 20 = 2 10 0

    Las lecturas correspondientes en la escala Fahrenheit son: 104, 68, 50 y 32, de donde

    104 68 = 2 50 32

    Si bien no es una prueba formal, estos ejemplos pueden ayudar a plantear la prueba de manera matemtica, en caso de ser de inters.

    Actividad 1.4 Establecer el nivel de medicin de la escala que se utiliza para las fechas.

    En resumen, las propiedades de la escala de razn son:

    1. Las categoras son mutuamente excluyentes y exhaustivas.2. Las categoras estn ordenadas de acuerdo con la cantidad de la caracterstica que

    poseen.3. Diferencias iguales en la caracterstica estn representadas por diferencias iguales

    en los nmeros asignados a las caractersticas. 4. El punto cero refleja la ausencia de esa caracterstica.

  • Captulo 1 Introduccin12

    1.4 Planeacin de un estudio estadsticoAl recolectar datos para un estudio estadstico se debe distinguir el tipo de estudio que se quie-re llevar a cabo; es posible tener dos tipos: estudios experimentales y estudios observacionales.

    Estudio experimentalEn un estudio experimental se impone deliberadamente un tratamiento en los elementos, a fin de observar un cambio posible en la respuesta o variable medida. Como un ejemplo se puede citar un estudio comunitario que se llev a cabo en Chile en 1994 para deter-minar la efectividad del uso de productos lcteos fluorados (PLF), distribuidos mediante programas nacionales de alimentacin complementaria, con el fin de lograr una disminu-cin de la caries dental infantil en zonas rurales (http://ccp.ucr.ac.cr/cursos/epidistancia/contenido/7_epidemiologia.htm). Se determinaron los ndices de prevalencia de caries den-tal de dos comunidades rurales: en una, los nios recibieron PLF y en otra no (comunidad testigo). Despus de tres aos se compararon los ndices de prevalencia de caries dental en ambas comunidades y se analizaron los resultados a fin de concluir y tomar decisiones.

    Dada la complejidad de este tipo de estudios, el diseo del experimento requiere controlar algunas otras posibles causas del efecto. En experimentos mdicos una de estas causas es el efecto placebo, que consiste en el mejoramiento o respuesta favorable del paciente cuando en realidad est recibiendo una pldora de azcar (factor psicolgico). A fin de reducir este tipo de efectos se recurre a asignacin aleatoria (esto es, a un proceso casustico cuidadosamente aplicado) que le da a cada sujeto la misma probabilidad (oportunidad) de recibir el tratamiento o el placebo, y generalmente se tiene una evaluacin doblemente ciega (esto es, un arreglo bajo el cual ningn sujeto, ni los mdicos que los evalan, saben quines han estado recibien-do el tratamiento real y quines el placebo). En esas condiciones, como se ha dicho dicho anteriormente, el resultado obtenido podra ser evaluado usando la teora de la probabilidad.

    Estudio observacionalEn un estudio de observacin, las observaciones o mediciones de los elementos se verifican de modo tal que no se modifica la respuesta o variable medida. Ejemplos de este tipo son los estudios astronmicos y los censos. Un ejemplo clsico de un estudio observacional es

    Actividad 1.6 Clasifique los siguientes datos con alguno de los cuatro niveles de medicin vistos:

    Losgradosenelejrcito(cabo,sargento,soldadoraso). Elestatussocioeconmico. Lamedidadelacinturadeunapersona. Eldiagnsticodeunpacientecomoesquizofrnico,paranoico,maniaco-depresivoo

    neurtico. Losnmerosdelosuniformesdelosfutbolistas. Lasplacasdelosautomviles. Ladensidaddeunasustancia.

    Actividad 1.5 Si se tuviera una escala de temperatura cuyo cero representara au-sencia de calor, convertira esto a las temperaturas registradas en datos de nivel de razn? Busque en internet si existe este tipo de escala y en dnde se usa.

  • 131.5 Simulacin (mtodos de Monte Carlo)

    el que explora la correlacin entre fumar y el cncer de pulmn. En este caso, los investi-gadores recogeran, a lo largo del tiempo, observaciones de fumadores y no fumadores, y luego observaran los casos de cncer de pulmn que ocurrieron en ambos grupos.

    Debido a la complejidad de las situaciones, al volumen masivo de datos que pueden obtenerse y a la incertidumbre, la computadora se ha convertido hoy en da en una herra-mienta fundamental en el manejo y la presentacin de la informacin. Ms an, permite simular las situaciones y obtener estimaciones de problemas que de otra manera sera prcticamente imposible abordar.

    1.5 Simulacin (mtodos de Monte Carlo)La simulacin representa hoy en da una de las herramientas didcticas y de clculo ms importantes de la estadstica. Puede verse como una reproduccin numrica o represen-tacin de un fenmeno del mundo real. Se emplea para dar solucin a prcticamente cual-quier tipo de problema, ya sea aleatorio o determinstico. Una caracterstica distintiva es el empleo de nmeros aleatorios, y suele llamrseles mtodos de Monte Carlo, en referencia con el casino de Monte Carlo, en Mnaco. A continuacin se resuelven dos ejemplos a fin de mostrar estos mtodos.

    Ejemplo 1.4 (Con informacin de J.A. Paulos. Ms all de los nmeros, Barcelona, 1993, Tusquets, 166-168.) Se sabe que un jugador de bsquetbol encesta 40% de sus tiros. Si en un partido hace 20 tiros, cul es la probabilidad de que enceste exactamente 9 veces? Hay clculos estndar que permiten obtener la respuesta (en Excel la instruccin =DISTR.BINOM(9,20,0.4,FALSO) da como resultado 0.15973848, vea captulo 8). Hay, sin em-bargo, otro mtodo que, aunque en este caso no es necesario, a veces es el nico mtodo de abordar un problema. En el caso planteado supondra pedir al jugador que jugara unos 10 000 partidos de 20 tiros para poder determinar el porcentaje de veces en las que encesta exactamente 9 veces.

    Como la propuesta anterior es imposible para un ser humano, podra simularse la si-tuacin y obtener una estimacin del resultado. Para ello se considera que un tiro del jugador puede simularse, por ejemplo, generando aleatoriamente un nmero comprendido entre 1 y 10; esto puede llevarse a cabo mediante la instruccin en Excel: =ALEATORIO.ENTRE(1,10), como se ve en seguida:

    Puede verse esta instruccin de Excel, equivalente a lanzar un dado de 10 caras en una de las cuales hay un punto, en otra dos puntos, etc., y anotar el nmero de puntos de la cara del dado que qued hacia arriba en el lanzamiento (8 en el ejemplo).

    De los 10 nmeros posibles, 4 cualesquiera de ellos representan 40%; dgase entonces que sean 1, 2, 3 y 4. Por lo tanto, si sale alguno de ellos se interpreta como que el jugador encest; si sale en cambio alguno de los restantes nmeros: 5, 6, 7, 8, 9 o 10, se dice que el jugador fall el tiro. Para simular 20 tiros (un juego), llvese el puntero al pequeo cuadro negro ubicado en la esquina inferior derecha de la celda A1, con lo que la forma del pun-tero cambiar a una cruz negra , como se indica en la siguiente figura:

    D un clic y arrastre el ratn hacia la derecha hasta la celda T1. En las celdas A1 a T1 se obtendr un grupo de 20 nmeros aleatorios:

    Nicholas C. Metropolis (1915-1999)Conocido por sus contribu-ciones originales al cam-po de las matemticas y la fsica, siendo algunas de ellas el mtodo de Monte Carlo y el desarrollo de las primeras computado-ras digitales electrnicas de alta velocidad. MANIAC I y MANIAC II.

  • Captulo 1 Introduccin14

    Actividad 1.7 Para llevar a cabo la simulacin de 1 000 partidos descritos en el ejemplo 1.4, siga las siguientes instrucciones en Excel:

    SealelasceldasA1aT1(genereunmarconegroquecubrelasceldas). Arrastreelpequeocuadronegrodelaesquinainferiorderechadelmarco(esten

    la celda T1) hasta la celda T1 000. Escribalainstruccin:=SI(CONTAR.SI(A1:T1,

  • 151.5 Simulacin (mtodos de Monte Carlo)

    Se sugiere ensayar con un nmero de lanzamientos que pueden ir desde 1 hasta 100 000 o ms. Ensaye, divirtase y concluya.

    El clculo de puede parecer trivial; no obstante, da una idea de la sencillez y del poder de los mtodos de Monte Carlo. Por ejemplo, puede utilizarse para calcular el rea

    bajo la curva de la funcin 12 e x

    2

    2 (curva de Gauss), la cual no puede ser integrada ana-

    lticamente y los valores reportados en tablas (vea apndice D) se calculan por mtodos de integracin muy sofsticados llamados numricas. Con los mtodos de Monte Carlo puede obtenerse una aproximacin tan buena como se desee dependiento del nmero de puntos del instrumento de clculo. El programa 5.3 permite ensayar con esta y otras funciones, como se ve en la siguiente intefase.

    Ventana al conocimiento

    El mtodo de Monte Carlo es un mtodo no determinstico o estadstico numrico usado para aproximar expresiones ma-temticas complejas y costosas de evaluar con exactitud. El mtodo se llam as en referencia al Casino de Monte Carlo (Principado de Mnaco), por ser la capital del juego de azar, y ser la ruleta (cono de los casinos) un generador simple de nmeros aleatorios. El nombre y el desarrollo sistemtico de los mtodos de Monte Carlo datan aproximadamente de 1944, y se mejoraron enormemente con el desarrollo de la computadora.

    El uso de los mtodos de Monte Carlo como herramienta de investigacin, proviene del trabajo realizado en Los lamos en el desarrollo de la bomba atmica durante la Segunda Guerra Mundial. Este trabajo conllevaba la simulacin de proble-mas probabilsticos de hidrodinmica concernientes a la difusin de neutrones en el material de fusin, la cual posee un comportamiento eminentemente aleatorio. En la actualidad es parte fundamental de los algoritmos de trazado de rayos para la generacin de imgenes sintticas y de la solucin de mltiples problemas.

  • Captulo 1 Introduccin16

    1.1 Elabore una lista de 5 fenmenos determinsticos y 5 fenmenos aleatorios o casusticos.

    Determinsticos

    Aleatorios

    1.2 La cada de los cuerpos es un fenmeno generalmente determinstico. Revise las condiciones bajo las cuales se cumplen las leyes que gobiernan este fenmeno. Discuta en equipo las siguientes preguntas: en realidad cree que se puedan cumplir esas condiciones? Esperara entonces valores exactos al aplicar las leyes? Cmo es que utilizando esas leyes de la fsica se pudo poner un hombre en la luna y regresarlo a la Tierra?

    1.3 Explique la diferencia entre una muestra y una poblacin.

    1.4 A qu rama de la estadstica corresponden los siguientes resultados:

    a) La Tierra se ha calentado en los ltimos 100 aos alrededor de medio grado Celsius. De seguir esta ten-dencia, para el ao 2100 el planeta se calentara entre 2 y 4.5 grados Celsius, con lo que aumentara el nivel del mar, cambiando los patrones de lluvia y aumentando los eventos climticos, como las ondas de calor, las lluvias torrenciales y las sequas, por ejemplo. (Con informacin de Cecilia Conde, Mxico y el cambio climtico global, Direccin General de Divulgacin de la Ciencia, UNAM, 2006, p. 18.)

    Problemas

    Glosario

    Anlisis exploratorio de datos Mtodos tabulares, grfi cos y numricos para explorar datos.

    Conjunto de datos Todos los datos reunidos en determinado estudio.

    Datos Los hechos y nmeros que se renen, analizan e interpretan.

    Elemento Las entidades acerca de las que se renen datos.

    Escala de intervalo Una escala de medicin para una variable que tiene las propiedades de los datos ordinales y el intervalo entre observaciones se expresa en trminos de una unidad comn y fi ja de medida. Los datos de intervalo siempre son numricos.

    Escala de razn Una escala de medicin para una variable que tiene las propiedades de los datos de intervalo y el cociente de dos valores es signifi cativo. Los datos de razn siempre son numricos.

    Escala nominal Una escala de medicin para una variable que utiliza una etiqueta o nombre para identifi car un atributo de un elemento. Los datos nominales pueden ser o no nu-mricos.

    Escala ordinal Una escala de medicin para una variable que tie-ne las propiedades de los datos nominales y se puede emplear para clasifi car u ordenar los datos. Los datos ordinales podran ser o no numricos.

    Estadstica descriptiva Mtodos tabulares, grfi cos y numricos para resumir datos.

    Estadstica inferencial Proceso de reunir datos obtenidos de una muestra para hacer estimaciones acerca de las caracters-ticas de una poblacin.

    Muestra Un subconjunto de la poblacin.

    Observacin Resultado de una medicin.

    Poblacin El conjunto de todos los elementos de inters en de-terminado estudio.

    Variable Un atributo de inters de los elementos.

    Variable cualitativa Una variable con valores cualitativos.

    Variable cuantitativa Variable con valores cuantitativos.

  • 17Problemas

    b)

    c) Pronstico del estado del tiempo:

    d) Resultados del torneo interliga Grupo 1.

    LUGAR CLUB JJ JG JE JP GF GC DIF PTS PROD

    1DYNAMO

    3 2 0 1 7 2 5 6 66.67%

    3GUADALAJARA

    3 2 0 1 3 3 0 6 66.67%

    2ATLANTE

    3 2 0 1 5 6 -1 6 66.67%

    4DC UNITED

    3 0 0 3 4 8 -4 0 0.00%

    Total: 6 0 6 19 19

    Con informacin de www.femexfut.org.mx

    e) Censos de poblacin y vivienda.

    1.5 Explique la diferencia entre datos cualitativos y datos cuantitativos.

    1.6 Establezca si cada una de las siguientes variables es cualitativa o cuantitativa, e indique la escala de medicin apropiada para cada una.

    Edad Sexo Lugar en la familia Marca de automvil

    Ventas de autos de enero a junio (unidades)

    Venta

    s al p

    blic

    o

    Nacio

    nales

    Impo

    rtado

    s

    Venta

    s a di

    stribu

    idor

    Export

    acin

    Produ

    ccin

    nacio

    nal

    Merca

    do in

    terno

    Merca

    do ex

    porta

    cin

    1 200 000

    1 000 000

    800 000

    600 000

    400 000

    200 000

    0

    20072008

  • Captulo 1 Introduccin18

    1.7 Indique si cada una de las siguientes variables es cualitativa o cuantitativa, y establezca la escala de medicin apropiada para cada una.

    Forma de pago (efectivo, cheque, tarjeta de crdito)

    Tamao de la bebida (pequea, mediana o grande)

    Talla y cintura de la persona

    Temperatura ambiente

    1.8 Enliste las cuatro escalas de medicin y d un ejemplo para cada una.

    1.9 Defi na con sus palabras los trminos mutuamente excluyente y exhaustivo en relacin con las escalas de me-dicin.

    1.10 Con los datos de encuestas nacionales o del almanaque mundial, o de publicaciones, peridicos o revistas, d ejemplos donde se estn usando las diferentes escalas de medicin.

    1.11 Para medir el grado de aceptacin de una nueva disposicin en una ciudad, se solicit a los ciudadanos que anotaran el nmero que corresponde a su grado:

    Totalmente de acuerdo +2 De acuerdo +1

    Indiferente 0

    En desacuerdo 1

    Totalmente en desacuerdo 2

    a) Establezca el tipo de escala que estn empleando las autoridades de la ciudad en esta encuesta.

    b) El hecho de utilizar valores positivos, negativos y el cero la hace una escala de intervalo o de razn? Dis-cuta la respuesta en equipo.

    1.12 Discuta si el transportador (instrumento para medir ngulos) es una escala de razn o de intervalo.

    1.13 Las puntuaciones en muchas pruebas de inteligencia son reportadas como coefi ciente intelectual (CI). Los pro-fesionales de la salud consideran que una diferencia entre un CI de 100 y uno de 80 es parecida a la existente entre los CI de 120 y 100. Un CI de 0 no existe, debido a la manera en que se estructuran la mayora de las pruebas de inteligencia. Discuta qu tipo de escala usan los profesionales de la salud.

    1.14 Indique el tipo de estudio (experimental u observacional) que crea que se realiz en los siguientes casos:

    a) A un grupo de 100 personas que desean bajar de peso se les dividi aleatoriamente en dos grupos de 50 cada uno. Uno de los grupos recibi una serie de plticas motivacionales y el otro grupo no. Despus de cierto tiempo se compararon las reducciones de peso de ambos grupos.

    b) El estudio realizado por el Instituto Nacional de la Juventud en 2007, sobre la violencia en el noviazgo, arroj, entre otros, los siguientes resultados:

    En 2007, alrededor de 1.8% de la poblacin joven de entre 15 y 24 aos que tuvo un noviazgo ese ao, fue forzada una o varias veces a tener relaciones sexuales en contra de su voluntad, y 16.5% de las chicas dijeron que fue por parte de su pareja.

    El 43% de los jvenes mexicanos ha tenido relaciones sexuales, y 77% ha utilizado algn mtodo anti-conceptivo, siendo el condn el ms utilizado (94.6%), seguido de las pastillas (27.2%) y el retiro o coito interrumpido con un 24%.

    c) Los censos nacionales de cualquier tipo.

  • 19Proyectos abiertos

    Proyecto 1.1 Equilibrio nmerico hombre-mujer despus de una guerra civil

    Suponga que despus de una guerra civil, un pas qued con un nmero reducido de hombres. Los asesores del nuevo go-bierno le sugieren adoptar la poltica de obligar a las parejas a tener hijos hasta que les nazca el primer varn y, una vez que esto ocurra, cesar de tener hijos. Elabore una simulacin con el fin de determinar si esta poltica permitir restablecer el equilibrio numrico hombre-mujer.

    Sugerencia: Se puede ver el nacimiento de un hijo (hombre o mujer) equivalente a lanzar una moneda. Interpretando sol (S) como hombre y guila (A) como mujer, se lanza una mo-neda hasta que sale el primer sol y se registra el nmero de lanzamientos. Un resultado posible es: AAS, y el registro sera 3; esto es, a una pareja la poltica de poblacin le demand o permiti tener tres hijos. Se repite este proceso aleatorio cientos de veces y se analizan los resultados. Dado que lan-zar una moneda tantas veces resultara tedioso, se recurre a Excel. La instruccin bsica para generar un nmero aleatorio entre 0 y 1 es: =ALEATORIO(). De este modo, si el resultado es menor que 0.5, puede considerarse mujer (M), y en caso contrario, hombre (H). Un ensayo se ilustra en la figura de arriba.

    Mediante el arrastre horizontal se puede repetir la opera-cin anterior varias veces, por ejemplo 2. Para el registro del sexo en la repeticin doble puede usarse la instruccin: =SI(A1=H,1,SI(B1)=H,2,3)), que cuenta si hombre se present en el primer lanzamiento o en el segundo, y en caso contrario quedara como que naci en el tercero (lo cual pudo no ser cierto):

    a) Siguiendo las instrucciones bsicas dadas antes, simule 1 000 parejas.

    b) Cuntos hombres naceran en la simulacin del inciso a)?c) Determine la proporcin de hombres y mujeres en la si-

    mulacin del inciso a).d) Decida si la asesora dada al presidente permitir tener en

    el futuro un equilibrio entre hombres y mujeres.

    Proyectos abiertos

    Proyecto 1.2 Distribucin de datos

    Realice un anlisis exploratorio de los siguientes datos presen-tados como diagramas de tallos y hojas. Asigne un nombre

    a la forma de los diagramas, segn sugiere la distribucin de los nmeros.

    b) ltimos dos dgitos del nmero de telfono de los estudiantes.

    0 2 3 5 6 6

    1 0 1 2 5

    2 0 1 5 9 9

    3 2 2 3 8

    4 1 5 7 9

    5 0 4 4 9

    6 1 1 5 7 8

    7 3 6 8 9

    8 2 4 4 5 8

    9 0 0 0 3 8

    Forma de:

    a) Nmero de pelculas vistas el ao pasado por cada estudiante.

    0 0 1 2 2 2 2 3 6 8 8 9

    1 1 1 2 4 4 5 7 7 7

    2 2 2 3

    3 7 8

    4 4

    Forma de:

    2 | 3 representa 23

    3 | 8 representa 38