gutierrez gonzalez estadistica

1

INTRODUCCIÓN La Estadística es una de las ramas de las Matemáticas que se considera como de mayor aspecto práctico, por su gran variedad de aplicaciones en muchos campos de las ciencias naturales y sociales, ya que todo proceso de investigación que se diga científico conlleva en algún momento la contrastación de hipótesis que pretenden responder a un problema dado o bien en su solución, en los procesos de producción resulta muy frecuente que se requieran controles de calidad para verificar como se están produciendo los artículos y en base a ello se detenga o no el proceso. Existen tres enfoques en la estadística que se encuentran muy ligados a las corrientes de la probabilidad, estos son: El enfoque clásico, el subjetivo y el bayesiano. Este libro se desarrolla desde la perspectiva clásica, por que su principal objetivo es apoyar los cursos de la asignatura de Estadística para los alumnos de la Unidad Interdisciplinaria de Ingeniería y Ciencias Sociales y Administrativas (UPIICSA) del Instituto Politécnico Nacional (IPN), ya que se apega en un 100% a los programas vigentes de esta unidad en las cinco carreras que se ofrecen. El contar con un material acorde con los programas y que aborde los contenidos temáticos de una manera acsecible, comprensible, con una buena cantidad de ejercicios resueltos y propuestos. Permite a los alumnos tener una herramienta para aprender más significativamente la materia, además de poder retroalimentarse cuando lo considere oportuno para su beneficio en particular. Se pone un énfasis en los conceptos fundamentales, en la notación utilizada, en los ejemplos ilustrativos y en el tratamiento que se le dan a los capítulos. Cuidando la sencillez de las explicaciones en los elementos teóricos que sustentan los temas sin caer en la rigurosidad teórica. Podemos decir que se le da mayor importancia a las aplicaciones de la estadística en los problemas prácticos, que a la teoría de ella. El material se compone de cinco capítulos, el primero considera los elementos básicos de la ESTADÍSTICA DESCRIPTIVA, el segundo trata las DISTRIBUCIONES MUESTRALES , el tercero desarrolla la ESTIMACIÓN DE PARÁMETROS, que es el inicio de la ESTADÍTICA INFERENCIAL o conocida como INFERENCIA ESTADÍSTICA , posteriormente el cuarto aborda las PRUEBAS DE HIPOTESIS o la contrastación de hipótesis y por ultimo el quinto desarrolla el ANALISIS DE REGRESIÓN Y CORRELACIÓN . Al término de cada capítulo se hace un breve resumen de los aspectos y fórmulas más relevantes, así como una serie de ejercicios propuestos para que el lector practique y revise los temas leídos. Al final del libro se presenta el apéndice en donde aparecen una tabla de números aleatorios y las tablas probabilísticas de las distribuciones Normal estándar, T- de Student, Chi-cuadrada y F de Fisher. Agradezco a los profesores de las academias de matemáticas del departamento de ciencias básicas de la UPIICSA, por sus valiosas aportaciones y sugerencias en la mejora del presente material, especialmente al Doctor Eduardo Gutiérrez González y a la Maestra Olga Vladimirovna Panteleeva por permitir la reproducción de las tablas estadísticas para la distribución normal, T de Student, Chi-cuadrada y F de Fisher.

2

CONTENIDO TEMÁTICO Introducción I

Capítulo 1 ESTADÍSTICA DESCRIPTIVA

1.1 Introducción al muestreo 2 1.2 Población y muestra 2 1.3 Parámetro y Estadístico o Estimador 3 1.4 Muestreo Aleatorio Simple 4 1.5 Organización o Agrupamiento de datos 6 1.5.1 Ordenamiento de datos 6 1.5.2 Tabla de frecuencias y Diagrama de líneas 7 1.5.3 Tabla de intervalos, histogramas, polígono de frecuencias y ojiva 8 1.6 Medidas de tendencia central para datos no agrupados 12 1.6.1 Media aritmética, Mediana y Moda 13 1.7 Medidas de dispersión para datos no agrupados 15 1.7.1 Rango, Suma de diferencias, Suma de cuadrados de las diferencias, Varianza y Desviación estándar

15

Ejercicios 25

Capítulo 2 DISTRIBUCIONES MUESTRALES

2.1 Variables Aleatorias Muestrales y sus distribuciones de probabilidad 29 2.1.1 Distribución muestral para una suma de variables 30 2.1.2 Distribución muestral para una media 36 2.1.3 Distribución muestral para una diferencia de medias 43 2.1.4 Distribución muestral para una proporción 47 2.1.5 Distribución muestral para una diferencia de proporciones 48 2.2 Teorema de limite central y sus aplicaciones 49 2.3 Distribución t de Student 56 2.4 Distribución Chi-cuadrada 61 2.5 Distribución F de Fisher 63 Ejercicios 67

Capítulo 3 ESTIMACIÓN DE PARÁMETROS

3.1 Estimación puntual 70 3.2 Propiedades de los estimadores 71 3.2.1 Estimador insesgado 72 3.2.2 Estimador eficiente 74 3.2.3 Estimador consistente 75 3.3 Estimación por intervalos ( Intervalos de confianza ) 75 3.3.1 Definición de intervalo de confianza 75 3.3.2 Grado o nivel de confianza y su interpretación 75 3.4 Intervalo de confianza para una media poblacional 76 3.5 Intervalo de confianza para una diferencia de medias poblacionales 81 3.6 Intervalo de confianza para una proporción poblacional 89 3.7 Intervalo de confianza para una diferencia de proporciones poblacionales

90

3

3.8 Error de estimación y tamaño de la muestra 91 3.9 Intervalo de confianza para la varianza 94 3.10 Intervalo de confianza para la razón de varianzas 98 Ejercicios 103

Capítulo 4 PRUEBAS DE HIPOTESIS

4.1 Definición de una prueba de hipótesis 108 4.2 Elementos de una prueba de hipótesis 109 4.2.1 Hipótesis nula y alterna 109 4.2.2 Nivel de significancia y los errores en una prueba 110 4.2.3 Estadístico de prueba 110 4.2.4 Región de rechazo y de no rechazo 111 4.2.5 Decisión estadística 112 4.3 Prueba de hipótesis para una media 113 4.4 Prueba de hipótesis para una diferencia de medias 122 4.5 Prueba de hipótesis para una proporción 134 4.6 Prueba de hipótesis para una diferencia de proporciones 137 4.7 Potencia de una prueba y tamaño de la muestra 141 4.8 Prueba de hipótesis para la varianza 152 4.9 Prueba de hipótesis para la razón de varianzas 155 Ejercicios 161

Capítulo 5 ANALISIS DE REGRESIÓN

5.1 Ajuste de curvas 167 5.2 Método de mínimos cuadrados 168 5.3 Modelo de regresión lineal simple 169 5.3.1 Ecuación de la recta y sus parámetros 171 5.3.2 Intervalos de confianza para los parámetros del modelo de regresión lineal simple

176

5.3.3 Pruebas de hipótesis para los parámetros del modelo de regresión lineal simple

179

5.4 Predicción 183 5.4.1 Intervalo de confianza y prueba de hipótesis 183 5.5 Correlación 185 5.5.1 Concepto de correlación 185 5.5.2 Coeficiente de correlación 185 5.5.3 Coeficiente de correlación en el modelo de regresión lineal simple y su interpretación

186

Ejercicios 190

4

Capítulo 1 ESTADÍSTICA DESCRIPTIVA

a Estadística es una de las ramas de las matemáticas con mayor utilidad en diversos campos como la Ingeniería, Administración, Economía, Informática, Biología, Mercadotecnia, Física, Química, Ciencias Sociales,

entre otras. Cuando se maneja una cantidad de información a través de datos cualitativos o cuantitativos, resulta muy interesante plantearse preguntas como las siguientes: ¿La resistencia a las fracturas de un tipo de concreto, se puede decir, que ha mejorado por incorporar nuevas materias primas en su elaboración?, ¿Cómo afecta a la economía de un país los manejos irresponsables de la inflación?, ¿Cual es la proporción de habitantes que están en desacuerdo con las propuestas de un candidato político?, ¿Qué criterio podemos usar para rechazar un lote de mercancía que se quiere comprar para nuestra empresa?, de dos medicamentos ¿cuál resulta ser mas eficaz para combatir el resfriado?, ¿Cómo se podrá predecir la cantidad de tornillos defectuosos que una maquina producirá en un periodo de tiempo, sin tomar en cuenta el factor humano?, ¿Cuál es la variación en los tiempos de atención a los clientes por parte de las operadoras, cuando estos llegan con problemas similares?, entre otras mas. Respuestas a las preguntas anteriores las encontraremos en la Estadística , principalmente en la Estadística Inferencial o Estadística Inductiva. La Estadística se divide en Descriptiva e Inferencial, esta ultima permite realizar generalizaciones a toda una colección de datos llamada Población o Universo a partir de una parte de la información o de los datos, conocida comúnmente como muestra . En los capítulos tres, cuatro y cinco serán estudiados algunos de los conceptos más relevantes de esta. En este capítulo veremos los aspectos básicos de la Estadística Descriptiva , la cual como su nombre indica, permite llevar a cabo la organización de un conjunto de datos por medio de tablas , histogramas o polígonos de frecuencias , que pueden representar a una población o una muestra, además de obtener una serie de medidas que resumen la información de interés, como las de tendencia central y de dispersión o variabilidad principalmente. Cabe mencionar que la recopilación de los datos es una tarea muy importante y delicada a la vez, ya que debe ser representativa cuando se trata de una parte de la población, es decir, de una muestra. Existen técnicas de muestreo que garantizan con una buena confiabilidad la representatividad de una muestra. Por lo regular las poblaciones suelen ser grandes e incluso infinitas, razón por la cual casi siempre trabajaremos con muestras, que sean representativas de estas poblaciones y las llamaremos muestras aleatorias .

L

5

El querer estudiar a la población implica hablar de un censo que considera toda la información o la totalidad de los datos, ello resulta en la mayoría de las veces excesivamente costoso en recursos económicos y humanos, así como también en el tiempo para recopilar y analizar los datos, por ello es conveniente trabajar con muestras. En este capítulo se consideran conjuntos de datos que representan muestras, solo cuando sea necesario dar alguna definición o en la resolución de ciertos ejemplos hablaremos de poblaciones. 1.1 Introducción al muestreo

Al estudiar un problema que involucra una colección de datos numéricos ó categóricos (población) como se menciono, resulta muy práctico usar una muestra que de preferencia sea lo más representativa de esta. Para conseguirlo existen técnicas o procedimientos como el muestreo aleatorio simple, muestreo estratificado, muestro por conglom erados, muestreo por conglomerados en dos etapas y el muestreo siste mático . De acuerdo a las condiciones de cada problema y lo que se desea investigar se puede usar alguna de dichas técnicas, aquí solo ilustraremos el muestreo aleatorio simple o también llamado muestreo irrestricto aleatorio en un apartado posterior. El seleccionar una o varias muestras no es tan sencillo como en principio parece, ya que depende de los intereses del investigador, provocando en muchas ocasiones un sesgo en la recolección de la información y en consecuencia estimaciones o aproximaciones que pudieran ser incorrectas, la probabilidad puede ayudar a reducir de alguna manera esta dificultad al introducir el azar, es decir que de alguna manera los elementos que vayan a ser seleccionados en las muestras tengan una probabilidad aproximadamente igual. El resultado de una “buena” muestra se verá reflejado en aquello que se aplicará a la población. En el muestreo debemos tener dos preguntas presentes, la primera ¿de qué tamaño será la muestra? y ¿como seleccionarla? La primera pregunta se responderá en el capítulo tres cuando veamos la estimación de parámetros, ya que depende de la variabilidad en la información que se este estudiando y la precisión con se quieran hacer las aproximaciones, las técnicas de muestreo nos ayudan a responder la segunda pregunta y como se dijo depende del problema a investigar. 1.2 Población y Muestra Los conceptos de población y muestra son fundamentales en la estadística, resulta necesario entonces contar con una especie de definición para estos. Población. Colección de todos los elementos u objetos en los que se tiene cierto interés en un momento dado o bien un conjunto de valores que una variable puede tomar en un instante particular. Por ejemplo en la Unidad Interdisciplinaria de Ingeniería y Ciencias Sociales y Administrativas (UPIICSA) podemos estar interesados en conocer la edad promedio de los estudiantes que actualmente se encuentran cursando alguna asignatura en Agosto de 2006, el conjunto de todas las edades de estos

6

alumnos constituye la población. En una empresa que fabrica cierto tipo de artículo, se desea estimar el porcentaje de estos productos que tienen algún defecto grave y que están por sacarse al mercado, en este caso la población la constituye todos los artículos que se encuentran almacenados(tanto los que tienen defectos como los que no). El tiempo promedio que tardan en recuperarse de una enfermedad los pacientes a los se les suministra un medicamento especifico durante el mes de Diciembre, aquí la población esta formada por los tiempos de recuperación de los pacientes a los que se les aplica dicho fármaco en este mes. El nivel medio del agua que tiene una presa durante un mes en época de sequía. , en este caso la población esta integrada por los niveles de agua en ese mes. Las poblaciones pueden ser finitas o infinitas , ya que quedarán de acuerdo a nuestra esfera de interés, por ejemplo en el caso de las edades de los alumnos en un momento especial tenemos una población finita. Por lo regular en la estadística se trabajan las poblaciones finitas, aunque podemos tener poblaciones infinitas como por ejemplo cuando nuestra población consiste de una sucesión de valores sin fin{ }L,3,2,1 o cuando se trabaja como una variable continua, será infinita. Muestra. Es una parte de la población o un subconjunto del universo. Por ejemplo en el caso de las edades de los alumnos de la UPIICSA, una muestra podría estar formada por las edades de los jóvenes de un grupo de segundo o de algún otro semestre. En los artículos producidos por la empresa, una muestra puede ser un lote de 100 de estos productos tomados de alguna caja en el almacén. Para los tiempos de recuperación, se pueden considerar como una muestra los tiempos de recuperación de 20 pacientes el día 2 de Diciembre. Para los niveles del agua en la presa se podría considerar una muestra, como los niveles de agua de un día en particular del mes. Es claro que este tipo de muestras, no se pueden considerar como representativas, puesto que son muy parciales, al no tomar en cuenta a los alumnos de otros semestres y turnos, de igual manera en los artículos no se seleccionaron otras cajas de todo el almacén, en los tiempos como solo se eligió un día, puede presentarse una variación importante en el resto de los días que altere bastante la información y en los niveles del agua un día no refleja la información que se quiere conocer. Ello hace importante y necesario la noción de muestra aleatoria. 1.3 Parámetro y Estadístico Cuando tenemos una o más poblaciones, definimos el parámetro como aquella medida de interés que proviene de la población y que en muchos casos se desconoce y queremos estimarla o aproximarla. En este libro consideraremos algunos de los parámetros más frecuentes como: Media o promedio poblacional µ

Diferencia de medias poblacionales 21 µµ −

7

Proporción poblacional p

Diferencia de proporciones poblacionales 21 pp −

Varianza poblacional 2σ

Desviación estándar poblacional 2σ σ=

Un Estadístico o Estimador es aquella medida o variable que proviene de una o varias muestras sacadas de la misma población y su principal objetivo es aproximar el parámetro en cuestión, de ahí que también se conozca como estimador. En la figura 1 se ilustra de manera muy primitiva a una muestra y una población, vistas como un subconjunto y el conjunto respectivamente, para señalar la idea del todo y una parte, así como de donde se obtiene el parámetro y un estadístico.

Figura 1 Algunos de los estadísticos o estimadores más comunes son:

Media muestral x

Diferencia de medias muestrales 1 2x x−

Proporción muestral p

Diferencia de proporciones muestrales 21 ˆˆ pp −

Varianza muestral2s

Desviación estándar muestral 2s s=

1.4 Muestreo Aleatorio Simple Al realizar una encuesta o bien un muestreo, con el objeto de hacer inferencias acerca de una población, intervienen dos factores en la información contenida en la muestra, y que afectan la precisión de nuestro procedimiento para hacer inferencias. El primero es el tamaño de la muestra seleccionada de la población y el segundo la variación en los datos, el cual se puede controlar de acuerdo con el método de selección de la muestra o procedimiento de muestreo para obtener las n observaciones que la integran, ya que cada observación cuesta

Muestra

Población Parámetro

Estadístico

8

dinero, un diseño que proporciona un estimador preciso del parámetro en un tamaño de muestra fijo produce un ahorro en el costo para el experimentador. Ya se mencionaron algunas de las técnicas de muestreo, enseguida veremos la conocida como muestreo aleatorio simple. Definición : Si una muestra de tamaño n es seleccionada de una población de tamaño N, de manera que cada muestra de tamaño n tenga la misma probabilidad de ser seleccionada, decimos que el muestreo es aleatorio simple y a esta muestra la llamamos muestra aleatoria simple o por sencillez muestra aleatoria. El muestreo aleatorio simple, se realiza apoyándonos de una tabla de números aleatorios, la cual es un conjunto de enteros generado de modo que contenga los dígitos 0, 1, 2, 3, 4, 5, 6, 7, 8 y 9 en proporciones aproximadamente iguales sin tendencias o patrones fijos y aparece en el apéndice como la tabla 1 al final del libro. En la tabla 1 se tienen 500 números aleatorios colocados en 10 columnas y 50 renglones para su manejo, y están formados por seis dígitos, aunque la cantidad de dígitos puede ser mayor o menor lo convencional es por lo regular seis. Así que, si un número es seleccionado de un punto aleatorio en la tabla, es igualmente probable que sea cualquiera de los dígitos entre el 0 y el 9. El muestreo aleatorio simple es análogo a extraer números de una urna con papeletas que los tienen anotados y que están perfectamente mezcladas. Supóngase que queremos seleccionar una muestra aleatoria simple de tamaño n=5, de una población de tamaño N=100 y que los elementos de dicha población se encuentran numerados o etiquetados del 0 al 99 (cuestión que en ocasiones no resulta tan sencillo), el primer elemento de la muestra lo podemos obtener de la siguiente manera, cerrando los ojos colocamos la punta de un lápiz sobre la tabla de números aleatorios hasta que se ubique un número, por ejemplo supóngase que se localiza el 315744 en el renglón 28 y la columna 8 (ver tabla 1 en el apéndice) , de él solo elegimos los dos dígitos, pueden ser los últimos si lo deseamos, ya que solo tenemos 100 elementos en la población. Así el primer elemento de la muestra es el dato que se haya designado como el 44, para los demás elementos de la muestra podemos desplazarnos partiendo del número 315744 hacia la derecha, izquierda, arriba o abajo y encontraremos los otros cuatro números aleatorios que a su vez nos permitirán obtener los datos que formarán a la muestra aleatoria simple. Si nos vamos hacia arriba se obtiene el 119846 y entonces el segundo elemento será el dato que ocupa el lugar 46 al elegir los dos últimos dígitos, después hacia la izquierda se tiene el 901822, el dato que esta en posición 22 será el tercer elemento, hacia abajo aparece el 870876 y el dato en el lugar 76 podrá ser el cuarto y por finalmente hacia abajo hallamos el 114902 del que consideramos al dato que esta en la posición 02 como elemento quinto elemento de la muestra, con ello tendremos una muestra aleatoria simple de tamaño n=5 estará integrada por los datos que ocupen los lugares 44, 46, 22, 76 y 02 en la población de tamaño N=100. Cabe mencionar, si los dos dígitos se llegaran a repetir al ir seleccionándolos, basta con que se ignoren y se sigan buscado otros que resulten distintos desplazándonos en cualquier dirección o bien elegir los dos primeros o cualquier par de dígitos. Además de que la muestra puede ser de otro tamaño y lo mismo que la población.

9

Las muestras aleatorias simples garantizan que la información recabada, permite de alguna manera generalizarse a la población con mayor confiabilidad, esto significa que los estadísticos o estimadores se aproximan mejor a los parámetros, que si solo tomamos muestras como subconjuntos de una población. Por comodidad cuando nos refiramos a una muestra aleatoria simple , escribiremos muestra aleatoria o bien muestra . 1.5 Organización o agrupamiento de datos Como se menciono la estadística descriptiva se encarga de organizar, presentar y obtener medidas de un conjunto de datos que pueden ser una población o bien una muestra. Consideremos un ejemplo para ilustrar algunas formas de organizar y presentar un grupo de datos numéricos. Ejemplo: Las siguientes cantidades representan las estaturas (en centímetros) de n=50 niños con edades de 4 a 6 años.

Tabla de datos 105 108 113 103 103 109 103 104 116 105 102 110 105 113 105 106 106 111 106 107 107 102 108 108 109 103 115 109 112 110 110 105 110 110 115 111 111 106 109 112 112 113 102 105 113 114 114 109 104 110 1.5.1 Ordenamiento de datos Como podemos apreciar, las estaturas aparecen sin un orden, quizá como se fue recopilando la información y en muchos casos resulta mejor escribirlos de acuerdo a un orden para su mejor control, ordenándolos de menor a mayor o de mayor a menor según se quiera, en la tabla que sigue las estaturas se encuentran ordenadas de la menor a la mayor.

Tabla de datos ordenados 102 102 102 103 103 103 103 104 104 105 105 105 105 105 105 106 106 106 106 107 107 108 108 108 109 109 109 109 109 110 110 110 110 110 110 111 111 111 112 112 112 113 113 113 113 114 114 115 115 116 Las estaturas ya se encuentran en orden del menor al mayor. Sin embargo, esta primera forma de presentar la información tiene dos inconvenientes, por un lado tiene varios datos que se repiten, lo que puede ser extenso al escribirlos y además es poco atractiva desde la perspectiva visual, por que solo es un listado de números en orden. De ahí la necesidad de

10

proponer una forma mas “compacta” que considere los datos repetidos y solo se escriban una vez, como se ilustra en el siguiente apartado. 1.5.2 Tabla de frecuencias y Diagrama de líneas (va ras) Esta segunda forma de organizar datos, resume la información cuando existen datos repetidos, para ello, definimos la frecuencia ( )if de un dato ( )ix , como el número de veces que se repite este. Tomando como ejemplo las n=50 estaturas de los niños de 4 a 6 años, podemos agruparlos por medio de una tabla de frecuencias, en donde a cada valor o dato le asociamos su frecuencia como se ilustra en la tabla que sigue.

Tabla de frecuencias (datos contra frecuencias)

ix 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116

if 3 4 2 6 4 2 3 5 6 3 3 4 2 2 1

Cuando esta tabla se dibuja en el plano cartesiano, se tiene lo que llamamos un diagrama de líneas o varas, en donde podemos apreciar que a cada dato ( )ix le asociamos una porción de línea o segmento (vara), cuya longitud es la

frecuencia ( )if . En la figura 2, aparece un diagrama de líneas o varas que corresponde a la tabla de frecuencias anterior.

Diagrama de líneas o varas

Figura 2

1.5.3 Tabla de intervalos, histogramas, polígono de frecuencias y ojiva. Una de las formas mas usadas para agrupar un conjunto de datos es la tabla de intervalos, también conocida como intervalos de clase, ya que se forman grupos de datos que se encuentran comprendidos o dentro de un intervalo llamado clase y cada uno de ellos tiene una frecuencia, es decir, una cantidad de valores numéricos o datos que caen dentro del intervalo, que se suele llamar frecuencia de clase.

102 103 104 105 106 107 108 109 110 111 112 113 114 115 116

if

ix

6 5 4 3 2 1

11

Es importante señalar que para construir una tabla de intervalos o clases, se deben responder dos preguntas, primera ¿cuántos intervalos se deben construir? y segunda ¿de qué tamaño o anchura serán? Con respecto a la primera pregunta, se puede decir que, no existe una regla universalmente aceptada que permita determinar el número de intervalos que se construirán, solo se proporcionan sugerencias que se apegan al hecho de que debe haber una “relación” entre el número de intervalos y la cantidad de datos que se quieren agrupar, así una de las recomendaciones muy usadas es que de 5 a 20 intervalos se pueden trabajar y queda al criterio del investigador el número que crea mejor de acuerdo al comportamiento de los datos y su variación. Cabe decir, que pocos intervalos pueden ocultar información relevante y por otro lado demasiados no resumen adecuadamente la información. Otras sugerencias que se pueden usar de manera completamente empírica para aproximar la cantidad de clases o intervalos, es la denominada “regla de Sturges” dada como 101 3.322 log ( )k n= + ⋅ , donde k representa el número de

intervalos y n el total de datos o bien la expresión k n= , aclarando que no son fórmulas que se apliquen de manera general. En cuánto a la segunda pregunta, los intervalos pueden tener diferentes anchos o longitudes, pero por simplicidad se prefiere que tengan la misma longitud, a menos que se considere indispensable que los anchos sean distintos. En esta sección siempre tomaremos intervalos de igual longitud. Para determinar el ancho " "c de un intervalo usaremos la siguiente regla, a la diferencia del dato mayor con dato menor la dividimos por el número de intervalos que se van a construir.

En forma simbólica se tiene que Dato mayor Dato menor

ck

−= donde c es el

tamaño de cada intervalo y k el número de intervalos. La diferencia del dato mayor con el dato menor se conoce como el rango de la muestra (población según el caso) y en varias ocasiones resulta conveniente ampliar este rango sumando una cantidad fija al dato mayor y restando la misma cantidad al dato menor para producir el rango ampliado . La cantidad fija que se suma y resta, depende del tipo de valores numéricos que se manejan en los datos, por ejemplo si los valores son enteros, lo que hay que sumar y restar puede ser 0.5 y si se manejan números hasta una cifra decimal podremos tomar 0.05, etc. Con esto se busca que al agrupar los datos, estos se encuentren dentro de un y solo un intervalo, evitando en lo posible que algún extremo de los intervalos coincida con un dato. Si lo anterior llegara a ocurrir se recomienda hacer uso de intervalos semiabiertos o semicerrados de la forma: [ ) ( ], ,a b o a b , según convenga, cuidando siempre que no queden datos fuera de

los intervalos. En ocasiones, cuando se tiene una colección de datos, como resultado de un muestreo aleatorio simple por ejemplo, se llegan a presentar datos que están alejados o muy alejados de la mayoría, lo que puede provocar intervalos que no tengan un solo dato, es aquí donde puede ser útil el uso de los diferentes tamaños para los intervalos, además de que como veremos en las próximas secciones, estos datos alejados del resto producen sesgos que alteran la

12

representatividad de algunas medidas muy usadas en la estadística descriptiva y sobretodo en la inferencial. Por ello en algunas veces se pueden ignorar o desechar estos datos. Veamos tomando como ejemplo las 50 estaturas de los niños considerados anteriormente, para ilustrar como pueden organizarse, a través de intervalos. Primero decidimos el número de clases (intervalos), sean 6, por ejemplo (observar que usamos la sugerencia de que de 5 a 20 intervalos se pueden proponer para la construcción de la tabla), entonces 6k = intervalos. Ahora determinamos el tamaño de cada intervalo, usando el rango ampliado.

( 0.5) ( 0.5)Dato mayor Dato menor rango ampliado

ck k

+ − −= =

Para el ejemplo, tenemos:

(116 0.5) (102 0.5) 116.5 101.5 152.5

6 6 6c

+ − − −= = = =

Lo que significa que el tamaño o ancho de cada clase será de 2.5 . El primer intervalo, lo construimos tomando como limite inferior el dato menor menos 0.5 y le sumamos 2.5 para producir el extremo superior, el cual será el extremo inferior del segundo intervalo y sumamos de nuevo 2.5 para tener el extremo superior del segundo intervalo, así sucesivamente hasta completar los 6 intervalos y para evitar la problemática de que algún dato coincida con un extremo, el tipo de intervalos serán semicerrados. Ahora asociamos su frecuencia del intervalo ( )if , es decir, el número de datos que se encuentran

en cada intervalo. También podemos asignarle su frecuencia acumulada ( )af , a cada uno,

donde la frecuencia acumulada es la suma de frecuencias del intervalo con las anteriores a él.

La frecuencia relativa se define como ir

ff

n

=

y la frecuencia relativa

acumulada ( )arf como la suma de la frecuencia relativa de un intervalo con

las frecuencias relativas anteriores. El la tabla que sigue, se muestran los intervalos con sus respectivas frecuencias ya definidas.

im Intervalo if af rf

arf

102.75 [ )101.5 ,104 7 7 750

750

105.25 [ )104 ,106.5 12 19 1250

1950

107.75 [ )106.5 ,109 5 24 550

2450

110.25 [ )109 ,111.5 14 38 1450

3850

112.75 [ )111.5 ,114 7 45 750

4550

115.25 [ )114 ,116.5 5 50 550

5050

1=

50kn f= =∑ 1rf =∑

13

Obsérvese que en la primera columna aparecen los puntos medios im de los intervalos respectivamente, a los que se les llama marcas de clase , se usan en el cálculo de algunas medidas cuando la información se presenta como la tabla anterior. Más adelante se ilustra su manejo. La tabla se puede representar en forma gráfica, esta se conoce comúnmente como histograma y se pueden relacionar los intervalos contra sus frecuencias, frecuencias acumuladas, frecuencias relativas y sus frecuencias relativas acumuladas. En la figura 3, aparece el histograma de intervalos contra frecuencias.

Figura 3 Histograma

Cuando consideramos los puntos medios de cada intervalo, es decir, las marcas de clase, las proyectamos en la parte superior de cada rectángulo, tomamos el punto medio de un intervalo virtual a la izquierda del primero, uno a la derecha del último y unimos dichos puntos, se forma lo que llamaremos el Polígono de frecuencias , el cual es usado en ocasiones para presentar la información, ya que el área bajo este polígono es la misma que la suma de los seis rectángulos

Figura 4 Polígono de frecuencias

14 12 7 5

F r ec u e n ci a s

101.5 104 106.5 109 111.5 114 116.5

Intervalos

14 12 7 5

F r ec u e n ci a s

Intervalos

101.5 104 106.5 109 111.5 114 116.5

14

De forma similar se pueden construir los histogramas de los intervalos contra sus frecuencias acumuladas y su respectivo polígono, que se conoce como Ojiva. En la figura 5 aparece el histograma de frecuencias acumuladas y la Ojiva.

Histograma de frecuencias relativas Ojiva

Figura 5 Para el caso de los histogramas en donde se trabajan las frecuencias relativas y las relativas acumuladas, es lo mismo solo que se reduce la escala de las frecuencias a la unidad, es decir, el número total de datos (en este caso 50) equivale al número uno y por ende las alturas de los rectángulos disminuyen de 50 a 1. Resulta mejor considerar otra cantidad de intervalos para observar qué sucede con la organización si por ejemplo se proponen 5 intervalos, en esta situación el tamaño de los intervalos será de 3 y entonces la tabla cambia a la siguiente:

km Intervalo kf af rf

arf

103 [ )101.5 ,104.5 9 9 950

950

106 [ )104.5 ,107.5 12 21 1250

2150

109 [ )107.5 ,110.5 14 35 1450

3550

112 [ )110.5,113.5 10 45 1050

4550

115 [ )113.5 ,116.5 5 50 550

5050

50kn f= =∑ 1rf =∑

El histograma correspondiente a la tabla de intervalos contra frecuencias se ilustra en la figura 6.

af af

50

7

.

.

.

50

.

.

.

7

101.5 … 116.5 101.5 … 116.5

15

Figura 6

Nos podríamos hacer la siguiente pregunta ¿Cómo afecta el número de intervalos a la tabla de intervalos (histograma)?. Como se puede ver en los histogramas, especialmente en los polígonos de frecuencias se presenta una variación en cuanto a los “picos”, ya que en el primer caso existen dos, mientras que en el segundo solo hay uno. Vale la pena además, señalar que al agrupar la información por medio de histogramas o intervalos se gana una presentación más compacta y atractiva para quienes la observan, sin embargo se pierde la información original, es decir los datos o valores numéricos que se tenían en principio, aunque es preferible en muchos casos esta perdida, a cambio de esta forma de resumir la información. Existen otras formas de agrupar datos, solo por mencionar algunos, se tienen los diagramas de barras en tercera dimensión o histogramas tridimensionales, diagramas circulares, etc. Para organizar una colección de datos, ya existen algunos programas computacionales que realizan el agrupamiento de estos. Siendo una herramienta de gran apoyo para el proceso de enseñanza – aprendizaje de la estadística descriptiva e inferencial. 1.6 Medidas de tendencia central para datos no agru pados Al tener una colección de datos del tipo numérico (sean una población ó bien de una muestra), resulta muy útil conocer algunas medidas para resumir la información o que las representen de alguna manera, existen las llamadas medidas de tendencia central y de dispersión, estas ultimas se verán en la siguiente sección. Aquí estudiaremos aquellas que centralizan o resumen un conjunto de valores a uno o unos cuantos, por eso el nombre de tendencia central. Las principales medidas de este tipo son la media o promedio aritmético, la mediana y la moda. De las tres, la que más usaremos en el libro, será la media aritmética, ya que es una con mayores aplicaciones y mejores cualidades para centralizar la información.

14 12 10 9 5

F r ec u e n ci a s

Intervalos

101.5 104.5 107.5 110.5 113.5 116.5

16

1.6.1 Media aritmética, Mediana y Moda Cuándo tenemos una población de tamaño N , a saber, 1 2 3, , , , NX X X XL definimos la Media aritmética poblacional como:

1 2 3 1

1

1

N

iNN i

i

i

XX X X X

XN N N

µ =

=

+ + + += = =∑

∑L

Si se tiene una muestra de tamaño n , a saber, 1 2 3, , , , nx x x xL definimos la Media aritmética muestral como:

1 2 3 1

1

1

n

inn i

i

i

xx x x x

x xn n n

=

=

+ + + += = =∑

∑L

Recuérdese que regularmente trabajaremos con la media muestral y solo cuándo se requiera hablaremos de la media poblacional. Ejemplo : Si suponemos que los siguientes 10 datos representan a una población de tamaño N=10 , 10 000, 11 000, 11 000, 12 000, 12 000, 12 000 13 000, 14 000, 14 000 y 15 000. La media poblacional será:

10000 11000 11000 12000 12000 12000 13000 14000 14000 15000

10

12400012400

10

µ

µ

+ + + + + + + + +=

= =

Ejemplo : Los pesos de 8 jóvenes con edad de 25 años representan una muestra y son 70, 78, 75, 78, 75, 80, 68 y 90.

La media muestral será 70 78 75 78 75 80 68 90 614

76.758 8

x+ + + + + + += = =

Ejemplo : Una muestra aleatoria arroja los siguientes datos que representan los diámetros de 15 tubos de cobre (en centímetros): 1.9, 1.8, 1.9, 2.1, 2.0, 2.1, 1.8, 1,9, 1.8, 2.1, 2.0, 1.7, 1.9, 2.0 y 2.1.

Al obtener la media muestral resulta que 1.9 1.8 1.9 2.1 29.11.94

15 15x

+ + + += = ≈L

Entonces 1.94x = es el valor de la media muestral.

17

La Mediana de un grupo de datos se define como aquel dato que se encuentra a la mitad de ellos, cuando ya están ordenados de forma creciente. Dependiendo del número de valores que se tengan, en forma simbólica, para una muestra de tamaño n , a saber, 1 2 3, , , , nx x x xL , se define la Mediana muestral como:

1

2

12 2

2

n

n n

x si n es impar

Med x x

si n es par

+

+

= +

Ejemplo : Para el caso de los diámetros de los 15 tubos de cobre los datos ordenados son: 1.7, 1.8, 1.8, 1.8, 1.9, 1.9, 1.9, 1.9, 2.0, 2.0, 2.0, 2.1, 2.1, 2.1 y 2.1.

Como el número 15 es impar, la Mediana será el dato 15 1

2

8x x+

= , que ocupa el

octavo lugar y su valor respectivo es 1.9. Por tanto, 8 1.9Med x= = . Ejemplo: si consideramos los pesos de los 8 jóvenes, tendremos que al ordenarlos quedan así: 68, 70, 75, 75, 78, 78, 80 y 90. Aquí como el número de datos es impar (8), entonces hay que hallar el promedio de los dos datos que se localizan a la mitad, es decir,

8 81

4 52 2 75 7876.5

2 2 2

x xx x

Med+

++ += = = =

En este caso la Mediana resulto ser 76.5, aún cuando no forma parte de los 8 valores. La Moda es aquel dato que tiene la mayor frecuencia, es decir, que se repite el mayor número de veces. Si consideramos los tres ejemplos que ilustraron la media aritmética, se tiene que en el primer ejemplo, la moda es 12 000, ya que su frecuencia es 3 y es la mayor. Sin embargo en el segundo ejemplo, hay dos datos con la mayor frecuencia, a saber, 1.9 y 2.1 cuya frecuencia es 4, cuando esto ocurre le llamamos a la muestra bimodal, algo similar ocurre con el tercer ejemplo, ya que la Moda serán el 75 y 78 por tener la mayor frecuencia (2). La moda es una medida poco usada en la estadística, más bien tiene un valor utilitario en el campo mercantil y comercial, porque permite conocer las preferencias de un producto o las ventas por un artículo determinado. Las definiciones anteriores se aplican a los datos no agrupados y también existen para el caso de datos agrupados por frecuencias o incluso por intervalos, aunque en estas ultimas se dan aproximaciones, ya que no se conocen de manera explicita los valores de los datos, al final de la próxima sección se darán e ilustrarán estas.

18

1.7 Medidas de dispersión para datos no agrupados Aparte de las medidas de centralización o tendencia central, tenemos otras muy importantes en estadística, son aquellas que se encargan de medir la variación o dispersión, que un grupo de datos presenta con respecto a una cantidad fija. 1.7.1 Rango, Suma de cuadrados, Suma se los cuadrad os de la diferencias, Varianza y Desviación Estándar. Rango : Es la diferencia del dato mayor con el dato menor. Se puede escribir como sigue a continuación. Rango = Dato mayor – Dato menor. Esta medida tiene un inconveniente principal y es que no considera a la totalidad de los datos al tomar solo dos (mayor y menor), razón por la cual conjuntos de datos muy diferentes en cantidad y valores numéricos, pueden tener un mismo rango. Por ejemplo: Para los datos 2, 2, 4 y 10 su rango es 10 – 2 = 8. Por otro lado en los valores 1, 1, 2, 3, 4, 5, 6, 7, 8, 8, 8, 9, 9, 9 y 9 su rango es también 9 – 1 = 8. Sin embargo todo parece indicar que el segundo grupo de valores presenta mayor variación que el primero, es decir, debería intervenir de alguna forma cada uno de los datos y no solamente dos de estos. Por ello el rango se considera como una medida de dispersión muy deficiente. Suma de las diferencias : Esta es una alternativa para reemplazar al rango y se define como, la suma de las diferencias de cada dato con respecto a la media (poblacional o muestral según sea el caso), así para una muestra de tamaño n 1 2 3, , , , nx x x xL . La suma de las diferencias queda como:

( ) ( ) ( ) ( )1 2

1

n

i n

i

SD x x x x x x x x=

= − = − + − + + −∑ L .

En la expresión anterior, ya se toman en cuenta todos los valores, pero se puede observar que dicha medida resulta ser igual a cero, ya que, al reescribirla y usando algunas propiedades de la sumatoria, inevitablemente la suma será cero. En efecto, al desarrollar la definición se tiene que

( ) ( ) ( ) ( )1 2

1

1 2

1 1 1 1

10

n

i n

i

n n n n

n i i i i

i i i i

SD x x x x x x x x

SD x x x nx x n x x xn

=

= = = =

= − = − + − + + −

= + + + − = − = − =

∑

∑ ∑ ∑ ∑

L

L

Lo anterior nos lleva a concluir, que la suma de diferencias no es útil para medir la dispersión, ya que se presentan restas que son positivas y otras negativas que al sumarse dan como resultado cero. Por ello se puede mejor hablar de los valores absolutos de las diferencias, para evitar la problemática del cero o bien elevar al cuadrado las diferencias, como se define a continuación.

19

Suma de los cuadrados de las diferencias . Ahora cada diferencia es elevada al cuadrado y después las sumamos, así tendremos que la suma de los cuadrados de las diferencias es

( ) ( ) ( ) ( )2 2 2 2

1 2

1

n

i n

i

SCD x x x x x x x x=

= − = − + − + −∑ L

El cuadrado de las diferencias evita que se presente el cero siempre, pero altera la información, no solo en el aspecto de los valores numéricos, sino que también a la escala de medición utilizada y además no es representativa de la variación que los datos están presentando. Por consecuencia, es conveniente hablar de una especie de promedio de la suma de cuadrados de las diferencias, ello nos lleva a la varianza y desviación estándar. Varianza o Variancia . Esta medida de dispersión es muy utilizada en la estadística y podemos definirla para una población o en su defecto para una muestra aleatoria, de la siguiente manera. Para una población 1 2 3, , , , NX X X XL , definimos a la Varianza poblacional como:

( )

( ) ( ) ( ) ( )

22

1

22 2 2

1 22 1

1 N

i

i

N

iNi

XN

XX X X

N N

σ µ

µ µ µ µσ

=

=

= −

− − + − + + −= =

∑

∑ L

Donde µ es la media poblacional y N es el tamaño de la población. Ejemplo : Sean los datos 1, 2, 3, 4, 5, 6, 7, 8 y 9 que representan a una población, entonces la varianza será:

( ) ( ) ( )2 2 2

21 5 2 5 9 5

6.6679

σ− + − + + −

= =L

, aproximadamente.

La media poblacional es 5µ = . Lo mas común, como se ha señalado es que se tenga muestras aleatorias y entonces tendremos que dar la definición de la varianza muestral. Dada una muestra aleatoria de tamaño n , a saber, 1 2 3, , , , nx x x xL . Se define la Varianza muestral como:

( )

( ) ( ) ( ) ( )

22

1

22 2 2

1 22 1

1

1

1 1

n

i

i

n

ini

s x xn

x xx x x x x x

sn n

=

=

= −−

− − + − + + −= =

− −

∑

∑ L

Donde x es la media muestral.

20

Esta expresión se conoce como la varianza muestral insesgada y se puede notar que la suma de los cuadrados de las diferencias esta dividida por 1n − y no por n como se podría esperar. Hasta este momento no se tienen los elementos suficientes de justificar el por qué el dividendo es 1n − , en el capítulo tres se explicará con detalle tal definición. Ejemplo : Si suponemos que los nueve datos (1, 2, 3, 4, 5, 6, 7, 8 y 9) del ejemplo anterior representan ahora una muestra aleatoria, entonces tendremos que la varianza muestral será:

( ) ( ) ( )5 2 2

21 5 2 5 9 5

7.58

s− + − + + −

= =L

.

Ejemplo : se tiene une muestra aleatoria de tamaño 12 y los valores de los datos son: 1.1, 1.2, 1.2, 2.3, 2.3, 2.4, 2.4, 2.6, 2.7, 2.7, 2.8 y 2.9. Obtener la media y varianza muestral.

La media muestral es 1.1 1.2 1.2 2.3 2.9

2.216712

x+ + + + += =L

aproximadamente.

La varianza muestral es

( ) ( )2 2

21.1 2.2167 2.9 2.2167

0.43787811

s− + + −

= =L

aprox.

Las operaciones para obtener estas aproximaciones, se pueden llevar a cabo de manera automática con la mayoría de las calculadoras de tipo “científico”, por lo que no es necesario, efectuarlas siguiendo tal cual las definiciones. Solo debemos cuidar como se están considerando el grupo de valores numéricos (población o muestra), ya que hay diferencias en esta medida. En algunas ocasiones los valores numéricos, sobretodo de las muestras se llegan a presentar en forma resumida mediante la suma de ellos y la suma de sus cuadrados, en estos casos resulta muy útil contar con una alternativa que permita obtener la varianza muestral, a partir de esta información. Mostraremos como se deduce esta alternativa, en base a la definición de la varianza muestral.

Partimos de que ( )22

1

1

1

n

i

i

s x xn =

= −− ∑ desarrollando el cuadrado del binomio

( )2

ix x− , usando propiedades de linealidad de la sumatoria 1

n

i=∑

( )1 1 1 1

1

n n n n

i i i

i i i i

ax b a x b a x nb

= = = =

+ = + = +∑ ∑ ∑ ∑ , donde a y b son constantes y

agrupando los términos semejantes se tiene que:

21

( ) ( )22 2 2

1 1

2 2 2 2 2

1 1 1 1 1 1

2 2 2 2 2 2 2 2

1 1 1 1

1 12

1 1

1 12 2 1

1 1

1 1 1 12 2

1 1 1

n n

i i i

i i

n n n n n n

i i i i

i i i i i i

n n n n

i i i i

i i i i

s x x x x x xn n

s x x x x x x x xn n

s x nx x x n x nx nx x nxn n n n

= =

= = = = = =

= = = =

= − = − +− −

= − + = − + − −

= − + = − + = − − − −

∑ ∑

∑ ∑ ∑ ∑ ∑ ∑

∑ ∑ ∑ ∑

2

2 2 2 1

2 1 1

1 1

n

in ni

i i

i i

x

x nx xn

sn n

=

= =

− −

= =− −

∑∑ ∑

Por tanto, la varianza muestral queda como

2

2 2 2 1

2 1 1

1 1

n

in ni

i i

i i

x

x nx xn

sn n

=

= =

− −

= =− −

∑∑ ∑

Ejemplo : De una muestra de tamaño 100 se tiene la siguiente información en forma resumida, como se indica a continuación. 100 100

2

1 1

123.56 ; 254.52i i

i i

x x= =

= =∑ ∑

Obtener la media y la varianza muestrales. Basta con recurrir a la definición que se dio de x y la alternativa para 2s .

100

1

2100

100 22 1

2 1

123.561.2356

100 100

123.56254.52

101.8493100 1.02881 99 99

i

i

i

i

i

i

x

x

x

xn

sn

=

=

=

= = =

− −

= = = =−

∑

∑∑

La varianza es una “buena” medida de variabilidad, pero tiene todavía un inconveniente y es que las diferencias son elevadas al cuadrado, provocando un “aumento” en los valores reales y en la escala que esta usando, por ello definimos la mejor medida de dispersión, la desviación estándar o típica ,

22

como la raíz cuadrada de la varianza para regresar de alguna forma a las unidades y escalas originales. Para el caso de una población tenemos que:

La Desviación estándar poblacional es ( )2

2 1

N

i

i

X

N

µσ σ =

−= =

∑

Para una muestra aleatoria

La Desviación estándar muestral es ( )2

2 1

1

n

i

i

x x

s sn

=

−= =

−

∑

Ejemplo : Para los valores 1, 2, 3, 4, 5, 6, 7, 8 y 9 considerados como una muestra de tamaño 9, su varianza muestral resulto ser 7.5 y en consecuencia

la desviación muestral será 2 7.5 2.7386s s= = = . Ejemplo : Para una muestra de tamaño 10, cuyos valores son 7.5, 7.6, 7.9, 7.9, 8.1, 8.6, 9.7, 10.8, 12.5 y 12.8. La desviación estándar es 2.02386 aproximadamente, ya que,

2 4.096 2.02386s s= = = . Cuando los datos están agrupados, sea por tabla de frecuencias o por clases (intervalos), también podemos calcular las medidas anteriormente definidas tanto de tendencia central, media aritmética, mediana y moda, como de dispersión, varianza y desviación estándar. Por simplicidad solo hablaremos de el caso muestral. Si tenemos n datos, en una tabla de frecuencias, como aparecen a continuación.

1 1

2 2

3 3

k k

Dato Frecuencia

x f

x f

x f

x f

M M

Donde 1

k

i

i

f n=

=∑ .

La media muestral se obtiene a través de la fórmula 1

1

1

k

i iki

i i

i

x f

x x fn n

=

== =

∑∑

23

La varianza muestral por medio de

( )( )2 2 2

22 1 1

1

1

1 1 1

k k

i i i iki i

i i

i

x x f x f nx

s x x fn n n

= =

=

− −= − = =

− − −

∑ ∑∑

Finalmente la desviación estándar como 2s s= . La mediana y moda se obtienen de forma idéntica para el caso de datos no agrupados. Ejemplo : Se tienen 55 datos agrupados que constituyen una muestra, en una tabla de frecuencias, obtener la media, la mediana, la moda, la varianza y desviación estándar de acuerdo a la tabla.

Tabla de frecuencias

10 2

11 5

12 8

13 10

14 14

15 8

16 5

17 2

18 1

i idato x Frecuencia f

Para obtener la media, la varianza y desviación estándar puede ser útil construir algunas columnas adicionales a la tabla anterior, como se ilustra enseguida.

ix if i ix f 2

i ix f 10 2 20 200 11 5 55 605 12 8 96 1152 13 10 130 1690 14 14 196 2744 15 8 120 1800 16 5 80 1280 17 2 34 578 18 1 18 324

55in f= =∑ 749i ix f =∑ 2 10373i ix f =∑

Así 749

; 13.61855

i ix fx x

n= = =∑ es la media muestral.

24

( )22 2

2 210373 55 13.618

; 3.2081 54

i ix f nxs s

n

− −= = =

−∑ es la varianza muestral

aproximadamente.

2 3.208 1.791s s= = = , es la desviación estándar aproximadamente. La mediana es el dato que ocupa el lugar 28, ya que se tienen en total 55 datos y en base a la tabla es el valor 14. En este ejemplo la moda es el valor 14 también por tener la mayor frecuencia. Ahora veremos como se pueden obtener las medidas anteriores, cuando se tiene una tabla de clases o intervalos, dado que ya no se conocen explícitamente los valores numéricos, es decir, la información se perdió por resumirla a una forma mas compacta y entonces las fórmulas serán aproximaciones por lo que utilizaremos un representante de cada clase, el punto medio de cada intervalo es uno de los mas simples, lo llamamos marca de clase ( )im . Si se tiene una tabla de k intervalos o clases (histograma) de la forma

[ )[ )

[ )

1

2

,

,

,

i

k

Clase Frecuencia f

f

f

f

M M

La media muestral estará dada por 1

k

i i

i

m f

xn

=≈∑

La varianza muestral queda como

2

2 2 2 1

2 1 1

1 1

k

i ik ki

i i i i

i i

m f

m f nx m fn

sn n

=

= =

− −

≈ =− −

∑∑ ∑

La desviación estándar será 2s s=

La mediana se determina con 2i

i

nf

Med L cf

− ≈ +

∑

Donde iL es el límite inferior del intervalo que contiene a la mediana, es decir el dato que se localiza a la mitad.

f∑ es la suma de las frecuencias anteriores al intervalo que contiene a la

mediana.

if es la frecuencia del intervalo que contiene a la mediana. c es el ancho o tamaño del intervalo.

25

La moda queda como 1

1 2

iModa L c ∆≈ + ∆ + ∆

Donde iL es el límite del intervalo de mayor frecuencia, al que llamamos intervalo modal.

1∆ es la diferencia de frecuencias del intervalo modal y el intervalo inmediato anterior.

2∆ es la diferencia de frecuencias del intervalo modal y el intervalo inmediato posterior. c es el ancho o tamaño del intervalo. Ejemplo : Tenemos una tabla de intervalos que representa a las estaturas de 50 niños

Intervalo if

[ )101.5 ,104.5 9

[ )104.5 ,107.5 12

[ )107.5 ,110.5 14

[ )110.5,113.5 10

[ )113.5 ,116.5 5

50in f= =∑

Obtener de manera aproximada la media, varianza, desviación estándar, mediana y moda. Para calcular las tres primeras, es adecuado ampliar la tabla construyendo nuevas columnas, como se indica a continuación.

im Intervalo if i im f 2

i im f 103 [ )101.5 ,104.5 9 927 95481

106 [ )104.5 ,107.5 12 1272 134832

109 [ )107.5 ,110.5 14 1526 166334

112 [ )110.5,113.5 10 1120 125440

115 [ )113.5 ,116.5 5 575 66125

5

1

50i

i

n f=

= =∑ 5

1

5420i i

i

m f=

=∑ 5

2

1

588212i i

i

m f=

=∑

Por lo que,

5

1 5420108.4

50

i i

i

m f

xn

=≈ = =∑

es una aproximación para la media

muestral.

26

( )5

2 22

2 1588212 50 108.4 684

13.9591 49 49

i i

i

m f nx

sn

=

− −≈ = = =

−

∑, es una aproximación

para la varianza muestral. La desviación estándar muestral queda como 13.959 3.736s ≈ = . La mediana y la moda se obtienen de acuerdo a la tabla original, observando que el intervalo que contiene a la mediana es el tercero, ya que ahí se encuentran los datos 25 y 26, por lo que:

107.5iL = es limite inferior del tercer intervalo , 252

n = .

21f =∑ es la suma de las frecuencias anteriores al tercer intervalo.

14if = frecuencia del tercer intervalo. 3c = ancho de cada intervalo.

Luego ( )25 21107.5 3 108.357

14Med

− ≈ + =

es el valor aproximado de la

mediana. Por otro lado, el intervalo modal es también el tercero, ya que tiene la frecuencia mayor (14), por lo que:

107.5iL = es límite inferior del intervalo modal.

1 14 12 2∆ = − = es la diferencia de frecuencias del intervalo modal y el intervalo inmediato anterior.

2 14 10 4∆ = − = es la diferencia de frecuencias del intervalo modal y el intervalo inmediato posterior.

3c = ancho de cada intervalo.

Finalmente se tiene que, ( )2107.5 3 108.5

2 4Moda

≈ + = + , es valor aproximado

de la moda. RESUMEN______________________________________________________ En esta unidad se han estudiado los principales elementos de la estadística descriptiva, desde lo que llamamos población, muestra, muestra aleatoria simple, parámetro, hasta estimador o estadístico. Además se ilustro el agrupamiento de los valores numéricos de un conjunto de datos cuantitativos por medio de una tabla de intervalos o un histograma, se definieron las medidas de tendencia central, de dispersión para datos no agrupados o agrupados en intervalos. También se empezó a vislumbrar la diferencia entre estadística descriptiva e inferencial o inductiva y la importancia que tiene la segunda en procesos de predicción.

27

Fórmulas importantes:

Medidas de tendencia central

Media aritmética poblacional: 1 2 3 1

1

1

N

iNN i

i

i

XX X X X

XN N N

µ =

=

+ + + += = =∑

∑L

Media aritmética muestral: 1 2 3 1

1

1

n

inn i

i

i

xx x x x

x xn n n

=

=

+ + + += = =∑

∑L

Mediana:

1

2

12 2

2

n

n n

x si n es impar

Med x x

si n es par

+

+

= +

Medidas de dispersión Varianza poblacional:

( )

( ) ( ) ( ) ( )

22

1

22 2 2

1 22 1

1 N

i

i

N

iNi

XN

XX X X

N N

σ µ

µ µ µ µσ

=

=

= −

− − + − + + −= =

∑

∑ L

Varianza muestral:

( )

( ) ( ) ( ) ( )

22

1

22 2 2

1 22 1

1

1

1 1

n

i

i

n

ini

s x xn

x xx x x x x x

sn n

=

=

= −−

− − + − + + −= =

− −

∑

∑ L

Desviación típica o estándar poblacional: 2σ σ=

Desviación típica o estándar muestral: 2s s=

Varianza muestral:

2

2 2 2 1

2 1 1

1 1

n

in ni

i i

i i

x

x nx xn

sn n

=

= =

− −

= =− −

∑∑ ∑

28

Para datos agrupados en tabla de frecuencias

Media muestral: 1

1

1

k

i iki

i i

i

x f

x x fn n

=

== =

∑∑

Varianza muestral: ( )( )2 2 2

22 1 1

1

1

1 1 1

k k

i i i iki i

i i

i

x x f x f nx

s x x fn n n

= =

=

− −= − = =

− − −

∑ ∑∑

Para datos agrupados en tabla de intervalos

Media muestral: 1

k

i i

i

m f

xn

=≈∑

; Mediana: 2i

i

nf

Med L cf

− ≈ +

∑

Moda: 1

1 2

iModa L c ∆≈ + ∆ + ∆

Varianza muestral:

2

2 2 2 1

2 1 1

1 1

k

i ik ki

i i i i

i i

m f

m f nx m fn

sn n

=

= =

− −

≈ =− −

∑∑ ∑

Ejercicios

1) Los siguientes datos representan los tiempos (en minutos) de atención a 60 clientes de un banco que realizaron en determinado día de la semana. 5, 12, 10, 6, 8, 8, 9,12, 11, 14, 3, 9, 10, 5, 6, 5, 9, 7, 7, 10, 11,13, 14, 4, 5, 10, 15, 16, 10, 5, 6, 11, 12, 16, 6, 7, 5, 9, 8, 11, 12, 3, 4, 8, 9, 10, 11, 5, 6, 7, 8, 12, 10, 9 , 8, 9, 5, 15, 6 y 9.

a) Construya una tabla de frecuencias y dibuje su diagrama de varas.

b) Construya una tabla de intervalos utilizando 7 intervalos, dibuje su histograma (intervalos vs frecuencias), su polígono de frecuencias y dibuje su ojiva.

29

2) Al llevar a cabo la medición de 45 tornillos en su longitud se obtuvieron los siguientes resultados en centímetros, que aparecen en la tabla.

5.12 5.08 5.10 5.08 5.12 5.14 5.12 5.06 5.06 5.11 5.14 5.12 5.09 5.07 5.07 5.08 5.09 5.06 5.10 5.11 5.09 5.08 5.12 5.13 5.12 5.06 5.07 5.08 5.08 5.06 5.11 5.13 5.14 5.08 5.07 5.09 5.09 5.10 5.11 5.12 5.09 5.08 5.10 5.12 5.07

a) Ordene los datos de menor a mayor. b) Obtenga la tabla de frecuencias. c) Construya una tabla de intervalos de clase, usando 6 intervalos. d) Dibuje el histograma (intervalos vs frecuencias relativas)

3) Los pesos de 100 personas adultas (en kilogramos) se presentan en la

tabla.

85 56 60 68 75 75 81 80 98 67 58 87 82 85 86 89 71 64 65 73 64 90 91 89 67 68 98 75 71 71 64 58 59 58 59 60 61 61 60 65 68 67 86 76 75 74 74 71 70 70 71 72 78 81 87 85 86 84 92 98 89 90 91 95 94 93 94 96 89 78 79 90 55 57 58 98 58 59 60 75 78 78 79 75 80 80 81 88 88 84 68 90 98 89 78 80 80 80 75 70

a) Usando k n≈ , para determinar el número de intervalos,

construya una tabla de intervalos que incluya las frecuencias, frecuencias acumuladas, frecuencias relativas y frecuencias relativas acumuladas.

b) Dibuje los histogramas de los intervalos contra las frecuencias respectivas.

Nota: En los ejercicios del 4 al 11 supóngase que los datos representan muestras aleatorias. 4) Calcular la media aritmética, mediana, moda, varianza y desviación

estándar de los resultados en un cierto examen de conocimientos aplicado a 15 alumnos. 8, 9, 10, 6, 5, 7, 7, 8 , 8, 8, 9, 5, 4, 10 y 8.

5) El porcentaje de desempleo durante los últimos 24 meses expresado en

porcentajes aparece a continuación 5.5, 5.4, 5.3, 4.8, 4.9, 5.0, 4.7, 5.8, 5.5, 6.1, 4.9, 4.7, 5.9, 5.1, 5.6, 5.8, 5.7, 6.0, 5.8, 5.5, 6.5, 5.2, 4.8, 5.7 y 5.0.

a) Obtenga la media, mediana y moda. b) Calcule la varianza y desviación estándar.

30

6) Los tiempos de traslado de 90 empleados de su hogar al lugar donde se ubica su trabajo, aparecen resumidos en la siguientes sumatorias. Obtenga la media o promedio, la varianza y desviación estándar.

90 90

2

1 1

140.51 ; 275.86i i

i i

x x= =

= =∑ ∑

7) Las estaturas de 20 jóvenes entre 18 y 24 años en metros, son: 1.78,

1.67, 1.79, 1.69, 1.70, 1.79, 1.72, 1.73, 1.74, 1.71, 1.75, 1.89, 1.80, 1.84, 1.83, 1.76, 1.65, 1.90, 192 y 181. Obtenga el promedio, mediana, moda, varianza y desviación estándar de dichas estaturas.

8) Obtenga la desviación estándar para 30 grosores de láminas de

policarbonato en centímetros, si sabemos que:

30 302

1 1

18.51 ; 13.84i i

i i

y y= =

= =∑ ∑

9) Un total de 36 datos, indican los kilómetros que caminan el mismo

número de personas al día y aparecen en una tabla de frecuencias como se muestra a continuación.

Dato Frecuencia

2.1 5 2.4 6 2.5 8 2.6 10 2.7 4 2.8 2 2.9 1

Calcular el promedio, mediana, moda, varianza y desviación estándar.

10) A partir de los siguientes datos agrupados, de manera aproximada

calcule la media, varianza, desviación estándar, mediana y moda.

Intervalo de clase

Frecuencia

102 – 104 7 104 – 106 10 106 – 108 15 108 – 110 11 110 – 112 6 112 – 114 4

31

11) Una muestra aleatoria de tamaño 60, esta organizada mediante una tabla de intervalos como se muestra a continuación.

Intervalo Frecuencia [ )4.5,9.5 5

[ )9.5,14.5 10

[ )14.5,19.5 14

[ )19.5, 24.5 20

[ )24.5,29.5 6

[ )29.5,34.5 3

[ )34.5,39.5 2

Obtenga La media, mediana, moda, varianza y desviación estándar.

32

Capítulo 2 DISTRIBUCIONES MUESTRALES 2.1 VARIABLES ALEATORIAS MUESTRALES Y SUS DISTRIBUCIONES DE PROBABILIDAD

l estudiar las variables aleatorias sean discretas ó continuas, desde los cursos de probabilidad, se sabe que tienen su distribución de probabilidades, valor esperado Xµ , varianza 2

Xσ y desviación estándar

Xσ . En esta unidad estudiaremos variables aleatorias, que se obtienen de muestras aleatorias a partir de una población o bien de dos poblaciones. Las principales variables serán la suma muestral ( )W , la media muestral ( )X , la

diferencia de medias muestrales ( )1 2X X− , la proporción muestral ( )P , la

diferencia de proporciones muestrales ( )1 2ˆ ˆP P− , la T de Student, la 2χ ji o chi-

cuadrada y la F de Fisher. Estas dos últimas son usadas cuando se trabaja

con la varianza muestral ( )2S y la división de varianzas 2

1

2

2

S

S

,

respectivamente. Las letras mayúsculas se utilizarán para referirnos a estas variables, ya que de una muestra a otra, asumen diferentes valores y a cada valor específico de ellas lo simbolizaremos con letras minúsculas, es decir w es el valor que toma la variable W en una muestra aleatoria de tamaño n, x es valor que toma la variable media muestral X en una muestra aleatoria de tamaño n, etc. Solo la variable ji- cuadrada la denotaremos con el símbolo 2χ . Cuando realiza un muestreo de una población finita se presentan dos tipos, con reemplazamiento, en donde cada elemento seleccionado se puede volver a elegir y sin reemplazamiento, en el que un elemento que fue seleccionado, ya no puede volver a ser elegido. Para construir una distribución muestral, se tendrían que seleccionar todas las muestras de tamaño n de la población y conocer el comportamiento de alguna variable de interés, esta labor se puede realizar si la población es finita y no grande. Por ejemplo si una población es de tamaño N=10 y se quieren todas las muestras de tamaño n=2 con reemplazamiento, se tendrían un total de 102=100 muestras y si fuera sin reemplazamiento se tendrían 45 muestras. Sin embargo en la práctica las poblaciones no son pequeñas, ya que entonces se trabajaría con ellas en su totalidad, lo más común es que las poblaciones sean grandes o incluso infinitas, por lo que obtener todas las muestras resulta demasiado complejo o imposible.

A

33

Desde la perspectiva matemática las poblaciones pueden ser infinitas y cuando son finitas pero muy grandes, se llegan a considerar como próximas a las infinitas y con ello justificar algunos resultados teóricos importantes. De hecho cuando se habla de variable continua se esta asumiendo que la cantidad de valores que puede tomar esta, es infinita. Cuando el muestreo es con reemplazamiento se considera que es equivalente a suponer que la población es infinita o muy grande, como se apreciará en los ejemplos que ilustran la construcción de algunas distribuciones muestrales. El capítulo servirá como enlace entre la estadística descriptiva y la inferencial, permitiendo comprender la importancia práctica de esta última. Los conceptos de parámetro y estadístico o estimador se manejan de aquí en adelante, y recordemos que en principio los definimos como medidas que se obtienen de una población y una muestra, respectivamente. Ahora extenderemos sobretodo la definición de estadístico o estimador, al de una variable aleatoria, ya que de muestra en muestra presenta diferentes valores para dicho estadístico o en general como una función de las variables aleatorias que constituyen una muestra aleatoria. A la distribución de probabilidades para un estadístico o estimador le llamaremos distribución muestral . 2.1.1 Distribución muestral para una suma de variab les La primera variable muestral que vamos a considerar es llamada suma de variables y la denotamos por ( )W , se presenta en problemas donde nos interesa estudiar el peso total de n personas u objetos, la suma total de horas de trabajo en una empresa y en general de cantidades o variables como

1 2 3 nW X X X X= + + + +K , donde cada iX representa una variable aleatoria. Para ilustrar la construcción de esta distribución muestral, es decir del estadístico ( )W suma de variables, 1 2 3 nW X X X X= + + + +L que nos ayudará

a conocer algunas características de las distribuciones muestrales, las cuales podremos extender a otras variables, por simplicidad, supondremos que tenemos una población finita de tamaño 5N = , cuyos elementos son { }1, 3, 5, 7, 9 de la que seleccionamos todas las muestras de tamaño 2n = con

reemplazamiento. Primero obtenemos la media y varianza de la población de acuerdo a las definiciones que dimos en el capítulo anterior.

1 3 5 7 9 255

5 5µ + + + += = = , es la media poblacional.

( ) ( ) ( ) ( ) ( )2 2 2 2 2

21 5 3 5 5 5 7 5 9 5 16 4 0 4 16 40

85 5 5

σ− + − + − + − + − + + + += = = = , es la

varianza poblacional.

34

Ahora construimos todas las muestras de tamaño 2n = con reemplazamiento. En la tabla siguiente aparecen en forma de parejas ordenadas las 25 25= muestras.

( 1 , 1 ) 2

( 1 , 3 ) 4

( 1 , 5 ) 6

( 1 , 7 ) 8

( 1 , 9 ) 10

( 3 , 1 ) 4

( 3 , 3 ) 6

( 3 , 5 ) 8

( 3 , 7 ) 10

( 3 , 9 ) 12

( 5 , 1 ) 6

( 5 , 3 ) 8

( 5 , 5 ) 10

( 5 , 7 ) 12

( 5 , 9 ) 14

( 7 , 1 ) 8

( 7 , 3 ) 10

( 7 , 5 ) 12

( 7 , 7 ) 14

( 7 , 9 ) 16

( 9 , 1 ) 10

( 9 , 3 ) 12

( 9 , 5 ) 14

( 9 , 7 ) 16

( 9 , 9 ) 18

En la parte inferior de cada pareja al centro y en negrillas está el valor de la variable suma ( )W , se puede observar que asume diferentes valores

dependiendo de la muestra correspondiente, es claro que ( )W se comporta

como una variable aleatoria discreta y entonces podemos anotar sus tres características fundamentales (distribución de probabilidades, valor esperado y varianza). Su distribución de probabilidades se presenta como una correspondencia de probabilidades o un histograma de frecuencias relativas como aparecen en la figura 1 .

El valor esperado de W , es el promedio de todos los valores que toma la variable suma y lo podemos denotar como ( ) WE W µ= , para el ejemplo tendremos que:

( )2 4 4 6 6 6 14 14 14 16 16 18 250( ) 10 2 5

25 25WE W µ + + + + + + + + + + + += = = = =L

W ( )p W

2 1 0.0425

=

4 2 0.0825

=

6 3 0.1225

=

8 4 0.1625

=

10 5 0.2025

=

12 4 0.1625

=

14 3 0.1225

=

16 2 0.0825

=

18 1 0.0425

=

W

( )p W

2 4 6 8 10 12 14 16 18

0.20 . . . 0.04

Figura 1

35

La varianza de W , la denotamos por 2( ) WV W σ= y es la varianza de todas las sumas, es decir, para este ejemplo se tiene que:

( ) ( ) ( ) ( ) ( ) ( )

( ) ( )

2 2 2 2 2 2

2

2

2 10 4 10 4 10 16 10 16 10 18 10( )

25

40016 2 8

25

W

W

V W

V W

σ

σ

− + − + − + + − + − + −= =

= = = =

L

En el ejemplo, podemos observar que el valor esperado de W es igual a dos veces la media poblacional µ , esto es, ( )( ) 10 2 5WE W nµ µ= = = =

Por otro lado, la varianza de W es dos veces la varianza poblacional y se debe a que las muestras fueron de tamaño 2n = , así ( )2 2( ) 16 2 8WV W nσ σ= = = = .

Las dos observaciones anteriores se pueden justificar matemáticamente y no son producto de la casualidad. Se demostrarán estos resultados a través de un teorema, que podemos enunciar de la siguiente manera. Teorema1: Si de una población normal con media µ y varianza 2σ , se selecciona una muestra aleatoria de tamaño n 1 2 3, , , , nX X X XK , entonces la

variable suma, definida como 1 2 3 nW X X X X= + + + +L , es normal con valor

esperado o media ( ) WE W nµ µ= = y varianza ( ) 2 2

WV W nσ σ= = .

En forma resumida se puede decir que: 1) 1 2 3 nW X X X X= + + + +L , es una variable normal.

2) ( ) WE W nµ µ= = , es la media de W .

3) ( ) 2 2

WV W nσ σ= = , es la varianza de W . De este inciso se tiene que la

desviación estándar de la variable suma W es W nσ σ= , donde σ es la desviación estándar poblacional. Demostración: Dado que 1 2 3, , , , nX X X XK se consideran variables aleatorias

normales, ya que provienen de una población normal y ( ) ( ) 2,i iE X V Xµ σ= =

para toda 1,2,3, ,i n= K . El inciso 1 se justifica por la propiedad reproductiva de la variable normal, la cual asegura que, la suma de variables normales independientes es una variable normal. Los incisos 2 y 3 se desprenden de las propiedades del valor esperado y la varianza para una combinación lineal de variables aleatorias independientes.

( ) ( ) ( ) ( )1 1 2 2 1 1 2 2n n n nE a X a X a X a E X a E X a E X+ + + = + + + L L .

Así ( ) ( )1 2 3 nE W E X X X X nµ µ µ µ µ= + + + + = + + + + =L L , ya que 1ia =

Para el inciso 3, usamos la propiedad de la varianza que asegura lo siguiente:

( ) ( ) ( ) ( )2 2 2

1 1 2 2 1 1 2 2n n n nV a X a X a X a V X a V X a V X + + + = + + + L L

Así ( ) ( ) 2 2 2 2 2

1 2 3 nV W V X X X X nσ σ σ σ σ= + + + + = + + + + =L L .

Con lo cual, queda demostrado.

36

La importancia del teorema, estriba en que contamos con una variable aleatoria llamada suma W , que es normal y podemos obtener probabilidades de ella conociendo alguna información de la población, a través de la variable normal estándar Z . Basta que recordemos de los cursos de probabilidad, que toda variable normal X con media Xµ y desviación estándar Xσ , se puede llevar o transformar a la

variable normal estándar Z , cuya media es igual a cero y desviación estándar

igual a uno ( )0 , 1µ σ= = , mediante la relación X

X

XZ

µσ−= , donde Xµ es el

valor esperado o media de X y Xσ la desviación estándar de X .

Si la variable es W (suma de variables), entonces tendremos que la variable

normal estándar queda como: W

W

W W nZ

n

µ µσ σ− −= =

Con la variable Z , podemos llevar a cabo la estandarización de cualquier variable normal, lo que permitirá calcular probabilidades de esta última.

Proceso de estandarización de una variable normal

( ) ( )

, 0, 1

X

X

X X

XZ

X normal Z normal

µσ

µ σ µ σ

−=

⇒ = =

En el apéndice al final del libro, aparece la tabla 2 de valores para la variable normal estándar Z más usuales desde 0.00 hasta 3.59, así como sus probabilidades o áreas bajo la curva, en las columnas ( ) ( ) ( ),z z y D zΦ − Φ .

La columna ( )zΦ − nos da la probabilidad acumulada hasta z− o bien la

probabilidad de que la variable normal estándar Z sea menor o igual al valor negativo z− , es decir ( ) ( )z P Z zΦ − = ≤ −

En la figura 2 , se ilustra la curva normal estándar y la interpretación de la probabilidad o área bajo la curva a la izquierda de z− , que proporciona

( )zΦ − .

37

Figura 2

La columna ( )zΦ nos da la probabilidad de que la variable normal estándar

sea menor o igual al valor positivo z , es decir ( ) ( )z P Z zΦ = ≤

En la figura 3 , se muestra el área bajo la curva normal a la izquierda de z , como una probabilidad acumulada, que proporciona ( )zΦ

Figura 3

La columna ( )D z nos da la probabilidad de que la variable normal estándar Z ,

se encuentre entre los valores de z− y de z , ( ) ( )D z P z Z z= − ≤ ≤ , es decir el

área comprendida bajo la curva normal estándar entre los valores de z− y z . La figura 4 ilustra la probabilidad que representa ( )D z .

Figura 4

( ) ( )z P Z zΦ − = ≤ −

z−

Curva normal estándar


( ) ( )z P Z zΦ = ≤

z


z z−

( ) ( )D z P z Z z= − ≤ ≤

38

Nota: es importante mencionar que en las variables continuas, las probabilidades son la mismas si utilizamos los símbolos de orden > y < (mayor que y menor que) en lugar de los símbolos y≥ ≤ (mayor o igual que y menor o igual que). También en la tabla 2 del apéndice, aparece una tabla de porcentajes , que nos permite obtener los valores de la variable normal estándar a partir de las probabilidades o áreas bajo la curva y se podrán usar en el momento que sea necesario. Ejemplo 1 : Un elevador tiene una capacidad máxima para una tonelada, los pesos de las personas que lo usan cotidianamente se distribuyen normalmente con un promedio de 75 kg y desviación estándar de 10 kg. ¿Cual es la probabilidad de que al subirse 15 personas en un momento dado, se rebase la capacidad del elevador? Respuesta : Aquí tenemos un problema de suma de variables, es decir podemos suponer que 1 2 3 15W X X X X= + + + +L , representa el peso total de

las quince personas, tal que, es normal con 75 , 10µ σ= = para cada iX . Como se pregunta por la posibilidad de que se rebase la capacidad del elevador, entonces debemos calcular la probabilidad de que el peso total sea mayor que 1000 kg.

( )

( )( )

( )

10001000

1000 15 74 1000 1110 2.84

38.729815 10

W n nP W P

n n

P Z P Z P Z

µ µσ σ

− − > = >

− − = > = > = > −

Para obtener la probabilidad usamos de la tabla normal la columna ( )zΦ , ya

que, por la simetría de la curva normal se asegura que: ( ) ( ) ( )2.84 2.84 2.84 0.9977P Z P Z> − = < = Φ =

En la figura 5 se ilustra el porque podemos usar la columna ( )zΦ , para hallar

dicha probabilidad

Figura 5 Observemos que también podríamos apoyarnos de la propiedad del complemento para probabilidades, es decir,

( ) ( ) ( )2.84 1 2.84 1 2.84 1 0.0023 0.9977P Z P Z> − = − < − = − Φ − = − = .

Por lo tanto, la probabilidad de que la capacidad del elevador sea rebasada por quince personas es del 0.9977. Lo que significa que es muy grande la probabilidad de rebasar la capacidad del elevador.

( ) ( ) ( )2.84 2.84 2.84 0.9977P Z P Z> − = < = Φ =

2.84− 2.84

=

39

Ejemplo 2 : Los tiempos de duración de dos tipos A y B de focos se distribuyen normalmente, de modo que, los del tipo A tiene un promedio de duración de 700 horas, con una desviación de 25 horas y del tipo B un promedio de 650 horas y desviación de 20 horas. En una granja se usan 5 focos tipo A y 4 tipo B, de forma que cuando uno se funde se enciende otro inmediatamente. Calcular la probabilidad de que la duración de los 9 focos exceda a las 6200 horas. Respuesta : En este problema tenemos que la variable es la suma de los tiempos de duración para los 9 focos, luego entonces, definimos a W como:

A A A A A B B B BW X X X X X X X X X= + + + + + + + + , donde AX y BX representan los tiempos de duración del tipo A y B respectivamente, con

700 ; 650

25 ; 20

A B

A B

µ µσ σ

= == =

La media de W , queda así, ( ) ( )5 4 5 700 4 650 6100W A Bµ µ µ= + = + =

La varianza de W , es, ( ) ( )2 22 2 25 4 5 25 4 20W A Bσ σ σ= + = +

La desviación estándar de W es, ( ) ( )2 25 25 4 20 68.74Wσ = + =

La probabilidad de la duración total exceda a 6200 horas se obtiene de la siguiente manera.

( ) ( ) ( )6200 61006200 1.45 1.45 0.0735

68.74P W P Z P Z

− > = > = > = Φ − =

, de la tabla

normal. En la figura 6 se muestra que las probabilidades ( )1.45P Z > y ( )1.45P Z < −

son iguales, de nueva cuenta por la simetría de la normal

Figura 6 La probabilidad de que los 9 focos excedan a las 6200 horas es de 0.0735. 2.1.2 Distribución muestral para una media Ahora veremos la construcción de la distribución muestral para el promedio o media, es decir, consideraremos el estadístico ( )X media muestral y

trabajaremos con el mismo ejemplo utilizado en la distribución para la suma.

1.45 1.45−

( ) ( ) ( )1.45 1.45 1.45P Z P Z> = < − = Φ −

40

La población tiene cinco elementos { }1, 3, 5, 7, 9 , seleccionamos todas las

muestras de tamaño 2n = con reemplazamiento. La media y varianza poblacional son 5µ = y 2 8σ = respectivamente. Ahora construimos todas las muestras de tamaño 2n = con reemplazamiento. En la tabla siguiente aparecen en forma de parejas ordenadas, las 25 25= muestras.

( 1 , 1 ) 1

( 1 , 3 ) 2

( 1 , 5 ) 3

( 1 , 7 ) 4

( 1 , 9 ) 5

( 3 , 1 ) 2

( 3 , 3 ) 3

( 3 , 5 ) 4

( 3 , 7 ) 5

( 3 , 9 ) 6

( 5 , 1 ) 3

( 5 , 3 ) 4

( 5 , 5 ) 5

( 5 , 7 ) 6

( 5 , 9 ) 7

( 7 , 1 ) 4

( 7 , 3 ) 5

( 7 , 5 ) 6

( 7 , 7 ) 7

( 7 , 9 ) 8

( 9 , 1 ) 5

( 9 , 3 ) 6

( 9 , 5 ) 7

( 9 , 7 ) 8

( 9 , 9 ) 9

En la parte inferior de cada pareja al centro en negrillas está el valor de la media muestral ( )X y de nuevo se observa que asume diferentes valores

dependiendo de la muestra correspondiente, por lo que ( )X se comporta como

una variable aleatoria discreta y podemos anotar sus tres características fundamentales (distribución de probabilidades, valor esperado y varianza). Su distribución de probabilidades la presentamos como una correspondencia de probabilidades o un histograma de frecuencias relativas como aparecen en la figura 7 .

X ( )p X

1 1 0.0425

=

2 2 0.0825

=

3 3 0.1225

=

4 4 0.1625

=

5 5 0.2025

=

6 4 0.1625

=

7 3 0.1225

=

8 2 0.0825

=

9 1 0.0425

=

X

( )p X

1 2 3 4 5 6 7 8 9

0.20 . . . 0.04

Figura 7

41

El valor esperado de X , es el promedio de todos los valores que toma la media X y lo podemos denotar como ( )

XE X µ= , para el ejemplo tendremos que:

1 2 2 3 3 3 7 7 7 8 8 9 125( ) 5

25 25X

E X µ + + + + + + + + + + + += = = =L

La varianza de X , la denotamos por 2( )X

V X σ= y es la varianza de todos los

valores que toma X , es decir, para este caso se tiene que:

( ) ( ) ( ) ( ) ( ) ( )2 2 2 2 2 2

21 5 2 5 2 5 8 5 8 5 9 5 100

( ) 425 25

XV X σ

− + − + − + + − + − + −= = = =

L

Algo que se puede sacar como una primera observación del ejemplo, es que el valor esperado de X es igual la media poblacional, esto es ( )

XE X µ µ= = .

Por otro lado, la varianza de X es la mitad de la varianza poblacional y se debe

a que las muestras fueron de tamaño 2n = , así 2

2 8( ) 4

2 2X

V Xσσ= = = = .

Además de la distribución de probabilidades tiene forma simétrica, aproximada a una forma acampanada, es decir, aunque la variable X es discreta, su distribución de probabilidades se parece vagamente a una curva normal. Las observaciones que se acaban de dar, se pueden justificar matemáticamente y no solo por que aparecieron en este ejemplo, como más adelante se demostrará, cuando se establezcan los resultados a través del teorema 2. Por el momento, veremos que ocurre cuando el muestreo se realiza sin reemplazamiento, tomando el mismo ejemplo de la población de tamaño 5N = y las muestras de tamaño 2n = .

En la tabla se dan las 5 2

5!10

3!2!C = = muestras posibles que se pueden extraer

de la población sin reemplazamiento.

( 1 , 3 ) 2

( 1 , 5 ) 3

( 1 , 7 ) 4

( 1 , 9 ) 5

( 3 , 5 ) 4

( 3 , 7 ) 5

( 3 , 9 ) 6

( 5 , 7 ) 6

( 5 , 9 ) 7

( 7 , 9 ) 8

Tabla de las 10 muestras sin reemplazamiento El valor esperado de X es

2 3 4 4 5 5 6 6 7 8 50( ) 5

10 10X

E X µ + + + + + + + + += = = = , el cual coincide con la

media poblacional. La varianza de X es

( ) ( ) ( ) ( ) ( ) ( ) ( )

( )

2 2 2 2 2 2 2

2

2

2 5 3 5 2 4 5 2 5 5 2 6 5 7 5 8 5( )

10

303

10

X

X

V X

V X

σ

σ

− + − + − + − + − + − + −= =

= = =

42

Donde se puede ver que ahora la varianza de X , no es igual a la varianza poblacional 2σ dividida por el tamaño de las muestras ( 2n = ). Sin embargo si

se agrega el factor 1

N n

N

−−

a 2

n

σ, obtenemos la siguiente igualdad

( ) ( )2 5 2 8 33 4

5 1 2 4X

V X σ − = = = = − .

Para el muestreo sin reemplazamiento podemos concluir que:

( )( )

22

1)

2)1

X

X

E X

N nV X

N n

µ µ

σσ

= =

−= =−

Al factor 1

N n

N

−−

se conoce como corrección por población finita y puede

ignorarse cuando el tamaño de las muestras es pequeño en comparación con el tamaño de la población, ya que cuando la población es mucho más grande

que la muestra, la diferencia entre 2

n

σ y

2

1

N n

n N

σ −−

es despreciable.

Por ello conviene aclarar que el factor de corrección por población finita no se utiliza cuando trabajamos con poblaciones o variables normales, por considerarse infinitas. De modo que cuando se trabaje una población finita y la muestra sea menor que el 5% de la población, se podrá ignorar dicho factor de corrección. Ahora ya estamos en condiciones de generalizar algunos de los resultados que se obtuvieron en el ejemplo anterior, especialmente cuando el muestreo es con reemplazamiento o la población es normal, con el siguiente teorema que afirma lo siguiente. Distribución muestral para una media Teorema 2: Si se toma una muestra aleatoria de tamaño n de una población normal con media µ y varianza 2σ , entonces la media muestral X tiene las siguientes características.

1) La media de X es igual a la media poblacional µ , es decir,

( ) XE X µ µ= =

2) La varianza de X es igual a la varianza poblacional 2σ dividida por el

tamaño de la muestra n , es decir, ( )2

2

XV X

n

σσ= =

3) X es una variable normal. Demostración: De la definición de la media muestral X , de algunas propiedades del valor esperado y de la varianza para variables aleatorias se desprenden las tres características.

43

Dado que las observaciones 1 2 3, , , , nX X X XK provienen de una población con

media µ y varianza 2σ , se tiene que

( ) ( ) 2;i iE X V Xµ σ= = , para toda 1,2,3, ,i n= K luego se tiene que

1) ( ) ( ) ( ) ( )

( ) [ ]

1 1 21 2

1

1 1

n

i

i nn

XX X X

E X E E E X E X E Xn n n

E X nn n

µ µ µ µ µ

=

+ + + = = = + + +

= + + + = =

∑ LL

L

Lo que demuestra que la media de X o el valor esperado de X , es igual a la media poblacional µ .

2) ( ) ( ) ( ) ( )

( )

1 1 21 22

22 2 2 2

2 2

1

1 1

n

i

i nn

XX X X

V X V V V X V X V Xn n n

V X nn n n

σσ σ σ σ

=

+ + + = = = + + +

= + + + = =

∑ LL

L

Lo que demuestra que la varianza de X es igual a la varianza poblacional 2σ dividida por el tamaño de la muestra n .

3) La normalidad de X se desprende la propiedad reproductiva de la normal, que asegura que si se tienen variables normales, entonces la suma de estas es también es normal.

Dado que X se define como el producto del factor 1

ncon la suma de las iX y

cada iX se considera normal, por el hecho de que la población de donde se

toman es normal. Se puede concluir que la media muestral X es una variable normal. Si la variable es la media muestral X , entonces tendremos que la variable

normal estándar queda como

( )X

X

n XX XZ

n

µµ µσσ σ

−− −= = =

Ahora veamos algunos ejemplos en donde se hace uso de la distribución muestral para una media X y su estandarización.

44

Ejemplo 3 : Los diámetros de los tornillos producidos por una fabrica con determinadas especificaciones se distribuyen normalmente con una media de 50 milímetros y una desviación estándar de 5 milímetros. Si se selecciona una muestra aleatoria de 16 de estos tornillos, ¿cuál será la probabilidad de la media muestral no exceda a los 53 milímetros? Respuesta: Dado que la población de diámetros es normal, con µ σ= =50 5y

queremos la probabilidad de X sea menor o igual que 53, es decir, ( )53P X ≤

Para obtener esta probabilidad aplicamos los resultados del teorema 2 y la estandarización de X , como de indica a continuación.

( ) ( )53 53 50 353 2.40

5 1.25

16

XP X P P Z P Z P Z

n n

µ µσ σ

− − − ≤ = ≤ = ≤ = ≤ = ≤

Luego entonces, ( ) ( ) ( )53 2.40 2.40 0.9918P X P Z≤ = ≤ = Φ = de la tabla 2 para

la variable normal estándar.

Figura 8 Por lo tanto, la probabilidad de que la media muestral X sea menor o igual a 53 milímetros es de 0.9918 o del (99.18)% Ejemplo 4 : Los pesos de los tornillos se distribuyen normalmente con una media de 15.5 gramos y una varianza de 9 gramos cuadrados, si se toma una muestra aleatoria de 16 tornillos, ¿cuál será la posibilidad de que la media de esta muestra sea mayor o igual a 16 gramos? Respuesta : aplicando el teorema 2, tenemos que 215.5 ; 9 3yµ σ σ= = = .

Luego ( ) ( ) ( )

( ) ( )

0.5 416 15.516 0.67

3 3

16

0.67 1 0.67 1 0.7486 0.2514

P X P Z P Z P Z

P Z

−≥ = ≥ = ≥ = ≥

≥ = − Φ = − =

Se observa que para obtener la probabilidad de la tabla 2 de la curva normal, utilizamos la columna de ( )zΦ y la propiedad del complemento, ya que como

En la figura 8 , se ilustra la probabilidad de que la media

muestral X sea menor o igual que 53 y es la misma probabilidad de que la variable Z sea menor o igual a 2.40, como resultado de haber realizado la estandarización.

( ) ( )2.40 2.40 0.9918P Z ≤ = Φ =

2.40

45

se quiere el área bajo la curva que aparece a la derecha del valor 0.67 y la tabla proporciona el complemento, debemos restar al número uno la probabilidad 0.7486, como se ilustra en la figura 9 .

Figura 9 O bien por la simetría se tiene ( ) ( ) ( )0.67 0.67 0.67 0.2514P Z P Z≥ = ≤ − = Φ − =

Ejemplo 5 : Se ha determinado que el tiempo de vida útil para un producto A, es una variable normal con una desviación estándar de 4.5 años. Si se selecciona una muestra de 10 productos. ¿Cuál será la probabilidad de que la media muestral se aleje de la media poblacional en a lo más 5 años? Respuesta : Aunque no conocemos la media poblacional µ , nos están

pidiendo la probabilidad de que la media muestral X se encuentre alejada de la media poblacional µ , en a lo más 5 años, esto significa que debemos

obtener la probabilidad de que el valor absoluto de X µ− sea menor o igual a 5, es decir

( )

( ) ( ) ( )

( ) ( )

5

10

4.5

5 10 5 105 5 5 3.51 3.51

4.5 4.5

3.51 3.51 3.51 0.9996

P X

n

P X P X P Z P Z

P Z D

µ

σ

µ µ

− ≤

==

−− ≤ = − ≤ − ≤ = ≤ ≤ = − ≤ ≤

− ≤ ≤ = =

La probabilidad se obtiene de la tabla 2, utilizando la columna para ( )D z , ya

que se desea el área bajo la curva entre los valores -3.51 y 3.51, como se ilustra en la figura 10 .

Figura 10

0.67

( )0.67 0.7486Φ =

( ) ( )0.67 1 0.67 0.2514P Z ≥ = − Φ =

( )3.51 0.9996D =

-3.51 3.51

46

Ejemplo 6 : En referencia al ejemplo anterior, si se desea que la media muestral este alejada de la media poblacional en a lo más un año, con una probabilidad del 95%, ¿de que tamaño tendría que ser la muestra para alcanzar dicha probabilidad? Respuesta : En este ejemplo, ya conocemos la probabilidad de que 1X µ− ≤ ,

luego podemos escribir que, ( )1 0.95P X µ− ≤ = lo significa que:

( ) ( )1 1 1 0.954.5 4.5

n nP X P X P Zµ µ

−− ≤ = − ≤ − ≤ = ≤ ≤ =

Por otro lado, de la tabla 2 para porcentajes de la variable normal estándar, se tiene que cuando 1.96z = , ( )1.96 1.96 0.95P Z− ≤ ≤ = (ver figura 11 ).

Así podemos igualar 4.5

ncon 1.96 , para encontrar el tamaño de la muestra

como se índica.

( ) ( ) 2

1.96 1.96 4.5 1.96 4.5 77.794.5

nn n= ⇒ = ⇒ = ≈

Si tomamos 78n = podemos asegurar la precisión deseada. Por lo que la muestra será de78 productos.

Nota: El tamaño de la muestra, se podría obtener de maner a análoga igualando

4.5

n− con 1.96− .

2.1.3 Distribución muestral para una diferencia de medias. Consideremos ahora que se tienen dos poblaciones normales, la primera con media 1µ y varianza 2

1σ , y la segunda con media 2µ y varianza 2

2σ . La variable

1X representa la media de una muestra aleatoria de tamaño 1n tomada de la

primera población y 2X representa la media de una muestra aleatoria de

tamaño 2n seleccionada de la segunda población, de manera independiente.

Figura 11

-1.96 1.96

( ) ( )1.96 1.96 1.96 0.95D P Z= − ≤ ≤ =

47

Si queremos hacer una comparación de estas dos variables, podemos establecerla mediante la diferencia de ellas, es decir, 1 2X X− o bien 2 1X X− . Por ejemplo que beneficios propicia un medicamento A con respecto a otro medicamento B que atacan una misma enfermedad, cuando se tiene información suficiente sobre ellos, en cuanto su efectividad para curar una determinada enfermedad. O bien para comparar la calidad de dos tipos de concreto, en donde sabemos de ante mano, lo que pasa con las dos poblaciones. Cabe recordar que este capítulo, aun nos es parte propiamente de la estadística inferencial, ya que de la o las poblaciones, calculamos probabilidades de lo que le puede ocurrir a una o varias variables aleatorias muestrales. Como consecuencia de los teoremas 1 y 2, podemos asegurar que tanto 1X y

2X son variables normales, tales que la media y varianza de 1X son:

( )1

1 1XE X µ µ= = y ( )

1

22

1

1

XV X

n

σσ= = .

Para 2X la media y varianza serán

( )2

2 2XE X µ µ= = y ( )

2

22 2

2

2

XV X

n

σσ= = .

Luego para la variable diferencia de medias, afirmamos que 1 2X X− es normal por la propiedad reproductiva de variables normales, además.

( )

( )1 2

1 2

1 2

1 2 1 2

2 22 1 2

1 2

1 2

2 2

1 2

1 2

X X

X X

X X

E X X

V X Xn n

n n

µ µ µ

σ σσ

σ σσ

−

−

−

− = = −

− = = +

= +

Por las propiedades del valor esperado y varianza de una combinación lineal de variables.

( ) ( ) ( ) ( ) ( ) ( )2 2

1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2;E a Y a Y a E Y a E Y V a Y a Y a V Y a V Y+ = + + = + , tomando

1 1a = y 2 1a = −

48

La estandarización de la variable diferencia de medias 1 2X X− estará dada por

( ) ( )1 2 1 2

2 2

1 2

1 2

X XZ

n n

µ µ

σ σ

− − −=

+

Ejemplo 7 : En una compañía (I), el tiempo promedio para producir un artículo es de 12 minutos con una desviación estándar de 2 minutos, mientras que otra compañía (II) tarda en promedio 10 minutos para producir este tipo de artículo, con una desviación estándar de 1.5 minutos. Suponiendo que las poblaciones en los tiempos de producción son normales, se seleccionan aleatoriamente e independiente los tiempos de producción para 20 y 30 artículos para la compañía I y II respectivamente. Determine la probabilidad de que el tiempo promedio muestral de producción de los 20 artículos, exceda al tiempo promedio muestral de los 30 artículos en un minuto, pero no rebase a los tres minutos. Respuesta : Tenemos la siguiente información.

1 2

1 2

1 2

12 10

2 1.5

20 30

Compañia I Compañia II

n n

µ µσ σ

= == == =

Se quiere la probabilidad ( )1 21 3P X X< − < , al estandarizar tememos que:

( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

1 2 1 21 2 1 2

1 22 2 2 2 2 2

1 2 1 2 1 2

1 2 1 2 1 2

1 2 1 2

2 2 2 2

1 2 1 2

1 2 1 2

1 11 3

1 1 1 12 10 3 12 10

4 2.25 4 2.25

20 30 20 30

1.91

X XP X X P

n n n n n n

P Z P Z

n n n n

P Z

µ µµ µ µ µσ σ σ σ σ σ

µ µ µ µσ σ σ σ

− − −− − − − < − < = < < + + +

− − − − − − − − = < < = < < + ++ +

− <( ) ( )1.91 1.91 0.9439D< = =

De la tabla 2 para la normal estándar y la columna ( )D z obtenemos la

probabilidad. La figura 12 ilustra la probabilidad encontrada de 0.9439.

49

Figura 12 Ejemplo 8 : Se sabe que los pesos de los hombres (H) y mujeres (M) con edades de veinte a treinta años, se distribuyen normalmente. El peso medio y la varianza para los hombres son 280 16H Hyµ σ= = .

En el caso de la mujeres se tiene que 272 9M Myµ σ= = .

Si se seleccionan muestras aleatorias e independientes de 9H Mn n= = de hombres y mujeres respectivamente, obtenga la probabilidad de que el peso promedio muestral de hombres sea mayor a el peso promedio muestral de mujeres, en por lo menos 10 kilogramos. Respuesta : Queremos la probabilidad ( )10H MP X X− ≥

Luego al estandarizar tenemos que.

( ) ( ) ( )

( ) ( )

2 2

10 10 810 1.20

16 9

9 9

1.20 1.20 0.1151

H M

H M

H M

H M

P X X P Z P Z p Z

n n

P Z

µ µσ σ

− − − − ≥ = ≥ = ≥ = ≥ ++

≥ = Φ − =

1.20 – 1.20 La figura 13 nos indica la simetría de la curva normal y por ello las dos áreas bajo la curva representan el mismo valor de la probabilidad.

( ) ( )1.91 1.91 1.91 0.9439P Z D− < < = =

1.91− 1.91

Figura 13

50

2.1.4 Distribución muestral para una proporción. El cuarto estadístico que estudiaremos esta directamente ligado a la variable binomial, es decir al número de éxitos en una muestra aleatoria. La construcción de esta distribución muestral es similar a las ilustradas en el caso de la suma de variables W y la media X .

Definimos la proporción muestral como ˆ XP

n= , donde X es el número de

éxitos y n el tamaño de la muestra o el número de veces que se repite el experimento de Bernoulli. En este caso la variable P se distribuye binomialmente y en consecuencia hay que recordar que su distribución de probabilidades esta dada por la expresión:

( ), , n x n x

xb X x n p C p q −= =

Donde 0,1,2,3, ,x n= L . p , es la probabilidad de éxito o la proporción poblacional.

1q p= − , es la probabilidad de fracaso.

( )!

! !

n

x

nC

n x x=

−, es número de combinaciones posibles que se forman tomando

x de n objetos. El valor esperado y varianza de P son:

( ) ˆˆ

PE P pµ= = y ( ) ( )2

ˆ

1ˆP

p ppqV P

n nσ

−= = =

La justificación de estos resultados se desprende del valor esperado y varianza para la variable binomial X ( ) ( );E X np V X npq= = .

( ) ( )1 1ˆ XE P E E X np p

n n n

= = = =

; ( ) ( )2 2

1 1ˆ X pqV P V V X npq

n n n n

= = = =

Con cual queda demostrado. Ejemplo 9 : La probabilidad de una cierta raza de animales sobreviva de una enfermedad es de 0.70. Si se toma una muestra de 5 de estos animales, ¿cuál el la probabilidad de que sobrevivan a lo más 2 de ellos? Respuesta : En este problema no usamos la curva normal, ya que se trata de una variable discreta binomial. Queremos la siguiente probabilidad ( ) ( ) ( ) ( )2 0 1 2P X P x P x P x≤ = = + = + = .

Cada probabilidad se puede obtener usando la distribución o función de probabilidades binomial.

51

( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )

0 55

0

1 45

1

2 35

2

0 0.7 0.3 0.00243

1 0.7 0.3 0.02835

2 0.7 0.3 0.1323

P x C

P x C

P x C

= = =

= = =

= = =

Por lo que la probabilidad de que sobrevivan a lo más 2 animales es. ( )2 0.00243 0.02835 0.1323 0.16308P X ≤ = + + =

Esta probabilidad se puede interpretar también como la probabilidad de que la proporción muestral sea menor o igual que 0.40.

Ya que, ( ) ( )2 2ˆ ˆ2 0.40 0.163085 5 5

XP X P P P P P

≤ = ≤ = ≤ = ≤ =

En esta distribución muestral podemos darnos cuenta de que, si no garantizamos la normalidad de la población, no podemos asegurar que la variable en estudio se comporte en forma normal y por tanto no podemos recurrir a la curva normal estándar. Dicho de otra manera nos enfrentamos al problema que las variables muestrales no son normales debido a que la población es de naturaleza diferente o incluso desconocida. Afortunadamente existe uno de los teoremas considerados como más importantes en la estadística, conocido como del límite central o central del límite . 2.1.5 Distribución muestral para una diferencia de proporciones Cuando tenemos dos variables o poblaciones binomiales y tomamos muestras aleatorias e independientes de tamaños 1n y 2n respectivamente. Si se desea hacer una comparación, debemos considerar las proporciones de éxitos, no el número de éxitos, a menos que ambas muestras sean del mismo tamaño. Por ejemplo en las elecciones para presidente, se toma una muestra de 150 electores en un estado y se encuentra que 60 están a favor de candidato A, otra muestra tomada de un segundo estado de 200 electores arroja que 80 están a favor del candidato A. Claramente estás cifras no pueden se evaluadas y peor aún comparadas, a menos que se lleven a proporciones. Esto quiere decir, que requerimos de un modelo o distribución de probabilidades especifico para la diferencia de proporciones muestrales. A continuación presentamos las principales características de esta variable. Sean dos poblaciones I y II, con probabilidades de éxito 1p y 2p respectivamente, se obtienen dos muestras aleatorias independientes, la primera muestra de tamaño 1n tomada de la población I y la segunda de

tamaño 2n tomada de la población II, entonces la diferencia de proporciones

muestrales la definimos como 1 21 2

1 2

ˆ ˆ X XP P

n n− = − , donde 1X es el número de

éxitos en la primera muestra y 2X es el número de éxitos de la segunda muestra. Por el momento, diremos que el valor esperado de 1 2

ˆ ˆP P− es

( )1 2 1 2ˆ Ê P P p p− = − , dado que ( )1 1

Ê P p= y ( )2 2Ê P p= por lo visto en la

distribución muestral para una proporción.

52

La varianza de 1 2

ˆ ˆP P− es

( ) ( ) ( )1 1 2 2 1 1 2 21 2

1 2 1 2

1 1ˆ ˆ p p p p p q p qV P P

n n n n

− −− = + = + , donde 1 11q p= − , 2 21q p= − y

recordando que las varianzas de 1P y 2P son:

( ) ( ) ( ) ( )1 1 2 21 1 2 21 2

1 1 2 2

1 1ˆ ˆ;p p p pp q p q

V P V Pn n n n

− −= = = = , respectivamente.

La desviación estándar de 1 2ˆ ˆP P− es

( ) ( )1 2

1 1 2 2

ˆ ˆ

1 2

1 1P P

p p p p

n nσ

−

− −= + .

Para poder trabajar con esta diferencia resulta todavía más indispensable el teorema del límite central que enunciamos en la siguiente sección. Acabamos de analizar cinco variables muestrales que fueron la suma de variables W , la media muestral X , la diferencia de medias muestrales

1 2X X− , la proporción muestral P y la diferencia de de proporciones 1 2ˆ ˆP P− .

En la tres primeras se suponía que la o las poblaciones tenían que ser normales para garantizar que las variables en estudio fueran normales y en las dos últimas (proporciones) no podemos hablar de normalidad, entonces surge una pregunta a este respecto, cuándo la población no es normal o no conocemos su naturaleza, ¿qué podemos decir de la variable muestral? La respuesta a esta pregunta la encontramos en el siguiente teorema. 2.2 Teorema del Límite Central (T L C) y sus aplica ciones El nombre le fue dado por G. Polya en 1920 y su valor tanto teórico como práctico es que no requiere virtualmente de condiciones para las poblaciones o las distribuciones de probabilidades de las variables aleatorias, sino que más bien al tamaño de la muestra o muestras aleatorias sacadas de la población. Se dice que De Moivre lo introdujo por vez primera en el siglo XVIII y ha sido expresado de muchas formas dicho teorema. Por cuestiones de mero orden lo enunciaremos para la variable suma W , aunque se podrá generalizar a prácticamente a cualquier variable bajo las condiciones que se establecen. Teorema del Límite Central: Dada una población con media µ y varianza 2σ . Si 1 2 3 nW X X X X= + + + +L es la suma de variables aleatorias independientes

con misma distribución, entonces la variable W n

n

µσ

− es normal estándar

cuando el tamaño de la muestra n se hace infinito. Lo que dice en otras palabras el teorema, es que, sin importar como sea la población, la variable suma W será aproximadamente normal cuando el tamaño de la muestra n sea suficientemente grande. Además no se reduce a la suma, sino que podemos extender está afirmación a la media X , a la diferencia de medias 1 2X X− , a la proporción P , a la diferencia de

proporciones 1 2ˆ ˆP P− , etcétera.

53

La utilidad práctica del teorema es que podemos llevar la variable suma W a la variable normal estándar Z, como ya lo habíamos indicado en la distribución muestral para la suma W , es decir,

( ) ( ), 0,1

W n n Normal Z

W nZ

n

µ σ

µσ

⇒

−=

En cuanto, a cuán grande debe ser el tamaño de la muestra n para poder aplicar el teorema, se tiene una respuesta determinada. Esto depende de la precisión de la aproximación requerida y la población. Si la población es normal la variable será normal sin importar el valor n . Si no se sabe nada acerca de la población, podemos usar como convención que cuando n sea mayor o igual a treinta ( )30n ≥ la variable muestral es prácticamente normal. Diciendo que si n

aumenta, las aproximaciones serán cada vez mejores. Ahora veremos algunas aplicaciones del teorema en las distribuciones muestrales, principalmente en la de una proporción y una diferencia de proporciones. Cuando se pasa de una variable aleatoria discreta a una continua como la normal, por lo regular se agrega un factor de corrección por continuidad

1

2n

para obtener una mejor aproximación en el calculo de las probabilidades,

sin embargo, cuando se aplique el teorema del límite central ignoraremos dicho factor de corrección, a menos que se indique lo contrario. Aplicaciones del Teorema del Límite Central (T L C ) Ejemplo 10 : Un barco carguero tiene capacidad para 10 000 toneladas. Se sabe que el peso promedio de los contenedores es aproximadamente de 49 toneladas, con una desviación estándar de 7 toneladas. Se van a transportar 200 de estos contenedores, ¿cuál es la probabilidad de que no sea rebasada la capacidad del barco? Respuesta : Observemos que en este problema no sabemos como es la población y estamos hablando de la variable suma de pesos para los 200 contenedores, como la muestra es suficientemente grande ( )200n = , por el

teorema de limite central podemos decir que 1 2 200W X X X= + + +L es normal, con

( )( )

200 49 9800

200 7 98.99

W

W

n

n

µ µ

σ σ

= = =

= = =

Ya que, 48 7yµ σ= = es el peso promedio y desviación estándar poblacionales respectivamente.

Normal estándar

54

Luego, la probabilidad que se quiere calcular es ( )10000P W ≤ , al estandarizar

la variable W , nos queda lo siguiente:

( ) ( ) ( )10000 980010000 2.02 2.02 0.9783

98.99P W P Z P Z

− ≤ = ≤ = ≤ = Φ =

de la tabla 2 para la curva normal estándar. Por lo tanto la probabilidad de que la capacidad del barco no sea rebasada es de 0.9783 o (97.83)% Ejemplo 11 : Los tiempos “muertos” en una empresa en promedio son de 1.6 horas con una desviación de 0.5 horas. Si se selecciona una muestra de 100 empleados de dicha empresa, ¿cuál es la probabilidad de que la media muestral sea inferior a 1.65 horas? Respuesta : Aquí tenemos como variable a la media muestral X y queremos la probabilidad de que la media X sea menor que 1.65. De nuevo por el teorema del límite central, dado que la muestra es grande, X es normal y entonces la podemos estandarizar, para obtener la probabilidad requerida.

( ) ( ) ( )1.65 1.61.65 1 1 0.8413

0.5

100

100

0.5

100

P X P Z P Z

n

µσ

−< = < = < = Φ =

===

Por lo tanto la probabilidad de que la media muestral sea inferior a 1.65 horas es de 0.8413 o (84.13)% Ejemplo 12 : El tiempo de duración promedio de los refrigeradores en un modelo particular es de 6µ = años, con una varianza 2 9σ = . Al tomar una muestra aleatoria de 36 de estos refrigeradores, ¿cuál será la probabilidad de que la media muestral se encuentre entre 5.5 y 7.1 años inclusive? Respuesta : Como la muestra es suficientemente grande, podemos usar el teorema del límite central para garantizar la normalidad de la media muestral.

6

9 3

36n

µσ

=

= ==

( ) ( ) ( ) ( )5.5 6 7.1 65.5 7.1 1 2.2 2.2 1

3 3

36 36

0.9861 0.1587 0.8274

P X P Z P Z

− −≤ ≤ = ≤ ≤ = − ≤ ≤ = Φ − Φ −

= − =

55

Ejemplo 13 : Se tiene una población uniforme discreta, tal que,

( )1

2,4,63

0

si xf x

en otro caso

==

Obtenga la probabilidad de que una muestra aleatoria de tamaño 54, dé una media muestral mayor a 4.1 pero menor que 4.4 (ignorar el factor de corrección por continuidad) Respuesta : La variable X uniforme tiene como valor esperado y varianza:

( ) ( )

( ) ( ) [ ] [ ]2 22 2 2 2 2

1 1 1 122 4 6 4

3 3 3 3

1 1 12 4 6 4 2.67

3 3 3

i i

i i

E X x f x

V X x f x

µ

σ µ

= = = + + = =

= = − = + + − =

∑

∑

La desviación estándar es 2.67 1.634σ = =

Luego la probabilidad de la media muestral X sea mayor a 4.1 y menor que 4.4 por el T. L. C. queda como:

( )

( ) ( ) ( )

4.1 4.4 4.1 4 4.4 44.1 4.4

1.634 1.634

54 54

0.45 1.80 1.80 0.45 0.9641 0.6736 0.2905

XP X P P Z

n n n

P Z

µ µσ σ σ

− − − −< < = < < = < <

= < < = Φ − Φ = − =

Por lo tanto la probabilidad requerida es 0.2905 aproximadamente. Ejemplo 14 : Supóngase que se ha establecido, que para cierto tipo de cliente, la duración media de una visita domiciliaria realizada por una enfermera es de 38 minutos, con una desviación estándar de 10 minutos, y que, para un segundo tipo de cliente, la visita domiciliaria media dura 20 minutos, con una desviación estándar 8 minutos. Si una enfermera visita aleatoriamente 35 clientes del primer tipo y 40 del segundo tipo de manera independiente, ¿cuál es la probabilidad que la duración media de la visita difiera entre los dos grupos en 20 más minutos? Respuesta : En este ejemplo se trata de una diferencia de medias y no se hace mención de la forma de las poblaciones, es decir suponemos que las poblaciones no son normales, sin embargo como las muestras son grandes (mayores de 30) la diferencia de las medias muestrales es aproximadamente normal con media y varianza siguientes.

( ) ( )1 2

1 2

1 2

2 22 22 1 2

1 2

38 20 18

10 84.457

35 40

X X

X Xn n

µ µ µ

σ σσ

−

−

= − = − =

= + = + =

56

Al estandarizar, tenemos la probabilidad de que la diferencia de medias sea mayor o igual a 20 minutos.

( ) ( ) ( )1 2

20 1820 0.95 1 0.95 1 0.8289 0.1711

4.457P X X P Z P Z

− − ≥ = ≥ = ≥ = − Φ = − =

En los siguientes ejemplos se presentan las distribuciones muestrales para una proporción y una diferencia de proporciones, en donde nos apoyaremos del teorema del límite central para poder trabajar con la variable normal. Por cuestiones meramente practicas, muestras grandes se consideran cuando son mayores o iguales a 30, como se dijo anteriormente, o bien, se puede usar el criterio de que si tanto np como np(1-p) son mayores que 5, la aproximación a la normal es bastante aceptable sin necesidad de recurrir al factor de corrección por continuidad. Ejemplo 15 : En base a muchos años de experiencia se sabe que el 60%(p=0.60) de la población en edad adulta, tiene problemas de hipertensión arterial. Se selecciona una muestra aleatoria de 100 adultos. Determine la probabilidad que al menos 70 de ellos tengan hipertensión arterial.

Respuesta : Recordemos que para una proporción muestral ˆ XP

n= su media

(valor esperado) y varianza son:

( ) ( ) ( )2

ˆ ˆ

1ˆ ˆP P

p pE P p y V P

nµ σ

−= = = =

La desviación estándar es ( )

ˆ

1P

p p

nσ

−=

Donde, p es la proporción poblacional o la probabilidad de éxito y n el tamaño de la muestra.

El teorema del límite central (T L C), permite asegurar que la proporción ˆ XP

n=

es aproximadamente normal dado que la muestra es grande ( )100 30n = ≥

O bien ( )60 5 1 24 5np y np p= ≥ − = ≥ , ya que 0.60p = .

Para estandarizar contamos con la expresión

( )ˆ

ˆ

ˆ ˆ

1

P

P

P P pZ

p p

n

µσ− −= =

−

Luego entonces la probabilidad de que al menos 70 adultos tengan problemas de hipertensión es.

57

( ) ( ) ( ) ( )( )

ˆ 0.70 0.70 0.60ˆ 0.70 2.041 1 0.60 0.40

100

P p pP P P P Z P Z

p p p p

n n

− − − ≥ = ≥ = ≥ = ≥ − −

De la tabla normal, se tiene que ( ) ( )2.04 2.04 0.0207P Z ≥ = Φ − =

Por lo que, la probabilidad de que al menos 70 adultos de 100, padezcan hipertensión arterial es de 0.0207. Ejemplo 16 : Si uno de cada cinco tornillos producidos en una fabrica presentan un defecto ligero, ¿cuál será la probabilidad de en una muestra de 1000 tornillos menos de 185 tengan algún defecto ligero?

Respuesta : La proporción de tornillos con defectos ligeros es 1

0.205

p = = y

por el (T L C), la proporción muestral P es aproximadamente normal, debido a que la muestra es grande.

Se quiere la probabilidad ( )185 ˆ 0.1851000

XP P P

n

< = <

y al estandarizar

( ) ( ) ( ) ( )

( ) ( )

ˆ 0.185 0.185 0.20ˆ 0.1851 1 0.20 0.80

1000

1.19 1.19 0.1170

P p pP P P P Z

p p p p

n n

P Z

− − − < = < = < − −

< − = Φ − =

Ejemplo 17 : En una prueba de opción múltiple con 130 preguntas, cada una de ellas tiene 4 opciones (de las que exactamente una es la correcta), es decir, la probabilidad de éxito es de uno de cuatro. Un aspirante realiza la prueba y

contesta las todas las preguntas al azar (1

0.254

p = = ), ¿cuál la posibilidad de

que pase la prueba? Respuesta : Para que pase la prueba debe obtener el 60% de aciertos, lo cual significa que debe obtener 0.60 (130) = 78 respuestas correctas de las 130 que consta la prueba.

Así, La posibilidad de que pase es ( ) ( )78 ˆ78 0.60130 130

XP X P P P

≥ = ≥ = ≥

Al estandarizar tenemos que

( ) ( )( )0.60 0.25ˆ 0.60 8.15 0

0.60 0.40

130

P P P Z P Z

− ≥ = ≥ = ≥ ≈

58

En la tabla 2, no aparece el valor de 8.15, debido a que prácticamente el 100% del área bajo la curva normal se localiza entre el – 3.59 y el 3.59. Como el valor 8.15 está fuera del intervalo y se quiere que la variable normal estándar sea mayor o igual, se concluye que prácticamente es igual a cero la probabilidad requerida. Para la diferencia de proporciones muestrales 1 2

ˆ ˆP P− , si las muestras son

suficientemente grandes ( )1 1 1 1 2 2 2 2, , 5n p n q n p y n q ≥ e independientes, podemos

estandarizar la variable mediante la expresión

( ) ( )( ) ( )

( ) ( )1 2 1 2 1 2 1 2

1 1 2 21 1 2 2

1 21 2

ˆ ˆ ˆ ˆ

1 1

P P p p P P p pZ

p q p qp p p p

n nn n

− − − − − −= =

− − ++

Donde 1 2p y p son las proporciones poblacionales. Ejemplo 17 : En dos ciudades A y B se sabe que la proporción de personas que están en contra de una nueva ley es de 0.40 y 0.31 respectivamente. Se seleccionan muestras aleatorias e independientes de 60 y 70 personas de las ciudades A y B en forma respectiva. Obtenga la probabilidad de que la diferencia de proporciones de estas muestras sea superior al 12%, pero menor del 18%. Respuesta : De nueva cuenta por el (T L C), dado que las muestras son grandes, podemos trabajar con la variable normal estándar. Se nos dice que 1 20.40 0.31p y p= = ( )1 2 0.09p p− = , además 1 260 70n y n= =

Luego, la probabilidad pedida queda como:

( )

( )( ) ( )

( ) ( )( ) ( )

( )( ) ( )

( ) ( ) ( ) ( )

1 2

1 2 1 21 2 1 2

1 1 2 2 1 1 2 2 1 1 2 2

1 2 1 2 1 2

ˆ ˆ0.12 0.18

ˆ ˆ0.12 0.18

1 1 1 1 1 1

0.12 0.09 0.18 0.09

0.4 0.6 0.31 0.69 0.4 0.6 0.31 0.69

60 70 60 70

0.3

P P P

P P p pp p p pP

p p p p p p p p p p p p

n n n n n n

P Z

P

≤ − ≤

− − −− − − − = ≤ ≤ − − − − − − + + +

− − = ≤ ≤

+ +

= ( ) ( ) ( )6 1.07 1.07 0.36 0.8577 0.6406 0.2171Z≤ ≤ = Φ − Φ = − =

59

Ejemplo 18 : Con referencia al ejemplo anterior, supóngase que se quiere obtener la probabilidad de que la diferencia de proporciones muestrales sea de a lo más 12% y de al menos 18%. Respuesta : Se quiere la probabilidad del complemento, es decir

( ) ( ) ( )1 2 1 2 1 2ˆ ˆ ˆ ˆ ˆ ˆ0.12 0.18 1 0.12 0.18 1 0.2171

0.7829

P P P P P P P P P− ≤ + − ≥ = − ≤ − ≤ = −

=

2.3 Distribución t de Student Las variables estudiadas en las secciones anteriores, prácticamente tienen una característica común y es que se reducen a variables normales, sea por que el comportamiento de las poblaciones son normales o por el teorema del límite central. En la segunda distribución muestral que se analizo, es decir la de la media muestral X considerábamos que la población era normal con media µ y varianza 2σ (la desviación estándar es σ ) y por consecuencia la variable normal estándar quedaba como:

( )X nXZ

n

µµσ σ

−−= =

Una pregunta que se plantea ahora es ¿qué pasa cuando la varianza poblacional 2σ es desconocida? Si la muestra es grande, podemos utilizar la varianza muestral

( )2

2 1

1

n

i

i

X X

Sn

=

−=

−

∑ para aproximar a la varianza poblacional 2σ .

O bien la desviación muestral( )2

1

1

n

i

i

X X

Sn

=

−=

−

∑ como aproximación de la

desviación poblacional σ y aún podríamos trabajar con la variable normal Z . Pero si la muestra es pequeña ( )30n < , a pesar de que la población fuese

normal, no podemos asegurar que la variable sea normal, es decir la variable

( )X nX

S S

n

µµ −− =

tiene una distribución de probabilidades diferente a la distribución normal, a la que se le llamó distribución t de Student y fue dada a conocer por W.S. Gosset en 1908, cuando trabajaba en una empresa cervecera, que les prohibía a sus empleados hacer investigaciones dentro de las jornadas laborales, por ello sus publicaciones las presentaba bajo el seudónimo de Student. Una variable T de student se escribe como

60

( )X nXT

S S

n

µµ −−= =

Como se aprecia es muy similar a la variable normal, la justificación teórica queda fuera de los alcances del libro, a cambio de ello mencionaremos sus principales propiedades que nos permitan poder trabajar principalmente las tablas probabilísticas de ella, su distribución de probabilidades de esta variable comúnmente reconoce como distribución t . Propiedades de la distribución t

1) Tiene una media o valor esperado de 0. 2) Es simétrica con respecto a la media. 3) Es asintótica con respecto al eje horizontal. 4) La varianza es mayor que 1 y se aproxima a 1 cuando el tamaño de la

muestra se hace grande. 5) La variable T toma valores desde −∞ hasta +∞ . 6) En realidad, la distribución t es una familia de distribuciones de

probabilidades, ya que se tiene una distribución diferente para cada valor de 1n− , el divisor usado al calcular la varianza muestral 2S .

7) Comparada con la distribución normal, la distribución t es menos alta en el centro y sus extremos son más altos.

La figura 14 ilustra la comparación de la distribución t con la normal estándar.

Figura 14 La distribución t , como la normal estándar tiene su tabla de valores para T y las áreas bajo la curva a la derecha de ellos, correspondientes a los grados de libertad. Como ya se dijo, para cada 1n − , está cantidad recibe el nombre de grados de libertad y tendremos diferentes distribuciones de probabilidad, por consecuencia diferentes valores de la variable T por cada valor que tome

1n − , a pesar de que la probabilidad sea la misma.

Distribución normal

Distribución t

0

61

La noción de grados de libertad , en forma intuitiva puede entenderse, para el caso de la varianza muestral 2S de la siguiente manera. Supongamos que se toma una muestra de tamaño 1 de una población, si tratamos de calcular la varianza de la muestra sería igual a cero, ya que solo se tiene una observación y no proporciona información sobre la varianza. En otras palabras para conocer algo de la varianza por lo menos la muestra debe ser mayor o igual a 2 . Ahora, si 2n = , uno u otro de los valores no nos dice algo acerca de la varianza; solo un segundo valor proporciona alguna información. Así, la varianza se basa en un solo dato de los dos de la muestra. En este caso, decimos que solo hay 2 1 1− = grados de libertad en el cálculo de la varianza muestral, por lo que en una muestra de tamaño n se pierde un grado de libertad, luego entonces el número de grados de libertad es 1n − . Otra forma de explicar el concepto de grados de libertad, es, el de suponer que se tiene una muestra de n personas y n sillas para sentarse en un salón. Estas personas se forman para entrar una por una, al salón y tomar una silla, la primera tiene libertad de elegir cualquiera de las sillas, la segunda también tiene libertad de escoger, así sucesivamente, hasta llegar a la penúltima, la cual todavía tiene libertad de seleccionar una de las dos sillas que quedan sin ocuparse. La última ya no tiene libertad de elección, es decir solo le queda sentarse el la silla sobrante, ello significa que de las n personas solo 1n− tienen libertad de escoger alguna silla. En la tabla 3 del apéndice, aparecen las probabilidades o porcentajes más usuales de la función inversa acumulada y sus correspondientes valores de la

variable, es decir las áreas bajo la curva t a la derecha de cada tα , donde

tα es un valor que toma la variable y α es la probabilidad de que la variable

T sea mayor o igual que dicho valor tα , así ( )P T tα α≥ =

En la figura 15 se muestra la probabilidad que representa α .

Figura 15

Aunque en la tabla aparecen solo valores positivos de tα , se pueden

considerar valores negativos ( tα− ), de acuerdo a la simetría de la

distribución t , así como probabilidades diversas apoyándonos de esta propiedad. Los ejemplos que siguen buscan, ilustrar el uso y manejo de la tabla 3 para distribución t .

tα

( )P T tαα = ≥

Distribución t

62

Ejemplo 18 : Realizar lo que se pide en cada inciso.

1) Con 15 grados de libertad obtener ( )1.812P T ≥ .

2) Con 15 grados de libertad obtener ( )1.4415P T ≤ − .

3) Con 22 grados de libertad obtener ( )1.0614P T > .

4) Con 17 grados de libertad obtener ( )2.567P T < − .

5) Con 8 grados de libertad calcule ( )1.928 1.928P T− ≤ ≤

6) Con 25 grados de libertad encuentre ( )1.893 1.3472P T− ≤ ≤

Respuesta :

1) ( )1.812 0.045P T ≥ = , ya que al ir a la tabla localizamos en la primera

columna los 15 grados de libertad y sobre el renglón hacia la derecha encontramos el valor de 1.812 corresponde un valor de 0.045α = , este valor lo proporciona directamente la tabla, por queremos que 1.812T ≥ .

2) Para esta probabilidad, recordemos que la distribución t es simétrica, por lo que, ( ) ( )1.4415 1.4415 0.085P T P T≤ − = ≥ = con 15 grados de

libertad.

Figura 16

En la figura 16 se observa por que las probabilidades para valores recíprocos son iguales.

3) Como la variable T es continua, entonces ( ) ( )1.0614 1.0614P T P T> = ≥

con 22 grados de libertad, luego ( )1.0614 0.15P T ≥ = .

4) Por señalado en el inciso 2), la simetría permite decir con 17 grados de

libertad que ( ) ( )2.567 2.567 0.010P T P T< − = > = .

5) Para esta probabilidad ( )1.928 1.928P T− ≤ ≤ con 8 grados de libertad,

buscamos el valor de 0.045α = para 1.928 y como queremos el área bajo la curva desde 1.928− hasta 1.928 tenemos que:

( ) ( )1.928 1.928 1 2 1 2 0.045 0.91P T α− ≤ ≤ = − = − =

( ) ( )1.4415 1.4415 0.085P T P T≤ − = ≥ =

Distribución t

1.4415− 1.4415

63

Figura 17 En la figura 17 se muestra la probabilidad de que T este entre los valores dados

6) Para esta probabilidad usamos dos valores de α , debido a que no son

recíprocos, es decir con 25 grados de libertad para 1.3472 tenemos 0.095 y para 1.893− se tiene 0.035 . Por lo tanto ( )1.893 1.3472 1 0.095 0.035 0.87P T− ≤ ≤ = − − = , como se

aprecia en la figura 18

Ejemplo 19 : Encuentre los valores de a y b según el caso.

1) ( ) 0.090P T a≥ = con 11 grados de libertad.

2) ( ) 0.005P T a> = con 4 g. l.

3) ( ) 0.025P T b≤ = con 10 g. l.

4) ( ) 0.90P a T a− ≤ ≤ = con 23 g. l.

5) ( ) 0.95P a T a− ≤ ≤ = con 12 g. l.

6) ( ) 0.99P a T a− ≤ ≤ = con 7 g. l.

Respuesta : De la tabla para la distribución t de Student.

1) Como 0.090α = , entonces con 11 g. l. el valor es 1.4318a = . 2) Dado que 0.005α = , con 4 g. l. el valor es 4.604a = .

( )1.928 1.928 0.91P T− ≤ ≤ =

1.928 1.928−

0.045α = 0.045α =

( )1.893 1.3472 0.87P T− ≤ ≤ =

1.3472 1.893−

0.095α = 0.035α =

Figura 18

64

3) 0.025α = , con 10 g. l. como ( )P T b α≤ = , b es negativo, 2.228b = −

4) Aquí 1 2 0.90α− = , luego 0.05α = con 23 g. l., por lo que 1.714a = . 5) 1 2 0.95α− = , entonces 0.025α = con 12 g. l. así 2.179a = . 6) 1 2 0.99α− = , entonces 0.005α = con 7 g. l. luego 3.499a = .

2.4 Distribución ji o Chi- cuadrada Otra variable que se presenta sobre todo cuando tenemos muestras pequeñas tomadas de una población normal, es la chi-cuadrada o ji-cuadrada y el símbolo que se usa para denotarla es 2χ . Del mismo modo que la variable T de Student, no daremos su justificación teórica, ya que nos interesa más el aspecto utilitario de su distribución de probabilidades, por lo que mencionaremos algunas de sus principales características, así como una variable muestral en especial que se comporta de acuerdo la chi-cuadrada. Si 2S es la varianza de una muestra aleatoria de tamaño n tomada de una población normal con varianza 2σ , entonces el estadístico

( ) 2

2

2

1n Sχ

σ−

=

tiene una distribución chi-cuadrada con 1nν = − grados de libertad. Las principales propiedades de la distribución chi-cuadrada son:

• La variable 2χ toma solamente valores mayores o iguales a cero. • La distribución chi-cuadrada no es simétrica, en la figura 19 aparece

una curva que describe a esta distribución.

• Es asintótica con respecto al eje horizontal

2χ

Distribución chi-cuadrada

Figura 19

65

• Se tiene una distribución de probabilidades chi-cuadrada diferente, para cada valor de 1n −

• La probabilidad de que una muestra aleatoria produzca un valor de 2χ

mayor que algún valor especificado, es igual al área bajo la curva a la derecha de este valor. Se acostumbra que 2

αχ represente el valor de 2χ adelante del cual de halla un área igual a α . En la figura 20 se ilustra el área sombreada que representa a dicha probabilidad ( )2 2P αχ χ> .

La tabla 4 en el apéndice, se proporcionan valores de 2χ para diversos valores de α y ν grados de libertad. Los encabezados de las columnas son las áreas α , la columna de la izquierda los grados de libertad ν y el resto de la tabla los valores de 2χ .Por lo tanto, el valor de 2χ con 14 grados de libertad que deja

un área de 0.025 a la derecha, es 2 26.1189αχ = .

Aunque la curva no es simétrica, la tabla también nos da los valores de 2χ para los complementos de cada α , es decir para 1 α− , por ejemplo con 14 grados de libertad y un área a la derecha de 0.975 el valor de 2χ es

2 5.5287αχ = . Esto facilita el uso y manejo de la tabla chi-cuadrada. La figura 21 ilustra lo anterior.

Figura 21

( )2 2P αα χ χ= >

2

αχ

1 α−

Figura 20

26.1189 5.6287

( )2 26.1189 0.025P χ > = ( )2 5.6287 0.975P χ > =

2χ 2χ

66

Ejemplo 20 : Mediante la tabla 4 para distribución chi-cuadrada obtenga el valor requerido de acuerdo a los grados de libertad ν y la probabilidad o área α .

a) Obtener el valor de 2χ , con 8ν = g.l. y 0.100α =

b) Obtener el valor de 2χ , con 23ν = g.l. y 0.150α =

c) Hallar el valor de 2χ , con 17ν = g.l. y 0.990α = Respuesta : De la tabla 4 de la distribución chi- cuadrada tenemos que.

a) 2 13.3616αχ = con 8 g. l.

b) 2 29.9792αχ = con 23 g. l.

c) 2 6.4077αχ = con 17 g. l. 2.4 Distribución F de Fisher Otra distribución muestral importante en la estadística es la distribución F. El estadístico F se define como una razón de dos variables aleatorias independientes con distribución chi-cuadrado, dividida cada una por sus grados de libertad y puede expresar como

1

2

UF

V

νν

= ,

donde U y V son variables aleatorias independientes que tienen distribución chi-cuadrada, con 1ν y 2ν grados de libertad, respectivamente. El número de grados de libertad asociado a la variable con distribución chi-cuadrada que aparece en el numerador de F se escribe siempre en primer lugar, seguido del número de grados de libertad asignado a la variable con distribución chi-cuadrada que se encuentra en el denominador. Esto quiere decir que, la curva de la distribución F no solo depende de los grados de libertad 1ν y 2ν , sino del orden en que se enuncian.

La figura 22 ilustra a fα como el valor de F , para el cual la probabilidad de

que la variable F sea mayor a fα es igual a α y α es el área bajo la curva a la

derecha de fα .

( )P F fαα = >

fα

1 α−

Figura 22

F

67

En la tabla 5 del apéndice se proporcionan valores de fα para las probabilidades 0.005α = , 0.01α = , 0.02α = , 0.025α = , 0.05α = y 0.10α = para grados de libertad del numerador y del denominador desde 1 a 30. Así por ejemplo el valor que toma la variable F con 12 grados de libertad para el numerador y 7 para el denominador que produce un área a la derecha de

0.01α = es 6.469fα = , es decir

( )6.469 0.01P F > = , con 1 12ν = y 2 7ν = con grados de libertad para el

numerador y denominador respectivamente. La notación que usaremos para escribir el valor de la variable F con un área α a la derecha de él con 1ν y 2ν grados de libertad para el numerador y

denominador respectivamente será ( )1 2,fα ν ν .

Por lo tanto, escribiremos el valor anterior como sigue ( )0.01 12,7 6.469f = .

Otros valores de la tabla 5 son: ( ) ( )

( ) ( )( ) ( )

0.005 0.025

0.01 0.05

0.02 0.10

6,21 4.393 ; 9,14 3.209

18,15 3.423 ; 12, 27 2.132

24,26 2.306 ; 10,15 2.059

f f

f f

f f

= =

= =

= =

Para hallar valores de 1f α− , es decir de:

0.995 0.99 0.98 0.975 0.95 0.90, , , ,f f f f f y f , usamos la siguiente propiedad que asegura

( ) ( )1 1 2

2 1

1,

,f

fα

α

ν νν ν− =

En consecuencia, el valor de la variable F que produce un área de 0.99 a la derecha con 7 y 12 grados de libertad para el numerador y denominador respectivamente, queda determinado como:

( ) ( )0.99

0.01

1 17,12 0.155

12,7 6.469f

f= = =

De manera análoga, para los valores que siguen

( ) ( )

( ) ( )

( ) ( )

( ) ( )

( ) ( )

( ) ( )

0.995

0.005

0.99

0.01

0.98

0.02

0.975

0.025

0.95

0.05

0.90

0.10

1 121,6 0.228

6,21 4.393

1 115,18 0.292

18,15 3.423

1 126,24 0.434

24,26 2.306

1 114,9 0.312

9,14 3.209

1 127,12 0.469

12,27 2.132

1 115,10

10,15 2

ff

ff

ff

ff

ff

ff

= = =

= = =

= = =

= = =

= = =

= = 0.486.059

=

68

Ahora si suponemos que se seleccionan muestras aleatorias de tamaño 1n y 2n

de poblaciones normales con varianzas 2

1σ y 2

2σ , respectivamente. Tenemos que

( ) ( )2 2

1 1 2 22 2

1 22 2

1 2

1 1n S n Syχ χ

σ σ− −

= =

Son variables aleatorias independientes que tienen distribuciones chi- cuadrada con 1 1 1nν = − y 2 2 1nν = − grados de libertad. De modo que si 2

1U χ= y 2

2V χ= , podemos enunciar la siguiente distribución muestral. Si 2

1S y 2

2S son las varianzas de muestras aleatorias independientes de

tamaños 1n y 2n , tomadas de poblaciones normales con varianzas 2

1σ y 2

2σ , respectivamente, entonces

2

1

2 2 2

1 2 1

2 2 2

2 1 2

2

2

S

SF

S S

σ σσ

σ

= =

Tiene distribución F con 1 1 1nν = − y 2 2 1nν = − grados de libertad para el numerador y el denominador respectivamente. Esta variable se usará en los intervalos de confianza y pruebas de hipótesis para una razón de varianzas en los siguientes capítulos. RESUMEN: Las distribuciones muestrales que se estudiaron en el capítulo 2, las podemos resumir escribiendo cada variable y su esta ndarización respectiva, sea por el teorema del límite central o por que las poblaciones son normales para el caso de las cinco primeras var iables.

Suma de variables W

W

W

W W nZ

n

µ µσ σ− −= =

Media muestral X

( )X

X

n XX XZ

n

µµ µσσ σ

−− −= = =

69

Diferencia de medias muestrales 1 2X X−

( ) ( )1 2 1 2

2 2

1 2

1 2

X XZ

n n

µ µ

σ σ

− − −=

+

Proporción muestral P

( )ˆ

ˆ

ˆ ˆ

1

P

P

P P pZ

p p

n

µσ− −= =

−

Diferencia de proporciones 1 2

ˆ ˆP P−

( ) ( )( ) ( )

( ) ( )1 2 1 2 1 2 1 2

1 1 2 21 1 2 2

1 21 2

ˆ ˆ ˆ ˆ

1 1

P P p p P P p pZ

p q p qp p p p

n nn n

− − − − − −= =

− − ++

Variable T de Student

( )X nXT

S S

n

µµ −−= =

Variable Ji o chi- cuadrada

( ) 2

2

2

1n Sχ

σ−

=

Variable F de Fisher

2

1

2 2 2

1 2 1

2 2 2

2 1 2

2

2

S

SF

S S

σ σσ

σ

= =

70

Ejercicios

1) Los pesos de los sacos con azúcar se distribuyen normalmente con una media 50 kg y una desviación de 2 kg. Si colocan 10 de estos sacos en una bascula, ¿cuál es la probabilidad de que el peso total no exceda los 515 kg?, ¿de que exceda los 490 kg?

2) Un camión transporta cajas de dos clases de manzanas Golden y

Delicius, los pesos promedio son de 30 kg y 25 kg, con desviaciones estándar de 3 kg y 1 kg respectivamente. Si se van a transportar 100 cajas de manzanas Golden y 75 cajas de manzanas Delicius, obtener la probabilidad de que el peso total rebase las 5 toneladas.

3) La duración media de cierta marca de lámpara ahorradora de energía es

de 6000 horas, con una desviación estándar de 100 horas. Si se probarán 40 lámparas de esta marca, ¿cuál será la probabilidad de que la duración combinada de estas lámparas se encuentre dentro las 239000 y 241000 horas inclusive?

4) En una prueba de aprendizaje la media es de 50 puntos con una

desviación estándar de 10 puntos. Se supone que las calificaciones de este tipo de prueba se distribuyen normalmente. Obtenga la probabilidad de que de una muestra aleatoria de 25 calificaciones la media muestral sea mayor a 55 puntos.

5) Los obreros de una gran empresa tienen una edad promedio de 35 años

con una desviación típica de 6 años. Si se selecciona una muestra aleatoria de 35 obreros, ¿cual es la probabilidad de la edad promedio de la muestra sea a) de más de 37.5 años b) de menos de 33 años c) de entre 34.25 y 34.75 años d) de entre 36 y 37.75 años?

6) En un país el ingreso familiar mensual tiene una media de $10 000 y una desviación estándar de $ 3 000. Se selecciona una muestra aleatoria de 100 familias, obtenga la probabilidad de que el promedio X sea a)menor o igual que $11 200 b) mayor o igual que $10 450 c) mayor que $10 150 pero menor que $13 000.

7) Se tiene la distribución de probabilidades 13 cuando 3,6,9

( )0 en otro caso

xf x

==

se

obtiene una muestra de 36 observaciones, calcular la probabilidad de que la media X sea mayor a 7.

71

8) Las alturas de los pinos en los bosques de los alpes se distribuyen normalmente con una desviación estándar de 1.5 metros, si se toma una muestra aleatoria de 12 de estos pinos, ¿cuál es la probabilidad de que la media muestral X se desvíe de la media poblacional µ en a lo más 0.5 metros?

9) En referencia al ejercicio 8) si se quiere que la probabilidad de que la

media muestral de desvíe de la media poblacional en a lo más 0.2 metros, sea igual a 0.95 ¿de que tamaño deberá ser la muestra para alcanzar tal precisión?

10) Un fabricante de llantas para automóvil asegura que la duración media

es de 40 000 km y una desviación 5000 km. Si se toma una muestra aleatoria de 36 llantas. ¿Cuál será la probabilidad de que la media de la muestra sea inferior a 39 220 km?

11) Un investigador ha determinado que los niveles de vitamina A en el

hígado de las mujeres y hombres se distribuyen normalmente con varianzas 2 219600 y 8100M Hσ σ= = . Se seleccionan muestras aleatorias de 15 mujeres y de 10 hombres, ¿cual es la probabilidad de que

M HX X− sea mayor o igual a 50, si no existe diferencia entre las medias poblacionales?

12) Se sabe que la raza pastor alemán vive en promedio 12 años con una

desviación estándar de 2 años y la raza terrier tiene una vida media de 10 años con una desviación de 3 años. Se toman muestras aleatorias independientes de tamaño 100 de estas razas. Obtener la probabilidad de que la diferencia de vidas medias muestrales sea menor o igual que un año.

13) Una compañía quiere comparar el promedio de días de incapacidad por

año de dos clases de empleados: los que tienen memos de cinco años de servicio, y los que diez o más. Para ello toma muestras 100 empleados de cada clase. Se sabe que las desviaciones estándares de las dos poblaciones son 1 8.2σ = días y 2 5.7σ = días, respectivamente.

Obtenga la probabilidad de que la diferencia ( 1 2X X− ) entre las medias muestrales difiera de la diferencia de medias poblacionales de días de incapacidad por más de un día.

14) Una cierta medicina tiene un 80% de efectividad para curar una

enfermedad común. Si se les suministra el medicamento a 100 pacientes con tal enfermedad ¿Cuál es la probabilidad de que más de 80 se recuperen? ¿de que entre 70 y 90 se recuperen?

15) Se considera que el 65% de las mujeres se someten a una dieta para

bajar de peso. Si se toma una muestra de 60 mujeres, hallar la probabilidad de que la proporción muestral sea menor que 0.68.

72

16) El 55% de los enfermos con cáncer de mama se recuperan. ¿Cuál es la probabilidad de que 75 personas con la enfermedad menos del 50% se recuperen?

17) En estudios realizados, se observado que los desempleados duran por

lo menos un año sin trabajo en un 20%. Supóngase que se toma una muestra de 320 desempleados ¿cual será la probabilidad de que la proporción muestral de desempleados difiera de la proporción real en 5% o más?

18) En cierta población de adolescentes se sabe que el 10 % de hombres

son obesos. Si la misma proporción de mujeres son obesas, ¿cual es la probabilidad de que una muestra aleatoria de 250 hombres y de 200 mujeres den una diferencia de proporciones mayor o igual a 0.06?

19) La proporción de ciudadanos que están a favor de una nueva ley en un

estado A es de 65%, mientras que en otro estado B es el 55%, si se toma una muestra aleatoria de 90 ciudadanos de cada estado. Hallar la probabilidad de que la diferencia de proporciones muestrales entre los ciudadanos del estado A y el estado B que están a favor de la nueva ley sea mayor o igual a 0.12.

20) Usando la tabla 3 de la distribución t de Student, obtenga

a) 0.025t con 15 grados de libertad

b) 0.01t con 9 grados de libertad

c) 0.995t con 23 grados de libertad

d) ( )1.315P T > con 26 grados de libertad

21) Mediante la tabla de la distribución chi-cuadrada, obtenga

a) 2

0.01χ con 17 g. l.

b) 2

0.01χ con 28 g. l.

c) 2

0.995χ con 7 g. l.

d) Si ( )2 2 0.99P αχ χ< = con 4 g. l. calcular 2

αχ

22) Con la distribución F obtenga

a) ( )0.05 6,12f

b) ( )0.01 18,9f

c) ( )0.99 11,19f

d) ( )0.975 6,14f

73

Capítulo 3 ESTIMACIÓN DE PARÁMETROS

hora iniciamos con el estudio de la estadística inferencial, es decir con el desarrollo de los principales elementos que permiten hacer aproximaciones o predicciones a una o más poblaciones, a partir de los

resultados obtenidos de muestras aleatorias sacadas de dichas poblaciones. En este capítulo veremos la estimación de parámetros, para ilustrar la idea, consideremos que se desea conocer el tiempo promedio que tardan en recuperarse los pacientes que padecen un resfriado común, cuando se les sumistra un analgésico. Resulta razonable aceptar que el tiempo promedio no se conoce, debido a que la información con que se cuenta no permite obtener de manera exacta tal medida, ya que la población esta creciendo, sin embargo se puede tomar una muestra aleatoria de algunos pacientes a los que se les administro el analgésico, conocer el tiempo medio de recuperación de estos y con ello llevar a cabo una aproximación al tiempo medio de recuperación de todos los pacientes, o bien proponer un intervalo de valores, donde se tenga cierta confiabilidad de que ahí se encuentra el verdadero tiempo promedio. Aquí hablaremos de dos tipos de estimación, la estimación puntual y la estimación por intervalo conocida también como intervalos de confianza. Por lo regular un parámetro es una medida fija pero desconocida en la mayoría de las situaciones reales, de ahí que sea necesario contar con estimadores o aproximadores que permitan al menos un conocimiento lo más cercano a él. 3.1 Estimación puntual Cuando se desconoce una medida como un parámetro, se puede estimar mediante un valor especifico de un estadístico que provenga de alguna muestra aleatoria, a este se le conoce como estimación puntual de un parámetro . Si suponemos que un parámetro es Θ y un estimador puntual es Θ , entonces una estimación puntual consiste en obtener un valor del estimador puntual Θ a partir de una muestra aleatoria de tamaño n , el cual lo denotamos por θ . Por ejemplo, para la media poblacional µ , un estimador puntual es X y una

estimación puntual será x , es decir aquel valor que toma la variable X para una muestra aleatoria. Supongamos que se esta interesado en conocer la estatura promedio µ de los jóvenes que hacen su servicio militar en un cierto año, se selecciona una muestra de 100 de estos jóvenes y resulta que su estatura promedio es de 1.71 metros, esto quiere decir, que un valor del

A

74

estimador puntual X , es 1.71x = metros o bien que una estimación puntual para la media poblacional µ es 1.71x = metros. Conviene precisar adecuadamente la definición anterior, sobretodo distinguir un estimador puntual de una estimación puntual, por ello las letras mayúsculas la usamos para denotar a los estimadores puntuales, ya que son variables aleatorias y las letras minúsculas para denotar a las estimaciones puntuales, es decir un valor particular que toma dicha variable. Con el afán de que tal distinción quede bien establecida, se da una tabla con los principales parámetros que trabajamos en el libro, sus estimadores y sus estimaciones puntuales.

Parámetro

Estimador puntual

Estimación puntual

µ X x

1 2µ µ− 1 2X X− 1 2x x−

p P p

1 2p p− 1 1ˆ ˆP P− 1 2

ˆ ˆp p− 2σ 2S 2s

σ S s 2

1

2

2

σσ

2

1

2

2

S

S

2

1

2

2

s

s

Una estimación puntual, es un solo valor con el que se pretende aproximar el parámetro y es de esperar que difícilmente tal valor coincida con el parámetro, lo más seguro es que difiera de él, al ir tomando muestras se irán produciendo estimaciones puntuales por cada una y les ocurrirá algo similar. Además un parámetro puede tener varios estimadores puntuales, por ejemplo la media poblacional µ tiene como estimadores puntuales a la mediana y a la media

aritmética X entre otros, por ello es importante elegir el mejor estimador de un mismo parámetro. Existen propiedades de los estimadores puntuales, que nos ayudan a tomar el “mejor” cuando queremos aproximar un parámetro. 3.2 Propiedades de los estimadores Como se acaba de mencionar, un parámetro tiene varios estimadores y resulta importante contar con algún criterio que permita decidir por cual inclinarnos, cuando queremos hacer una aproximación de parámetros. Se cuentan con cuatro propiedades que nos dicen que estimador resulta mejor que otro, son la insesgabilidad , eficiencia , consistencia y suficiencia . Un estimador que tenga estas propiedades se considera mejor que otro que no las tenga. En el siguiente apartado se definen las tres primeras y se ejemplifican solo la insesgabilidad y eficiencia.

75

3.2.1 Estimador insesgado Definición : Dado un parámetro Θ , se dice que un estimador Θ es insesgado , si su valor esperado es igual al parámetroΘ , es decir

( )ˆE Θ = Θ

En caso contrario se dice que es sesgado , es decir cuando ( )ˆE Θ ≠ Θ

Ejemplo 1 : Se tiene una población con media µ y varianza 2σ , se selecciona una muestra aleatoria de tamaño n y se definen tres estimadores del parámetro µ .

1

2

1

1) Mediana

ˆ2)

3)

n

i

i

n

i

i

X

X

Xn

X

Xn

−

=

=

=

=

=

∑

∑

%

Determinar que estimadores son insesgados. Respuesta : Debemos obtener el valor esperado de cada estimador, recordando que la mediana depende del número de elementos que contenga la muestra (impar ó par) y que además ( )iE X µ= para toda 1,2, ,i n= K .

1) Si n es impar ( ) 1

2

nE X E X µ+

= =

% , es decir, X% es insesgado.

Si n es par ( ) 12 2 1

( )2 2

n nX X

E X E µ µ µ+

+ = = + =

% , luego X% es insesgado

2) ( ) ( )

1

22 3 1

1 2ˆ

n

i

in

Xn

E X E E X X Xn n n

µ µ

−

=−

− = = + + + = ≠

∑L , ya que

21

n

n

− ≠

para 0n ≠ . Por lo que X es sesgado.

3) ( ) ( )11 2

1 1

n

i

in

X

E X E E X X X nn n n

µ µ=

= = + + + = =

∑L , por lo que X es

insesgado. En conclusión X% y X son insesgados mientras que X es sesgado .

76

Ejemplo 2 : La varianza muestral ( )2

2 1

1

n

i

i

X X

Sn

=

−=

−

∑ es un estimador insesgado

de la varianza poblacional 2σ . Respuesta : Vamos a probar que ( )2 2E S σ= .

Para ello, primero veamos que ( ) ( ) ( )2 22

1 1

n n

i i

i i

X X X n Xµ µ= =

− = − − −∑ ∑ .

( ) ( ) ( ) ( ) 22 2

1 1 1

n n n

i i i

i i i

X X X X X Xµ µ µ µ= = =

− = − + − = − − − ∑ ∑ ∑

Desarrollando el binomio al cuadrado y aplicando propiedades de la sumatoria se tiene que

( ) ( ) ( ) ( )( ) ( )

( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

2 22

1 1

22

1 1

22

1

2

2

2

n n

i i i

i i

n n

i i

i i

n

i

i

X X X X X X

X X X n X

X X n X n X

µ µ µ µ µ µ

µ µ µ µ

µ µ µ µ

= =

= =

=

− − − = − − − − + −

= − − − − + −

= − − − − + −

∑ ∑

∑ ∑

∑

( ) ( ) ( )

( ) ( )

2 22

1

22

1

2

n

i

i

n

i

i

X n X n X

X n X

µ µ µ

µ µ

=

=

= − − − + −

= − − −

∑

∑

Así

( )( )

( ) ( )

( ) ( )( )

2

222 1

1

22

1

1

1 1

1

1

1

1

n

i n

ii

i

n

i

i

X X

E S E E X n Xn n

E X nE Xn

nn

µ µ

µ µ

σ

=

=

=

−

= = − − − − −

= − − − −

=−

∑∑

∑

( )2

2 2 211

1n nn n

σ σ σ − = − = −

dado que ( ) ( )2 2

i iE X V Xµ σ− = = y ( ) ( )2

2

E X V Xn

σµ− = = .

Por lo tanto, ( )2 2E S σ= es decir 2S es un estimador insesgado de 2σ .

Con este ejemplo se justifica, por que es conveniente dividir entre 1n − la suma de los cuadrados de las diferencias, ya que si se divide por n el estimador resultaría sesgado de la varianza 2σ .

77

Una interpretación de la propiedad de insesgabilidad, es de considerar a los estimadores de un parámetro, como tiradores al blanco, en donde el objetivo de cada tirador (estimador) es el centro o diana (parámetro) y cada disparo realizado por un mismo participante es una estimación puntual. El estimador será insesgado si todos sus disparos los “concentra” alrededor de la diana u objetivo, sesgado será cuando sus disparos los “concentre” en otro lugar que no sea la diana, es decir, que la mira está desviada del objetivo.

3.2.2 Estimador eficiente Definición : Sean dos estimadores 1Θ y 2Θ de un mismo parámetro Θ ,

decimos que 1Θ es más eficiente que 2Θ , si 1Θ tiene menor varianza que 2Θ , es decir

Si ( ) ( )1 2ˆ ˆV VΘ < Θ significa que 1Θ es más eficiente que 2Θ .

La definición de eficiencia nos dice de alguna manera que aquel estimador más eficiente, es el de menor varianza y lo podemos relacionar con la interpretación de los tiradores al blanco, de la siguiente manera: Aquel tirador que “concentre” más sus disparos alrededor de la diana se considera más eficiente. Con la definición anterior podemos tener dos o más estimadores insesgados, pero uno de ellos podría ser más eficiente que los otros, con ello elegir el insesgado y más eficiente. Ejemplo3 : Tomando los dos estimadores de µ que fueron insesgados X% y X del ejemplo 1, determinar cuál es más eficiente. Respuesta : Para ver la eficiencia tenemos que obtener la varianza de cada estimador y determinar cuál es menor. Recordemos que ( ) 2

iV X σ= , para toda

1,2,3, ,i n= K .

Primero obtenemos la varianza de la mediana X% , para el caso que n sea impar ó par.

Si n es impar 2

1

2

nV X σ+

=

y si n es par ( )

212 22 2 1

2 4 2

n nX X

Vσσ σ

++

= + =

Por otro lado sabemos que la varianza de X es ( )2

V Xn

σ= .

Luego se tiene que 2 2 2

2 y 2n n

σ σ σ σ< < . Luego entonces la varianza de la

media muestral X es menor que la de la mediana X% y por tanto, X es más eficiente que X% .

78

3.2.3 Estimador consistente Definición : Se dice que un estimador Θ del parámetro Θ es consistente , si cuando el tamaño de la muestra se aproxima al de la población o bien cuando el tamaño de la muestra tiende al infinito, el estimador Θ tiende a ser el parámetro Θ . Dicho de otra manera, la probabilidad de que Θ difiera de Θ , se aproxima a cero cuando el tamaño de la muestra aumenta suficientemente. En forma simbólica esta propiedad se puede escribir de la siguiente manera.

( )ˆlim 0n

P→ ∞

Θ − Θ =

De acuerdo a esta propiedad los estimadores puntuales de la tabla de la sección 3.1 son consistentes. 3.3 Estimación por intervalos (intervalos de confia nza) La estimación puntual propone un valor numérico para aproximar un parámetro, a diferencia, la estimación por intervalo da un rango de valores en donde se encuentre el parámetro con un grado de certidumbre medido a través de la probabilidad. En la práctica es preferible estimar un parámetro Θ con un intervalo, que con un valor particular que toma el estimador puntual Θ , es decir en muchos procesos de producción donde se maneja el control de calidad, se establecen intervalos dentro de los cuales los artículos, productos, objetos o medidas se consideran aceptables para salir al mercado o cumplen con los requisitos de calidad previamente establecidos por la empresa o del comprador, que solo dar un valor predeterminado. De ahí la importancia estudiar la estimación por intervalo, comúnmente llamados intervalos de confianza . Aquí se quiere construir un intervalo de la forma ( ),a b , tal que a b< Θ < ,

donde Θ es un parámetro, a es el extremo o límite inferior y b el extremo o límite superior del intervalo. Además los dos extremos del intervalo dependerán del valor que tome el estimador o estadístico Θ para una muestra en particular y de su distribución muestral para Θ . 3.3.1 Definición de intervalo de confianza Definimos un intervalo de confianza para un parámetro Θ , como aquel conjunto de valores numéricos limitados por los extremos a y b , tal que, dentro de él se encuentra el parámetro Θ , es decir, a b< Θ < con una determinada probabilidad, denota por 1 α− . 3.3.2 Grado o nivel de confianza y su interpretació n A la probabilidad de que un intervalo ( ),a b , contenga el parámetro Θ se le

conoce como grado o nivel confianza del intervalo y se simboliza por 1 α− o bien por ( )1 100%α− , es decir el grado o nivel confianza es ( ) 1P a b α< Θ < = −

79

El grado de confianza se interpreta como la posibilidad de que al construir un intervalo de confianza ( ),a b , este contenga al parámetro, ya que al cambiar

de muestra los extremos del intervalo cambian y por ende pudieran no contenerlo, así α nos da la probabilidad de que un intervalo no incluya al parámetro. Los valores del grado de confianza los propone quien va a construir un intervalo, de acuerdo a sus expectativas y exigencias, aunque generalmente se consideran porcentajes del 90% al 99% (0.90 al 0.99), por ser los más recomendables en la práctica. Podemos decir que el grado de confianza, es la “certeza” que se tiene, de que un intervalo construido a partir de la información recopilada de una muestra aleatoria contenga al parámetro Θ y lo deseable es obtener un intervalo lo más reducido en cuanto a su ancho, con el mayor grado de confianza. Lo que podrá lograrse si se aumenta suficientemente el tamaño de la muestra, como lo veremos en los apartados posteriores. A manera de ilustración del grado de confianza, supongamos que solo se pueden construir 10 intervalos para estimar el parámetro Θ como se muestran en la figura 1 . Se aprecia que nueve intervalos contienen al parámetro y solo uno no. Lo que significa que el grado de confianza sería de 90% o 1 0.90α− = . En la práctica el número de intervalos es mucho mayor o incluso infinito por lo que, lo único que buscamos, es mostrar el concepto de grado de confianza como una probabilidad.

3.4 Intervalo de confianza para una media poblacion al Un primer intervalo de confianza que se construye, es para la media poblacional, recordemos que X es un estimador puntual de µ , se considera como de los mejores por cumplir las propiedades de insesgabilidad, eficiencia y consistencia, el valor x de una muestra aleatoria se utilizará como estimación

Θ Figura 1

80

puntual de µ . Para su mejor comprensión, los clasificamos en tres casos que permitan la construcción de intervalos de confianza para media poblacional µ . Caso 1: Si la población es normal, con varianza pobl acional 2σ conocida.

Partamos del hecho que, X

µ µ= y 2

2

Xn

σσ = , donde n es el tamaño de una

muestra aleatoria tomada de la población. Se quiere que el grado de confianza sea igual a 1 α− y vamos a obtener los extremos de un intervalo ( ),a b , tal que ( ) 1P a bµ α< < = − .

Dado que La distribución de X es normal, podemos partir de los valores 2

zα−

y 2

zα de la tabla 2 de porcentajes para la curva normal estándar.

Como se muestra en la figura 2

Además recordemos que X

Z

n

µσ−= , por lo que tendremos lo siguiente:

2 2

1X

P z z

n

α αµ ασ

−− < < = −

Despejando el parámetro µ y usando propiedades de las desigualdades, obtenemos los extremos del intervalo buscado.

2 2

2 2

2 2

1

1

1

P z X zn n

P X z X zn n

P X z X zn n

α α

α α

α α

σ σµ α

σ σµ α

σ σµ α

− < − < = −

− − < − < − + = −

− < < + = −

( )2 2

1P z Z zα α α− < < = −

2

zα− 2

zα

2

α 1 α−

2

α

Figura 2

81

De lo anterior concluimos que: Intervalo de confianza para µ ; con 2σ conocida. Si x es la media de una muestra aleatoria de tamaño n tomada de una población normal con varianza 2σ , un intervalo de confianza al ( )1 100%α−

para la media poblacional µ esta dado por:

2 2

x z x zn n

α ασ σµ− < < +

donde 2

zα es el valor que limita un área bajo la curva a la derecha de 2

α

También podemos escribirlo en forma más compacta, es decir como:

2

x zn

ασ±

Los extremos inferior y superior de un intervalo de confianza para la media

poblacional µ son 2

a x zn

ασ= − y

2

b x zn

ασ= + , respectivamente.

Para muestras diferentes (aunque de igual tamaño) se esperan x diferentes y en consecuencia intervalos diferentes, pero con centro o punto medio en x . Al aumentar el grado de confianza 1 α− , aumenta el valor de

2

zα y entonces la

amplitud del intervalo crece, lo que permite incrementar la posibilidad de que el parámetro este dentro del intervalo. Ejemplo 4 : Se desea aproximar el peso promedio de los productos elaborados en una fábrica. Se toma una muestra de 20 de estos productos y se obtiene un peso medio de 255x = gramos. Si se supone que el peso de estos artículos es normal con una varianza 2 35σ = , construir un intervalo de confianza para el peso promedio los artículos producidos por esta fábrica con un grado de confianza del 99%. Respuesta : Un intervalo de confianza para la media poblacional bajo las

condiciones dadas es 2

x zn

ασ± .

De la tabla 2 de porcentajes de la curva normal estándar tenemos que para 1 0.99α− =

2

2.576zα =

Así que al sustituir obtenemos un intervalo para la media µ

35255 2.576

20

255 3.41

±

±

O bien 251.59 258.41µ< <

82

Caso 2: Si la población no es normal, con varianza p oblacional 2σ desconocida y muestra suficientemente grande ( 30)n ≥ .

Cuando no se conozca la varianza poblacional 2σ y por ende la desviación σ , podemos reemplazarla por un valor de la desviación estándar muestral s , siempre que el tamaño de la muestra sea grande, ya que a medida que una muestra aumenta de tamaño, una buena aproximación de σ es s . De manera que: Un intervalo de confianza para la media poblacional µ , esta

dado como 2 2

s sx z x z

n nα αµ− < < + o bien

2

sx z

nα± en forma compacta

donde s es la desviación estándar de una muestra aleatoria de tamaño 30n ≥ , tomada de una población no necesariamente normal con varianza 2σ desconocida. Ejemplo 5 : Construir un intervalo de confianza al 95% para la resistencia media a la ruptura de los bloques de concreto que se usan en la industria de la construcción, a partir de una muestra de 100 bloques de los que se obtiene una resistencia promedio de 15 toneladas y una desviación estándar de 1.5 toneladas Respuesta : Estamos en el segundo caso, ya que no sabemos como se comporta la población, su varianza 2σ es desconocida, pero la muestra es suficientemente grande. Por lo que, un intervalo de confianza para la resistencia media a la ruptura µ

esta dado por 2

sx z

nα±

2

1 0.95 1.96zαα− = ⇒ = , de la tabla 2 de porcentajes para la curva normal.

15

1.5

100

x

s

n

===

Luego al sustituir tenemos que 1.5

15 1.96 15 0.294100

± ⇒ ± , es decir, un

intervalo de confianza para µ es 14.706 15.294µ< < toneladas. Caso 3: Si la población es normal, con varianza pobl acional 2σ desconocida y muestra pequeña ( 30)n ≥ . En varias ocasiones se desea estimar la media µ de una población normal con

varianza 2σ desconocida y las muestras son pequeñas. En este caso se debe utilizar la variable T de Student y con ella podemos construir un intervalo de confianza en forma análoga a como se realizo en el caso 1. Recordemos que la variable T , esta dada por

XT

S

n

µ−=

83

Partiendo de que conocemos el grado de confianza 1 α− , llegamos al intervalo deseado.

( )2 2

1P t T tα α α− < < = − , donde 2

tα es el valor de la variable T con 1n − grados de

libertad que limita un área a la derecha igual a 2

α, (ver figura 3 .)

( )2 2

2 2

2 2

1

1

1

P t T t

XP t t

S

n

S SP X t X t

n n

α α

α α

α α

α

µ α

µ α

− < < = −

−− < < = −

− < < + = −

Por lo que: Si x y s son la media y desviación estándar de una muestra aleatoria de tamaño n ( 30n < ), tomada de una población normal con varianza

2σ desconocida, un intervalo de confianza al ( )1 100%α− para la media

poblacional µ es

2 2

s sx t x t

n nα αµ− < < +

O bien 2

sx t

nα± , en forma compacta, donde

2

tα es el valor que se obtiene de la

tabla para la variable T de Student con 1n − grados de libertad, que limita un

área bajo la curva de 2

α a su derecha.

Ejemplo 6 : Las estaturas de 10 alumnos en una escuela son: 1.65, 1.65, 1.66, 1.68, 1.69, 1.70, 1.70, 1.74, 1.78 y 1.80 metros. Si suponemos que las estaturas de todos los estudiantes de esta escuela se distribuyen normalmente, construir un intervalo de confianza al 90% para estatura media de los alumnos de dicha escuela.

2

tα− 2

tα

Figura 3

1 α− 2

α

84

Respuesta : Aquí tenemos un ejemplo del tercer caso, debido a que la varianza poblacional es desconocida y el tamaño de la muestra es pequeño, por lo que

un intervalo de confianza será 2

sx t

nα± .

De los datos de la muestra obtenemos la media y la desviación muestral respectivamente, 1.705x = y 0.053s = . De la tabla 3 para la variable T de Student se obtiene el valor de

2

tα con 1n −

grados de libertad.

0.051 0.90 0.10 0.05 1.8332

tαα α− = ⇒ = ⇒ = ⇒ = , con 9 grados de libertad

Luego sustituyendo tenemos 0.053

1.705 1.833 1.705 0.03110

± ⇒ ± .

O bien un intervalo de confianza al 90% para la estatura media es 1.674 1.736µ< < 3.5 Intervalo de confianza para una diferencia de m edias poblacionales. Ahora veremos como obtener intervalos de confianza para una diferencia de medias 1 2µ µ− . Para ello clasificaremos de manera similar a como se hizo con la media µ , en cinco casos, de acuerdo a las características de las poblaciones y las muestras respectivamente, apoyándonos de lo visto en el capítulo anterior (distribuciones muestrales) y en el teorema del límite central cuando se requiera. Caso 1: Dos poblaciones normales con varianzas 2 2

1 2yσ σ conocidas y muestras aleatorias independientes. Para 1 2µ µ− , tenemos que un estimador puntual es 1 2X X− , tal que, la variable normal estándar queda como

( ) ( )1 2 1 2

2 2

1 2

1 2

X XZ

n n

µ µ

σ σ

− − −=

+

Donde 1 2n y n son los tamaños de las muestras independientes tomadas de la población 1 y 2 respectivamente. Luego al proceder de manera análoga como se realizo en la sección anterior, se llega a que:

( ) ( )2 2

2 2 2 2

1 2 1 21 2 1 2 1 2

1 2 1 2

1P X X z X X zn n n n

α ασ σ σ σµ µ α

− − + < − < − + + = −

85

Por lo que, si 1 2x y x son las medias de muestras aleatorias independientes de

tamaño 1 2n y n tomadas de poblaciones normales con varianzas conocidas 2 2

1 2yσ σ , respectivamente, un intervalo de confianza del ( )1 100%α− para

1 2µ µ− está dado por

( ) ( )2 2

2 2 2 2

1 2 1 21 2 1 2 1 2

1 2 1 2

x x z x x zn n n n

α ασ σ σ σµ µ− − + < − < − + +

donde 2

zα es el valor de la tabla normal que limita un área de 2

α a su derecha

(ver figura 2 ). O bien ( )2

2 2

1 21 2

1 2

x x zn n

ασ σ− ± + en forma compacta.

Ejemplo 7 : Una muestra aleatoria de tamaño 1 25n = , tomada de una población

normal con desviación estándar 1 5σ = , tiene una media 1 80x = . Una segunda

muestra aleatoria de tamaño 2 36n = , tomada de otra población normal con

desviación estándar 2 3σ = , tiene una media 2 75x = . Obtenga un intervalo de

confianza del 94% para 1 2µ µ− (suponga muestras independientes). Respuesta: De acuerdo a la información dada, estamos en el caso 1. De la tabla 2 para la normal, tenemos que

2

1 0.94 1.881zαα− = ⇒ =

Sustituyendo en ( )2

2 2

1 21 2

1 2

x x zn n

ασ σ− ± + obtenemos

( )2 25 3

80 75 1.88125 36

5 2.10

− ± +

±

Por lo que, un intervalo de confianza al 94% para 1 2µ µ− es 1 22.90 7.10µ µ< − < Caso 2: Poblaciones no normales, con varianzas 2 2

1 2yσ σ desconocidas y muestras grandes. Cuando las varianzas poblacionales se desconocen y las muestras son suficientemente grandes 1 2 30n y n ≥ , 2 2

1 2yσ σ se reemplazan por las varianzas

de las muestras, es decir por 2 2

1 2s y s y con ello tendremos un intervalo de

confianza del ( )1 100%α− para 1 2µ µ− dado por

( )2

2 2

1 21 2

1 2

s sx x z

n nα− ± +

86

Ejemplo 8 : se compara la resistencia de dos tipos de rosca para tornillos tomando 50 piezas con cada tipo de rosca, se prueban en condiciones similares. Las piezas de la marca A (I), tienen una resistencia media a la tensión de 78.3 kg, con una desviación estándar de 5.6 kg, en tanto la marca B (II) tiene una resistencia media de 87.2 kg, con una desviación estándar de 6.3 kg. Determine un intervalo de confianza del 95% para la diferencia de medias poblacionales 2 1µ µ− . Respuesta : Como las muestras son grandes e independientes y las poblaciones no son normales con varianzas desconocidas, un intervalo de

confianza para 2 1µ µ− quedará como ( )2

2 2

1 22 1

1 2

s sx x z

n nα− ± +

Luego como

2

1 0.95 1.96zαα− = ⇒ = de la tabla normal.

Marca A (I) Marca (II)

1 50n = 2 50n =

1 78.3x = 2 87.2x =

1 5.6s = 2 6.3s = Sustituyendo tenemos que

( ) ( )2 25.6 6.3

(87.2 78.3) 1.9650 50

8.9 2.34

− ± +

±

Por lo que, un intervalo de confianza de confianza para 2 1µ µ− al 95% es

2 15.56 11.24µ µ< − < Caso 3: Poblaciones normales, con varianzas 2 2

1 2yσ σ desconocidas pero

iguales ( 2 2

1 2σ σ= ) y muestras pequeñas e independientes. En este caso como las varianzas poblacionales se desconocen, pero son iguales, se usa una estimación puntual de estas, conocida como la varianza ponderada y esta dada por

( ) ( )2 2

1 1 2 22

1 2

1 1

2p

n s n ss

n n

− + −=

+ −

La desviación estándar ponderada queda determinada por

( ) ( )2 2

1 1 2 2

1 2

1 1

2p

n s n ss

n n

− + −=

+ −

Dado que las muestras son pequeñas tendremos que usar la variable T de Student con 1 2 2n n+ − grados de libertad.

87

De modo que: Si 1 2x y x son las medias de muestras pequeñas independientes de tamaños

1 2n y n , respectivamente, tomadas a partir de poblaciones normales con

varianzas desconocidas pero iguales ( 2 2

1 2σ σ= ), un intervalo de confianza de

( )1 100%α− para 1 2µ µ− está dado por

2 21 2 1 2 1 2

1 2 1 2

1 1 1 1( ) ( )p px x t s x x t s

n n n nα αµ µ− − + < − < − + +

donde 2

tα es el valor de la variable T con 1 2 2n n+ − grados de libertad, que limita

un área de 2

α a su derecha (ver figura 3).

O en forma compacta como 2

1 2

1 2

1 1( ) px x t s

n nα− ± +

Ejemplo 9 : Los siguientes datos, expresados en días, representan el tiempo de recuperación de pacientes tratados al azar con uno de dos medicamentos, para curar infecciones graves de la vejiga.

Medicamento I Medicamento II

1 14n = 2 16n =

1 17x = 2 19x = 2

1 1.5s = 2

2 1.8s =

Obtenga un intervalo de confianza de 99% para la diferencia 2 1µ µ− en el tiempo promedio de recuperación para los dos fármacos, suponiendo poblaciones normales con varianzas desconocidas pero iguales. Respuesta : Como se nos pide un intervalo para 2 1µ µ− , simplemente

cambiamos la estimación puntual 2 1x x− , para tener lo deseado, es decir

22 1

1 2

1 1( ) px x t s

n nα− ± +

Luego vamos a la tabla 3 de la distribución t de Student para obtener el valor de

2

tα .

20.0051 0.99 0.01 0.005 2.763

2t tα

αα α− = ⇒ = ⇒ = ⇒ = =

con 1 2 2 14 16 2 28n n+ − = + − = grados de libertad.

Además calculamos la desviación ponderada ( ) ( )2 2

1 1 2 2

1 2

1 1

2p

n s n ss

n n

− + −=

+ −.

( ) ( )13 1.5 15 1.81.29

28ps

+= =

88

Al sustituir tenemos que

( ) ( ) 1 119 17 2.763 1.29

14 16

2 1.30

− ± +

±

Por lo que un intervalo de confianza para la diferencia de tiempos promedio de recuperación para los dos fármacos al 99% es 2 10.70 3.30µ µ< − < Nota: En los ejemplos 8 y 9 se usaron intervalos, invirtiendo el orden de la diferencia, por que así se requerían. En realidad podemos manejar de manera indistinta el orden, observando solamente que en un momento dado, esta pudiera ser negativa o positiva según el orden. En la mayoría de las ocasiones el texto del problema nos da la información suficiente para decidir que diferencia se quiere estimar. Caso 4: Poblaciones normales, con varianzas 2 2

1 2yσ σ desconocidas

diferentes ( 2 2

1 2σ σ≠ ) y muestras pequeñas e independientes. Para este caso se usa el estadístico

( ) ( )1 2 1 2

2 2

1 2

1 2

X XT

S S

n n

µ µ− − −=

+

El cual tiene una distribución t con ν grados de libertad, donde 2

2 2

1 2

1 2

2 22 2

1 2

1 2

1 21 1

s s

n n

s s

n n

n n

ν

+

= +

− −

El valor de ν casi nunca es un número entero, siempre lo vamos a redondear al entero más próximo. Repitiendo los pasos antes descritos en otros intervalos de confianza, se tiene la siguiente conclusión. Si 2 2

1 1 2 2,x y s y x y s , son las medias y las varianzas de muestras independientes

pequeñas de tamaños 1 2n y n , respectivamente, sacadas de poblaciones

normales con varianzas desconocidas y diferentes ( 2 2

1 2σ σ≠ ), un intervalo de

confianza al ( )1 100%α− para la diferencia de medias 1 2µ µ− es

( ) ( )2 2

2 2 2 2

1 2 1 21 2 1 2 1 2

1 2 1 2

s s s sx x t x x t

n n n nα αµ µ− − + < − < − + +

O también como ( )2

2 2

1 21 2

1 2

s sx x t

n nα− ± +

89

donde 2

tα es el valor de la variable T con

22 2

1 2

1 2

2 22 2

1 2

1 2

1 21 1

s s

n n

s s

n n

n n

ν

+

= +

− −

grados de libertad,

que produce un área de 2

α bajo la curva a su derecha.

Ejemplo 10 : Los siguientes datos representan los tiempos en minutos de duración de películas producidas por dos compañias de cine. Compañía I 103 94 110 87 98 Compañía II 97 82 123 92 175 88 118 Construya un intervalo de confianza al 90% para diferencia de los tiempos medios de duración de las películas producidas por las dos compañias. Si se considera que los tiempos de ambas son normales. Respuesta : En este problema no se nos dice nada respecto a las varianzas poblacionales por lo que se supone que son desconocidas y diferentes, además de las muestras deben ser independientes. De las dos muestras tenemos que: Compañía I Compañía II

1 5n = 2 7n =

1 98.4x = 2 110.7x = 2

1 76.3s = 2

2 1035.9s = Para que la diferencia no sea negativa cambiamos el orden de la resta, es decir un intervalo de confianza para 2 1µ µ− es

( )2

2 2

1 22 1

1 2

s sx x t

n nα− ± +

Primero obtenemos los grados de libertad ν

Con la expresión

222 2

1 2

1 2

2 2 2 22 2

1 2

1 2

1 2

76.3 1035.9

5 77.19 7

76.3 1035.9

5 7

4 61 1

s s

n n

s s

n n

n n

ν

+ + = = = ≈

++

− −

Luego 2

0.051 0.90 0.10 0.05 1.8952

t tααα α− = ⇒ = ⇒ = ⇒ = = con 7 grados de

libertad, de la tabla 3.

90

Al sustituir

( ) 76.3 1035.9110.7 98.4 1.895

5 7

12.3 24.21

− ± +

±

Por lo que un intervalo de confianza al 90% para la diferencia de los tiempos medios de duración de las películas producidas por estas compañias es

2 111.91 36.51µ µ− < − < Caso 5: Poblaciones normales, cuando las muestras n o son independientes o las muestras se presentan apareada s. En algunas situaciones se presentan muestras en pares, es decir, existe una relación entre las muestras, por ejemplo cuando a un grupo de n personas se le mide su tensión arterial antes y después de que se les administro un medicamento para reducirla, los valores de la presión están relacionados en cada pareja, ya que es la misma persona a la que se le mide la tensión arterial antes y después. Si se desea conocer la efectividad del medicamento se deberán obtener las diferencias 1 2, , , nd d dK de las parejas, que serán los

valores de una muestra aleatoria 1 2, , , nD D DK , tomada de una población

normal con media 1 2Dµ µ µ= − y varianza 2σ .

Una estimación puntual de la media 1 2Dµ µ µ= − , será 1

n

i

i

d

dn

==∑

el valor de la

media de las diferencias de la muestra en parejas y para la varianza 2σ , será la varianza de las diferencias de la misma muestra, es decir

( )

2

22 1

2 1 1

1 1

n

in n

i

i i

i id

d

d d dn

sn n

=

= =

− −

= =− −

∑∑ ∑

Donde

1 1 1 1 1

2 2 2 2 2

3 3 3 3 3

1 2

n n n n n

Muestra Muestra Diferencia

x y d x y

x y d x y

x y d x y

x y d x y

= −= −= −

= −M M M

Las muestras apareadas o dependientes se presentan cuando se trabajan con n objetos diferentes, como personas, animales, plantas o cosas en donde exista una característica similar y que de alguna manera el valor de la primera coordenada iX se encuentre relacionada con la segunda coordenada

iY , en las muestras.

91

En consecuencia Si dd y s son la media y la desviación estándar de las diferencias cuya distribución es normal n parejas aleatorias de mediciones, un intervalo de confianza al ( )1 100%α− para 1 2Dµ µ µ= − será

2 2

d dD

s sd t d t

n nα αµ− < < +

O bien 2

dsd tn

α± , con 2

tα se obtiene de la tabla 3 con 1n − grados de libertad.

Ejemplo 11 : Se afirma que una nueva dieta reducirá el peso de una persona en 4.5 kg en promedio, en un periodo de 2 semanas. Los pesos de 7 mujeres que llevaron la dieta se anotaron antes y después de 2 semanas. P. antes 58.5 60.3 61.7 69.0 64.0 62.6 56.7 P. después 60.0 54.9 58.1 62.1 58.5 59.9 54.4 Construya un intervalo de confianza del 95% para la diferencia media de los pesos y decida si la afirmación es aceptable. Suponga que las diferencias de pesos se son normales. Respuesta : Considerando los pesos antes como la muestra I y los pesos después la muestra II, calculamos las diferencias antes – después.

58.5 60.0 1.5

60.3 54.9 5.4

61.7 58.1 3.6

69.0 62.1 6.9

64.0 58.5 5.5

62.6 59.9 2.7

56.7 54.4 2.3

i i ix y d

−

Luego 3.56 ; 2.28dd s= = , 2

0.025 2.447t tα = = con 6 g. l.

Sustituyendo en 2

2.783.56 2.447 3.56 2.57

7

dsd tn

α± ⇒ ± ⇒ ±

Un intervalo de confianza para la diferencia media de los pesos queda como 0.99 6.13Dµ< <

En la figura 4 se puede observar que el intervalo construido contiene al valor 4.5, esto nos permite decir que la afirmación de que con la dieta las personas pueden reducir su peso en promedio 4.5 kg en un periodo de 2 semanas es aceptable.

3.56d = 0.99 6.13 ) (

4.5

Figura 4

92

3.6 Intervalo de confianza para una proporción pobl acional.

Para la proporción poblacional p , un estimador puntual es ˆ XP

n= y para la

construcción de un intervalo de confianza, se utiliza una estimación puntual

ˆx

pn

= que resulta de una muestra aleatoria de tamaño n extraída de la

población, donde x es el número de éxitos o de elementos que tienen una misma característica en la muestra. La variable P es aproximadamente normal cuando la muestra es grande, por lo que la podemos llevarla a la normal

estándar Z , donde P p

Zpq

n

−=

Se procede de forma análoga a como se realizo en la obtención del intervalo para la media poblacional.

( )2 2

1P z Z zα α α− < < = −

2 2

ˆ1

P pP z z

pq

n

α α α

− − < < = −

Multiplicando por pq

n, restando P y multiplicando por 1− la desigualdad. Se

tiene que

2 2

ˆ ˆ 1pq pq

P P z p P zn n

α α α

− < < + = −

Como los extremos del intervalo están en términos del parámetro p y no podemos estimarlo con él mismo, usamos su estimación puntual p , como una buena aproximación, dado que la muestra es grande, para obtener

2 2

ˆ ˆ ˆ ˆˆ ˆ 1pq pq

P P z p P zn n

α α α

− < < + = −

Por lo que Si p es la proporción de éxitos de una muestra aleatoria de tamaño n y

ˆ ˆ1q p= − , un intervalo de confianza de ( )1 100%α− para la proporción

poblacional p es

2 2

ˆ ˆ ˆ ˆˆ ˆ

pq pqp z p p z

n nα α− < < +

O bien 2

ˆ ˆˆ

pqp z

nα± , siempre que el tamaño de la muestra sea grande.

Se considera como grande el tamaño de la muestra, si ˆ ˆ5 5np y nq≥ ≥ .

93

Ejemplo 12 : Obtener un intervalo de confianza del 92% para la proporción de habitantes que utilizan un producto que evita la caída del cabello en una localidad. Si en una muestra aleatoria de 100 de estas personas 35 lo usan. Respuesta: Al calcular el valor de la proporción de la muestra nos damos

cuenta, que el tamaño es grande, ya que 35

ˆ ˆ ˆ0.35 1 0.65100

p y q p= = = − = , los

productos cumplen la condición ˆ ˆ5 5np y nq≥ ≥ donde 100n = y podemos

utilizar 2

ˆ ˆˆ

pqp z

nα± como un intervalo de confianza para p , que es la

proporción real de personas que usan el producto para evitar la caída de cabello. De la tabla 2 para la normal,

2

1.751zα = , ya que 1 0.92α− = .

Luego entonces ( )( )

2

0.35 0.65ˆ ˆˆ 0.35 1.751 0.35 0.084

100

pqp z

nα± ⇒ ± ⇒ ±

Así un intervalo de confianza al 92% para la verdadera proporción es 0.266 .434p< <

3.7 Intervalo de confianza para una diferencia de p roporciones poblacionales. Si tenemos ahora dos poblaciones con proporciones 1 2p y p respectivamente y

deseamos un intervalo de confianza para 1 2p p− , obtenemos una muestra de

cada población, recordando que su estimador puntual es 1 2ˆ ˆP P− , con

( ) ( )1 2

1 1 2 2 1 1 2 2ˆ ˆ

1 2 1 2

1 1P P

p p p p p q p q

n n n nσ

−

− −= + = + y una buena estimación puntual

será 1 1 2 2

1 2

ˆ ˆ ˆ ˆp q p q

n n+ , cuando los tamaños de las muestras aleatorias

independientes 1 2n y n sean suficientemente grandes, es decir

1 1 1 1 2 2 2 2ˆ ˆ ˆ ˆ, , 5n p n q n p y n q ≥ .

Un intervalo de confianza del ( )1 100%α− para 1 2p p− es

( ) ( )2 2

1 1 2 2 1 1 2 21 2 1 2 1 2

1 2 1 2

ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆˆ ˆ ˆ ˆ

p q p q p q p qp p z p p p p z

n n n nα α− − + < − < − + +

o bien ( )2

1 1 2 21 2

1 2

ˆ ˆ ˆ ˆˆ ˆ

p q p qp p z

n nα− ± +

donde 1 21 2

1 2

ˆ ˆx x

p y pn n

= = , con 1x y 2x el número de éxitos en las muestras de

tamaño 1 2n y n respectivamente.

94

Ejemplo 13 : Una empresa que produce bebidas desea comparar la preferencia por dos marcas de refresco de cola A y B. Obtiene que de 200 consumidores 45 prefieren la marca A y de otros 120 consumidores 25 prefieren la marca B. Construir un intervalo de confianza del 94% para la diferencia en las proporciones de consumidores que prefieren estas marcas. Respuesta : Obtenemos un intervalo para 1 2p p− . Calculamos los valores de las proporciones para cada muestra.

1 1 1 1

2 2 2 2

45ˆ ˆ200 ; 45 0.225 ; 0.775

200

25ˆ ˆ120 ; 25 0.208 ; 0.792

120

n x p q

n x p q

= = ⇒ = = =

= = ⇒ = = =

Las muestras son grandes y de la tabla 2 para los porcentajes de la curva normal

2

1 0.94 1.881zαα− = ⇒ =

( )

( ) ( ) ( )2

1 1 2 21 2

1 2

ˆ ˆ ˆ ˆˆ ˆ

0.225 0.775 0.208 0.7920.225 0.208 1.881

200 120

0.017 0.089

p q p qp p z

n nα− ± +

− ± +

±

Por lo tanto, un intervalo de confianza al 94% es 1 20.072 0.106p p− < − < . En los intervalos que se han construido en todas las secciones anteriores, se presenta una característica de simetría con respecto al valor de la estimación puntual θ , ya que, a este se le suma y resta una misma cantidad, la cual nos lleva al concepto de error máximo de estimación y su relación con el tamaño de la muestra aleatoria. 3.8 Error de estimación y tamaño de la muestra. Por simplicidad consideraremos solo los intervalos para una media y una proporción, cuando se obtuvo un intervalo de confianza para la media µ en el caso 1, se puedo apreciar que los límites inferior y superior quedan como

2 2

a x z y b x zn n

α ασ σ= − = +

En la figura 5 vemos que el punto medio del intervalo es x y el parámetro µ

se encuentra dentro del intervalo con una probabilidad del ( )1 100%α− .

( ) x

2

x zn

ασ−

2

x zn

ασ+

µ {

Error

Figura 5

95

Se define el error de estimación como la diferencia en valor absoluto de x con

µ , es decir, x µ− y este no rebasa a 2

zn

ασ

, si el intervalo contiene al

parámetro. El error máximo de estimación lo denotamos por e y entonces lo

escribimos por 2

e zn

ασ= , del cual podemos obtener el tamaño de la muestra

despejando a n , para llegar a la expresión 2

2z

ne

ασ =

.

En la ecuación anterior, nos damos cuenta que el tamaño de la muestra depende del error máximo de estimación, lo que significa que si queremos un error cada vez menor, el tamaño de la muestra aumentará para valores fijos del grado de confianza y la desviación estándar σ . En caso de que no se conozca σ , se puede usar s como una aproximación, sobretodo cuando la muestra sea grande, de manera que tendremos una expresión que aproxima el tamaño de la muestra dada por

2

2z s

ne

α =

Lo que acabamos de estudiar se puede hacer de manera análoga, cuando tenemos un intervalo de confianza para una proporción p , tal que, el error

máximo de estimación queda como 2

pqe z

nα= y al despejar el tamaño de la

muestra tendremos ( )

2

2

2

z pq

ne

α

= , como por lo general no se conoce p , lo

aproximamos con un valor de su estimador puntual, es decir con p y en la práctica usaremos la siguiente fórmula para determinar el tamaño de la muestra.

( )2

2

2

ˆ ˆz pq

ne

α

=

El valor más grande de n se alcanza cuando 1

ˆ 0.52

p = = (1

ˆ 0.52

q = = )

suponiendo que el error máximo y el grado de confianza se mantienen fijos. Por lo que, cuando no se tenga información ni siquiera de p , podemos apoyarnos de la siguiente expresión para obtener el mayor tamaño de muestra.

( )2

2

24

z

ne

α

=

96

Ejemplo 14 : Se considera una muestra aleatoria de 36 personas que asistieron a un hospital para una atención urgente, el tiempo promedio de espera para ser atendidos fue de 1.5 horas con una desviación estándar de media hora.

a) Construir un intervalo de confianza al 95% para el tiempo promedio real de las personas que asisten a urgencias en este hospital y obtenga el error máximo de estimación.

b) ¿De que tamaño tendría que seleccionarse una muestra aleatoria, si se quiere con una confianza del 95% de que el error máximo de estimación sea de 0.1?

Respuesta : para el inciso a) usamos 2

sx z

nα± , de la tabla 2 de porcentajes

para la normal se obtiene que 2

1.96zα = , dado que 1 0.95α− = .

1.5 0.5x y s= = , luego 0.5

1.5 1.96 1.5 0.16336

± ⇒ ± .

Un intervalo de confianza es 1.337 1.663µ< < y el error máximo de estimación es de 0.163 .

b) Aquí usamos la fórmula 2

2z s

ne

α =

, con 2

1.96zα = , 0.5s = y 0.1e =

Por lo que ( ) 2

1.96 0.596.04

0.1n

= =

, de manera que si se toma una muestra de

tamaño 97 , el error máximo será menor a 0.1. Ejemplo 15 : Con referencia al ejemplo 12, supongamos que se quiere que la proporción de la muestra difiera de la proporción real en a lo más 0.05 con una confianza del 92%, ¿de que tamaño tendría que ser la muestra? Respuesta : Usando ˆ 0.35p = como una aproximación de p y dado que el grado de confianza es

2

1 0.92 1.751zαα− = ⇒ = .

Se tiene que el tamaño de la muestra es de ( ) ( )( )2

2

1.751 0.35 0.65279

0.05n = = , para

tener tal presición.

Si conociéramos el valor de p , podríamos recurrir a la fórmula ( )

2

2

24

z

ne

α

= y

obtener el tamaño de la muestra.

( )( )

2

2

1.751306.6 307

4 0.05n = = ≈ , el cual es mayor al encontrado cuando se utilizo

ˆ 0.35p = .

97

En el ejemplo que sigue se ilustra como podemos obtener el grado de confianza de un intervalo cuando conocemos solo un extremo y contamos con información de la población y muestra. Ejemplo 16 : En una población normal, se tiene que su desviación estándar es

2.3σ = . El extremo superior de un intervalo de confianza para la media poblacional µ es 16.268, al tomar una muestra de tamaño 50n = con una media 15.6x = .

a) Obtenga el grado de confianza del intervalo. b) Encuentre el valor del extremo inferior de dicho intervalo.

Respuesta :

a) El límite superior del intervalo para la media µ , bajo estas condiciones

esta dado por 2

x zn

ασ+ , de modo al igualarlo con 16.268 , obtenemos la

ecuación 2

2.315.6 16.268

50zα+ = y resolviéndola para

2

zα

tenemos el valor

de la variable normal estándar 2

50(16.268 15.6) 2.054

2.3zα = − = y al ir a la

tabla 2 de porcentajes, hallamos que 1 0.96α− = . Por lo tanto, el grado de confianza del intervalo es 96%.

b) El extremo inferior es 2

x zn

ασ− , por lo que solo se sustituyen los valores

en él 2.3

15.6 2.054 14.93250

− = . Por lo tanto el extremo inferior queda

como 14.932. 3.9 Intervalo de confianza para la varianza Para construir un intervalo de confianza de la varianza 2σ en una población normal, se utiliza la variable ji o chi–cuadrada.

Esta variable es ( ) 2

2

2

1n Sχ

σ−

= y tiene una distribución chi–cuadrada con 1n −

grados de libertad. Para un nivel de confianza de 1 α− , podemos escribir lo siguiente como se ilustra en la figura 6 .

98

( )2 2

2 2 2

11P α αχ χ χ α

−< < = −

Figura 6 Donde

2

2

1 αχ−

y 2

2αχ son los valores de la chi-cuadrada que limitan un área bajo la

curva de 2

1 α− y 2α a su derecha, respectivamente, con 1n − grados de libertad.

Al reemplazar 2χ por ( ) 2

2

1n S

σ−

en ( )2 2

2 2 2

11P α αχ χ χ α

−< < = − , y despejar a 2σ

dentro de la desigualdad, se obtiene que: ( )

( ) ( )

( ) ( )

( ) ( )

2 2

2 2

2 2

2 2

2

2 2

21

2 2

1

2 2 2

2 2

2

2 2

1

2 2

2

2 2

1

11

11

1 1

1 11

1 11

n SP

Pn S n S

n S n SP

n S n SP

α α

α α

α α

α α

χ χ ασ

χ χα

σ

σ αχ χ

σ αχ χ

−

−

−

−

−< < = −

< < = − − −

− − > > = −

− − < < = −

De manera que: Para una muestra aleatoria de tamaño n , tomada de una población normal con varianza 2σ , un intervalo de confianza del ( )1 100%α−

para la varianza 2σ queda como

( ) ( )

2 2

2 2

2

2 2

1

1 1n s n s

α α

σχ χ

−

− −< <

donde 2s es la varianza de esta muestra, 2

2

1 αχ−

y 2

2αχ se obtienen de la tabla 4

para la distribución chi-cuadrada con 1n − grados de libertad(ver figura 6).

1 α−

2

2

1 αχ−

2

2αχ

2α

2α

99

Si se quiere un intervalo de confianza para la desviación estándar σ , un intervalo de confianza, lo obtenemos extrayendo la raíz cuadrada al intervalo anterior, para tener

( ) ( )

2 2

2 2

2 2

1

1 1n s n s

α α

σχ χ

−

− −< <

Ejemplo 17 : De una población normal se selecciona una muestra aleatoria de tamaño 5n = y resulta que su media es 3 con una varianza de 0.815 . Obtenga un intervalo de confianza para la varianza poblacional del 95%.

Respuesta : usamos ( ) ( )

2 2

2 2

2

2 2

1

1 1n s n s

α α

σχ χ

−

− −< < para construir un intervalo.

De la tabla 4, con 1 4n − = grados de libertad y 1 0.95α− = , entonces 2 2

0.025 0.9752 20.025 1 0.975 11.1433 0.4844y yα α χ χ= − = ⇒ = = .

( ) ( )2

2

5 1 0.815 5 1 0.815

11.1433 0.4844

0.293 6.730

σ

σ

− −< <

< <

Por lo tanto, la varianza 2σ se encuentra dentro del intervalo ( )0.293 , 6.730 con

una probabilidad del 95%. Ejemplo 18 : Las estaturas de 10 niñas cuya edad es de 7 años son: 1.20, 1.21, 1.21, 1.22, 1.24, 1.24, 1.25, 1.30, 1.32 y 1.35. Suponiendo que representan una muestra aleatoria y que la población de estaturas para las niñas de 7 años es normal.

a) Obtenga un intervalo de confianza del 99% para la estatura promedio de todas las niñas con esa edad.

b) Construya un intervalo de confianza del 90% para la desviación estándar de la población.

Respuesta : Obtenemos los valores de x y 2s a partir de los datos, 1.254x =

2 0.0027s = y 0.052s = .

a) Un intervalo para la estatura promedio µ es 2

sx t

nα± . De la tabla 3

para la distribución t con 2

0.0051 0.99 3.250t tαα− = ⇒ = = con

10 1 9n = − = grados de libertad. 0.052

1.254 3.250 1.25 0.0510

± ⇒ ± , por lo

que tenemos 1.20 1.30µ< <

100

b) Para la desviación estándar usamos ( ) ( )

2 2

2 2

2 2

1

1 1n s n s

α α

σχ χ

−

− −< < . Vamos

a la tabla 4 de la distribución chi-cuadrada, como 1 0.90α− = , se tiene que 2 2

0.05 0.952 20.05 1 0.95 16.9190 3.3251y yα α χ χ= − = ⇒ = = con

1 9n − = grados de libertad, luego

( ) ( )

( ) ( )2 2

2 2

2 2

1

1 1

9 0.0027 9 0.0027

16.9190 3.3251

0.04 0.09

n s n s

α α

σχ χ

σ

σ

−

− −< <

< <

< <

Ejemplo 19 : De una población normal, se extrae una muestra aleatoria de tamaño 15n = y resulta que su varianza es 2 1.45s = . El extremo inferior de un intervalo de confianza para la varianza poblacional 2σ es 0.8570898 .

a) Determine el grado de confianza del intervalo. b) Obtenga el valor del extremo superior del intervalo.

Respuesta :

a) El extremo de un intervalo para la varianza es ( )

2

2

2

1n s

αχ−

, luego al

igualarlo con 0.8570898 , tenemos ( )

2

2

14 1.450.8570898

αχ= , despejando a

2

2αχ , resulta que

( )2

214 1.45

23.68480.8570898

αχ = = y de la tabla 4 para la

distribución chi-cuadrada con 14 grados de libertad, se determina que

20.05α = , luego 0.10α = . Por lo tanto, el grado de confianza es

1 0.90α− = , es decir 90% .

b) Como ( )

2

2

2

1

1n s

αχ−

− es el extremo superior y dado que

20.05α = , entonces

21 0.95α− = y con 14 grados de libertad 2

0.95 6.5706χ = , así el valor del

extremo superior del intervalo será ( ) ( )2

2

0.95

1 14 1.453.08952

6.5706

n s

χ−

= = .

101

3.10 Intervalo de confianza para la razón de varian zas. Cuando se tienen dos poblaciones normales con varianzas 2

1σ y 2

2σ , sabemos

que un estimador puntual de la razón 2

1

2

2

σσ

es 2

1

2

2

S

S. Para construir un intervalo de

confianza utilizamos la variable o estadísticoF que esta expresada por 2 2

2 1

2 2

1 2

SF

S

σσ

=

Con una distribución F con 1 1 1nν = − y 2 2 1nν = − grados de libertad para el numerador y denominador respectivamente. De manera que si 1 α− es el grado de confianza, tenemos que

( ) ( )2 2

1 2 1 21, , 1P f F fα αν ν ν ν α

− < < = −

donde ( )2

1 21,f α ν ν

− y ( )

21 2,fα ν ν son los valores de la distribución F con 1ν y

2ν , que limitan áreas de 2

1 α− y 2α , a su derecha respectivamente(ver figura 7 )

( ) ( )2 2

1 2 1 21, , 1P f F fα αν ν ν ν α

− < < = −

Figura 7

Al sustituir 2 2

2 1

2 2

1 2

SF

S

σσ

= y despejar a 2

1

2

2

σσ

obtenemos lo que sigue

( ) ( )2 2

2 2

2 11 2 1 22 21

1 2

, , 1S

P f fS

α ασν ν ν ν ασ−

< < = −

( ) ( )

( ) ( )

( ) ( )

2 2

2 2

2 2

2 2 2

2 2 21 2 1 22 2 21

1 1 1

2 2 2

1 1 1

2 2 2

2 1 2 2 2 1 21

2 2 2

1 1 1

2 2 2

2 1 2 2 2 1 21

, , 1

1 11

, ,

1 11

, ,

S SP f f

S S

S SP

S f S f

S SP

S f S f

α α

α α

α α

σν ν ν ν ασ

σ αν ν σ ν ν

σ αν ν σ ν ν

−

−

−

< < = −

> > = −

< < = −

1 α−

21f α−

2

fα

2α

2α

102

Utilizando la propiedad que ( ) ( )2

2

1 212 1

1,

,f

fα

α

ν νν ν−

= nos queda que

( ) ( )2

2

2 2 2

1 1 12 12 2 2

2 1 2 2 2

1, 1

,

S SP f

S f Sα

α

σ ν ν αν ν σ

< < = −

Por lo que, si 2

1s y 2

2s son los valores de las varianzas de muestras

independientes de tamaños 1n y

2n , respectivamente, sacadas de poblaciones

normales, un intervalo de confianza del ( )1 100%α− para la razón 2

1

2

2

σσ

será

( ) ( )2

2

2 2 2

1 1 12 12 2 2

2 1 2 2 2

1,

,

s sf

s f sα

α

σ ν νν ν σ

< <

O bien ( ) ( )2

2

2 2

1 12 12 2

2 1 2 2

1, ,

,

s sf

s f sα

α

ν νν ν

donde ( )2

1 2,fα ν ν es un valor de la tabla 5 para la distribución F de Fisher con

1 11nν = − grados de libertad para el numerador y

2 21nν = − grados de libertad

para el denominador que limita un área a su derecha de 2α , ( )

22 1,fα ν ν es un

valor de la tabla 5 con 2 2

1nν = − grados de libertad para el numerador y

1 11nν = − grados de libertad para el denominador.

Ejemplo 20 : Los siguientes datos representan muestras del tiempo que las personas pasan en sus hogares durante días laborables (sin tomar en cuenta cuando duermen en ella) en dos ciudades A y B. Ciudad A 4.1 5.2 5.4 5.8 6.2 6.3 Ciudad B 4.2 5.1 5.3 5.9 6.4 6.5 7.1 7.2 Construya un intervalo de confianza del 99% para la razón de varianzas de los tiempos de estancia que las personas pasan en sus casas en estas ciudades en días laborables, suponiendo normalidad de las poblaciones e independencia en las muestras. Respuesta : Consideremos que Los datos del primer renglón son la muestra I (A) y los del segundo la muestra II (B), y que deseamos un intervalo de

confianza para 2

1

2

2

σσ

, donde 2

1σ y 2

2σ son las varianzas de las poblaciones A y B

respectivamente. Los tamaños de las muestras son

16n = y

28n = , calculamos sus varianzas y

tenemos que 2

10.656s = y 2

21.086s = .

103

Ahora encontramos los valores de la tabla 5 para la distribución F , de acuerdo al grado de confianza

21 0.99 0.01 0.005αα α− = ⇒ = ⇒ = y los grados de

libertad 1 1

1 5nν = − = y 2 2

1 7nν = − = .

( ) ( )( ) ( )

2

2

1 2 0.005

2 1 0.005

, 5,7 9.522

, 7,5 14.200

f f

f f

α

α

ν ν

ν ν

= =

= =

Sustituyendo

( ) ( )

( )

2

2

2 2 2

1 1 12 12 2 2

2 1 2 2 2

2

1

2

2

2

1

2

2

1,

,

10.604 0.604 14.200

9.522

0.063 8.577

s sf

s f sα

α

σ ν νν ν σ

σσ

σσ

< <

< <

< <

Un intervalo de confianza al 99% para 2

1

2

2

σσ

es ( )0.063 , 8.577 .

RESUMEN: Del capítulo 3 podemos escribir las principales pro piedades de los estimadores puntuales y los intervalos de confianza para los diversos parámetros.

Propiedades de los estimadores o estadísticos

Estimador Insesgado Un estimador Θ de un parámetro Θ , se llama insesgado si

( )ˆE Θ = Θ

Estimador eficiente Si

1Θ y

2Θ son estimadores puntuales del parámetro Θ , decimos que

1Θ

es más eficiente que 2

Θ , si ( ) ( )1 2ˆ ˆV VΘ < Θ

104

INTERVALOS DE CONFIANZA

Para una media poblacional µ

1) Población normal y varianza 2σ conocida.

2

x zn

ασ±

2) Población no normal, varianza 2σ desconocida y muestra grande.

2

sx z

nα±

3) Población normal, con varianza 2σ desconocida y muestra pequeña.

2

sx t

nα±

Error máximo de estimación y tamaño de la muestra

2 2

2 2

2 2

;z z s

se z n O bien e z n

e en n

α α

α α

σσ = ⇒ = = ⇒ =

Para una diferencia de medias poblacionales 1 2

µ µ−

1) Poblaciones normales con varianzas 2

1σ y 2

2σ conocidas.

( )2

2 2

1 21 2

1 2

x x zn n

ασ σ− ± +

2) Poblaciones no normales, con varianzas 2

1σ y 2

2σ desconocidas y

muestras grandes e independientes.

( )2

2 2

1 21 2

1 2

s sx x z

n nα− ± +

3) Poblaciones normales, con varianzas 2

1σ y 2

2σ desconocidas pero

iguales ( 2 2

1 2σ σ= ), y muestras pequeñas e independientes.

22 1

1 2

1 1( ) px x t s

n nα− ± +

( ) ( )2 2

1 1 2 2

1 2

1 1

2p

n s n sdonde s

n n

− + −=

+ −

105

4) Poblaciones normales, con varianzas 2

1σ y 2

2σ desconocidas pero

diferentes ( 2 2

1 2σ σ≠ ), y muestras pequeñas e independientes.

( )2

2 2

1 22 1

1 2

s sx x t

n nα− ± +

Donde

2

tα se obtiene de la tabla para la distribución t de Student con

22 2

1 2

1 2

2 22 2

1 2

1 2

1 21 1

s s

n n

s s

n n

n n

ν

+

= +

− −

grados de libertad.

5) Poblaciones normales y muestras pequeñas dependi entes o apareadas.

2

dsd tn

α±

Para proporciones

1) Si la muestra es suficientemente grande, para u na proporción poblacional p .

2

ˆ ˆˆ

pqp z

nα±

Error máximo y tamaño de la muestra.

2 2

2 2

2 2

2 2

ˆ ˆˆ ˆ

;z pq z pq

pq pqe z n O bien e z n

n e n e

α α

α α= ⇒ = = ⇒ =

2) Si las muestras son suficientemente grandes e independientes, para una diferencia de proporciones poblacionales

1 2p p− .

( )2

1 1 2 21 2

1 2

ˆ ˆ ˆ ˆˆ ˆ

p q p qp p z

n nα− ± +

Para varianzas

1) Para la varianza 2σ 2) Para la razón de varianzas 2

1

2

2

σσ

( ) ( )

2 2

2 2

2

2 2

1

1 1n s n s

α α

σχ χ

−

− −< < ( ) ( )

2

2

2 2

1 12 12 2

2 1 2 2

1, ,

,

s sf

s f sα

α

ν νν ν

106

Ejercicios:

1) De una población con media µ y varianza 2σ , se toma una muestra aleatoria de tamaño n ,

1 2 3, , , , nX X X XK y se definen tres estimadores

puntuales para µ .

1 2 31

2 3 11

1 2 31

ˆ3

ˆ2

ˆ

n

n

X X X

X X X

n

X X X X

n

−

+ +Θ =

+ + +Θ =−

+ + + +Θ =

L

L

a) Verifique que los tres estimadores son insesgados. b) Determine cual es el más eficiente.

2) En la industria automotriz, una compañía productora de autos compactos desea conocer el tiempo de vida promedio, antes de que presenten problemas mecánicos graves, con la finalidad de establecer una póliza de garantía. Una muestra aleatoria de 15 de estos autos arroja un tiempo de vida medio de 6 años, antes de presentar una falla mecánica grave. Construir un intervalo de confianza al 90%, 94% y 99%, respectivamente para el tiempo de vida promedio de todos los autos compactos que produce la compañía, suponiendo que la población es normal con una desviación estándar de 2 años.

3) El tiempo medio de vida para 20 lámparas luminosas es de 5500 horas.

Si los tiempos de duración de todas las lámparas es aproximadamente normal con una desviación estándar de 300 horas.

a) Obtenga un intervalo de confianza del 94% el verdadero tiempo de vida promedio de las lámparas.

b) ¿Qué tan grande tendría que ser el tamaño de la muestra, para que con una confianza del 95% la media de la muestra difiera de la media poblacional en 50 horas?

4) El salario medio de una muestra de 100n = empleados en tiendas

departamentales, de la ciudad de Durango, es de 135 pesos, con una desviación estándar de 20 pesos. Construya un intervalo de confianza al 99% para el salario medio de los empleados en tiendas departamentales de la ciudad de Durango; ¿De que tamaño deberá se la muestra para que el error máximo de estimación sea de 10, con una confianza del 98%?

5) La compañía MASECA, quiere estimar el verdadero peso promedio de

las bolsas que usa para empacar harina de maíz. Selecciona una muestra aleatoria de 36 bolsas, de la cual se obtiene un peso promedio de 250 gramos con una desviación típica de 9 gramos. Encuentre un intervalo de confianza del 92% para el peso medio real de las bolsas para harina de maíz.

107

6) Los siguientes datos (en horas): 1.30, 1.45, 1.40, 2.20, 2.40, 1.80, 2.50, 3.10 y 1.45; representan 9 tiempos que tardan en responder un “test” de habilidades, para diagnosticar la enfermedad de Alzhaimer en adultos mayores de 65 años, Obtenga un intervalo de confianza del 95%, para el tiempo promedio que tardan todos los adultos mayores de 65 años en responder el “test”. Suponga que la población es normal.

7) Una muestra aleatoria de 12 cigarros de la marca X tiene un contenido

promedio de nicotina de 4.7 miligramos, con una desviación estándar de 1.12 miligramos. Construya un intervalo de confianza del 96% para el contenido promedio real de nicotina en los cigarros de esta marca, si suponemos normalidad en la población.

8) De una población normal, se saca una muestra aleatoria de tamaño

16n = , tal que 7.8x = ; 0.81s = y se sabe que el extremo inferior de un intervalo de confianza para µ es 7.445 . Obtenga el grado de confianza usado y el extremo superior del intervalo.

9) Una muestra aleatoria de 10 niñas con doce años y una muestra

aleatoria de 15 niños con doce años proporcionaron estaturas medias de

11.52x = metros y

21.49x = metros, respectivamente. Suponiendo que las

estaturas se distribuyen normalmente con 1 2

0.05 0.08yσ σ= = metros.

Obtener un intervalo de confianza para 1 2

µ µ− del 90%, 95% y 99% respectivamente.

10) Se seleccionaron aleatoriamente dos grupos de empleados, con el fin de

adiestrarlos para realizar una determinada actividad, cada grupo se preparo con un método diferente. De manera que 34 empleados se prepararon con el método I y se obtuvo que 2

1 148 ; 180x s= = . Mientras

que 36 empleados se adiestraron con el método II, con 2

2 241 ; 255x s= = . Determine un intervalo de confianza del 98% para la

diferencia en los tiempos promedio verdaderos de los dos métodos de entrenamiento.

11) Mediciones en el diámetro transversal en los corazones de adultos de

sexo masculino y femenino aparecen en la tabla. Suponiendo que las poblaciones son normales con varianzas iguales ( )2 2

1 2σ σ= , construir un

intervalo de confianza del 90% para la diferencia de los diámetros promedio en los corazones de hombres y mujeres adultos.

( ) ( )15 14.2 1.09

11 11.5 1.04

Tamaño de muestra x cm s cm

Hombres

Mujeres

108

12) Los estudiantes en una escuela pueden elegir un curso de Química con o sin laboratorio y presentar un examen final para ambos cursos. Si 12 estudiantes del curso con laboratorio obtuvieron una calificación promedio de 86 puntos con una desviación estándar de 3 puntos, y 18 estudiantes del curso sin laboratorio obtuvieron una calificación promedio de 78 puntos con una desviación estándar de 5 puntos. Obtenga un intervalo de confianza del 99% para la diferencia entre las calificaciones promedio de los dos cursos. Suponga que las poblaciones son normales, con varianzas iguales.

13) En referencia al ejercicio 12), construir un intervalo de confianza del

96% para 1 2

µ µ− , suponiendo normalidad y varianzas diferentes

( )2 2

1 2σ σ≠ .

14) Los tiempos de secado de dos tipos de concreto de alta resistencia,

aparecen en la tabla. Obtener un intervalo de confianza del 95% para la diferencia real en el tiempo medio de secado de los dos tipos de concreto, suponiendo normalidad, independencia en las muestras y varianzas poblacionales diferentes.

( ) ( )15 14.2 1.09

11 11.5 1.04

Tamaño de muestra x cm s cm

Hombres

Mujeres

15) Una empresa desea estimar como afecta una huelga en la productividad de sus obreros, para ello mide la producción diaria, de 10 trabajadores antes y después de una huelga y encuentra que:

Trabajador Producción antes Producción después

1 65 59 2 60 62 3 58 58 4 63 59 5 68 61 6 65 60 7 59 62 8 63 61 9 64 56

10 63 60

Construir un intervalo de confianza del 99% para la diferencia media en la producción de los obreros.

109

16) En la ciudad de México se desea aproximar el porcentaje real de habitantes mayores de 18 años, que tienen automóvil, para ello se selecciona una muestra aleatoria de 500 personas mayores de 18 años, de los cuales resulto que 125 tienen auto. Con esta información construya un intervalo de confianza del 91% para el porcentaje real de habitantes mayores de edad que tienen auto.

17) Con respecto al ejercicio 16), ¿de que tamaño tendría que ser la

muestra, para que la proporción de la muestra difiera de la proporción real en menos de 0.05, con una confianza del 90%?

18) De una muestra aleatoria de 60 estudiantes de una escuela, 12 son

fumadores. Obtenga un intervalo de confianza del 94% para la verdadera proporción de estudiantes de dicha escuela que son fumadores.

19) Determine el tamaño de la muestra en el ejercicio 18), para que el error

máximo de estimación fuera de 0.02, con una confianza del 95%. 20) En el estado de México se quiere conocer en forma aproximada, la

diferencia en las preferencias por dos candidatos políticos A y B de los votantes. Se halla que 63 de 100 prefieren al candidato A y que 55 de 110 prefieren al candidato B. Obtenga un intervalo de confianza del 95% para la diferencias de proporciones verdaderas en las preferencias de los candidatos.

21) Los tiempos de vida de 7 perros de raza pastor alemán fueron: 12, 12,

10, 11, 13, 12 y 14 años. construya un intervalo de confianza del 99% para la varianza poblacional. Suponga los tiempos se distribuyen normalmente.

22) Los contenidos en los envases con refresco de cola de cierta marca se

distribuyen normalmente. Se selecciona una muestra aleatoria de 20 envases, resultando que 595 5x ml y s ml= = . Obtenga un intervalo de confianza al 90%, para la desviación estándar en los contenidos de refresco de dicha marca.

23) El extremo inferior de un intervalo de confianza para la varianza 2σ es

0.78033, a partir de una muestra de tamaño 16n = , con varianza 2 1.43s = , sacada de una población normal.

a) Obtenga el grado de confianza que se utilizo. b) Determine el extremo superior del intervalo.

110

24) Construir un intervalo de confianza del 90% para la razón de varianzas 2

1

2

2

σσ

, con la información del ejercicio 14).

25) La siguiente tabla proporciona las varianzas de muestras aleatorias e

independientes tomadas de poblaciones normales. Obtener un intervalo

de confianza del 99% para la razón 2

1

2

2

σσ

.

Muestra 1 1

10n = 2

11.08s =

Muestra 2 2

18n = 2

20.052s =

111

Capítulo 4 PRUEBAS DE HIPOTESIS

n todo proceso de investigación, uno de sus principales ingredientes es el planteamiento del problema que se desea estudiar y pretende resolverse o acercarse a su posible solución, así como el marco teórico,

de referencia, la metodología, entre otros y en un momento dado, se deben plantear hipótesis o aseveraciones sobre dicha respuesta a la problemática en cuestión. La estadística inferencial ofrece procedimientos, mediante los cuales se pueden contrastar dos hipótesis que sean opuestas una con respecto a la otra, para tomar una desición respecto a cual será la más aceptada como correcta. Estos procedimientos se conocen como pruebas de hipótesis y generalmente se establecen para los parámetros, es decir medidas poblacionales que son desconocidas y se quiere afirmar algo sobre ellas, por ejemplo, en el Distrito Federal se considera que un 60% de las familias tiene casa propia y se desea poner a prueba esta aseveración, ya que existe la conjetura de un investigador, de que en realidad es menor el porcentaje de familias que tienen casa propia, el tiempo promedio de traslado del hogar de los habitantes en una gran ciudad a su centro de trabajo es de una hora y media, cuando se tienen sospechas de que es mayor, debido al crecimiento irracional de automóviles y habitantes, se quiere estudiar la efectividad de un medicamento I y se asegura que es mejor que un medicamento II para combatir la hipertensión arterial, los artículos producidos por la empresa X, tienen una mayor duración que los producidos por la empresa Y, Las personas tienen mayor preferencia por los autos de la marca A que los de la marca B, etc. En cualquiera de los ejemplos anteriores se tomará una desición al respecto y lo podemos hacer mediante las pruebas de hipótesis. En la unidad estudiaremos los elementos de una prueba de hipótesis para diversos parámetros, aunque antes de ello conviene dar una definición de lo que llamaremos una prueba de hipótesis. 4.1 Definición de una prueba de hipótesis Una prueba de hipótesis es un procedimiento estadístico, en el que se usa la información recabada de una o más muestras aleatorias con el fin de determinar cuando se puede “aceptar” una hipótesis o en su defecto cuando debemos “rechazar” esta. En realidad más que su definición, nos interesan los elementos básicos del procedimiento denominado como una prueba de hipótesis. Es necesario señalar que no hay nada definitivo, en cuanto a la cantidad de estos elementos, aquí describiremos los que se consideran como básicos, pudiendo contar con más o menos. En toda prueba usaremos una o dos muestras y de ellas obtendremos una conclusión acerca de la población o poblaciones correspondientes y debemos tener siempre presente que esa

E

112

conclusión nunca será del todo cierta, ya que se estará expuesto a un riesgo de errar en la conclusión tomada, este hecho forma parte de la sección que sigue. 4.2 Elementos de una prueba de hipótesis En cualquier prueba de hipótesis se presentan cinco elementos que consideramos como fundamentales, a saber las hipótesis, el nivel de significancia, valor del estadístico de prueba, la región de rechazo y de no rechazo y la desición estadística . Como ya se indico, no se deben tomar como los únicos elementos de una prueba, ya que hay quienes agregan otros dependiendo de las necesidades de cada problema a investigar. Sin embargo nosotros solo usaremos los cinco antes mencionados. 4.2.1 Planteamiento de las hipótesis Una hipótesis, es una aseveración o afirmación sobre alguna situación problemática, en la se da una probable solución o respuesta a esta. En la estadística las hipótesis se dan sobre un parámetro de interés y se manejan dos, la hipótesis nula denotada por

0H y por lo regular involucra a la

igualdad , ya que en varios casos se toma como la nulidad de efectos, por ejemplo, cuando dos medicamentos producen el mismo tiempo promedio de reacción en una enfermedad, se escribe la hipótesis nula como

0 1 2:H µ µ= , o

bien como 0 1 2: 0H µ µ− = , donde

1µ y

2µ son los tiempos medios de reacción

del medicamento A y B, respectivamente. Generalmente la hipótesis nula 0

H , no es la del investigador y se pretende rechazar. Por otro lado se presenta la hipótesis contraria a la nula, llamada comúnmente hipótesis alternativa o alterna , la cual se denota por

1H y regularmente es la

hipótesis del investigador, es decir la que se desea aceptar como correcta. Se pueden presentar tres alternativas opuestas a la hipótesis nula, para ilustrarlo tomemos el ejemplo de los dos medicamentos, en donde el medico cree que el medicamento B es mejor que el medicamento A, así la hipótesis alterna se puede enunciar como

1 1 2:H µ µ> o bien

1 1 2: 0H µ µ− > . Si para el medico, la

palabra mejor significa que el tiempo promedio de reacción es menor. Pero también podría decir que el medicamento A es mejor que el B lo que implicaría como hipótesis alterna

1 1 2:H µ µ< o bien

1 1 2: 0H µ µ− < . Por último puede

simplemente decir que, existe diferencia entre los tiempos medios de reacción sin especificar algún medicamento como mejor que otro, lo que nos llevaría a la hipótesis alterna

1 1 2:H µ µ≠ o bien

1 1 2: 0H µ µ− ≠ .

De lo anterior se puede decir que la hipótesis alternativa involucra uno de los siguientes símbolos > “mayor que”, < “menor que” y ≠ “diferente de”. La hipótesis alternativa

1H estará ligada de manera directa, al tipo de región de

rechazo que se utilizará en la prueba, como se verá después.

113

4.2.2 El nivel de significancia (α ) Al llevar a cabo una prueba de hipótesis se toma una desición, respecto a cual de las dos hipótesis se debe ser rechazada, generalmente se quiere que esta sea la hipótesis nula

0H y no rechazar (“aceptar”) la hipótesis alternativa

1H .

Resulta desde el punto de vista lógico, que al tomar una desición de las dos hipótesis anteriores se queda expuesta a cometer dos clases de errores que pueden presentarse. Uno es rechazar la hipótesis nula

0H , cuando en realidad

es verdadera o cierta, comúnmente se conoce como Error tipo I y el otro es cuando no se rechaza (“aceptar”) la hipótesis nula

0H , cuando en realidad es

falsa o equivocada, llamado Error tipo II . A la probabilidad de cometer el error tipo I se le llama nivel de significancia de la prueba y se denota por medio de la letra griega “alfa” α . A la probabilidad de cometer el error tipo II se le simboliza con la letra griega “beta” β . En la tabla que sigue se ilustra la aparición de estos dos tipos de errores en una prueba de hipótesis.

Desición Realidad de

0H

Se rechaza 0

H No se rechaza 0

H

0H es verdadera

Error tipo I

Desición correcta

0H es falsa

Desición correcta

Error tipo II

De manera que el nivel de significancia es la probabilidad de cometer el error tipo I, es decir ( )P Error tipo Iα = y generalmente su valor lo propone el

investigador, ya que su objetivo es rechazar la hipótesis nula 0

H y por consecuencia se puede presentar el error tipo I . Los valores para α más usados son aquellos que se encuentran entre el 1% y el 10%. Cuando no se tiene información del nivel de significancia se toma el 5% para llevar a cabo la prueba. 4.2.3 Valor del estadístico de prueba Las hipótesis tanto la nula como la alterna, estarán planteadas hacia un parámetro, de ahí que un estadístico de prueba es una variable que permitirá tomar desiciones a través de sus valores numéricos que tome de muestra en muestra, utilizando la información ellas y del comportamiento que tenga dicha variable, ello significa que debemos obtener un valor del estadístico de prueba , para compararlo con otro valor critico que permita decidirse al respecto de las hipótesis. Por ejemplo, un estadístico de prueba puede ser

XZ

n

µσ−= , si se desea llevara cabo una prueba para la media poblacional, el

cual se utilizo en la construcción de intervalos de confianza para la media

114

poblacional µ , un valor de este estadístico de prueba será 0c

xz

n

µσ−= ,

donde x es el valor de la media de una muestra aleatoria de tamaño n , tomada de una población normal con varianza 2σ conocida y la hipótesis nula asegura que

0 0:H µ µ=

0µ , es un valor fijo, por ejemplo la hipótesis nula puede decir que la estatura promedio de los niños con edad de 7 años es de 1.30 metros, lo que significa que la media poblacional, se cree toma el valor de

01.30µ = .

Si las hipótesis tanto nula, como la alternativa afirman algo sobre la media poblacional µ , es razonable considerar que el estimador X debe intervenir en el estadístico de prueba y sobretodo el valor que tome para una muestra en particular, supóngase que la hipótesis alterna asegura que la estatura promedio de los niños de 7 años es mayor a 1.30 metros, es de esperar que debe existir un valor mayor que 1.30, a partir del cual cuando la media muestral X rebase este número se estará apoyando de alguna manera a la hipótesis alterna y se llamará valor crítico para el estimador o estadístico X , si suponemos que el valor critico es 1.32b = , es decir que, cuando 1.32X > la hipótesis nula será rechazada, ya que los elementos recabados de una muestra arrojaron un valor de X ( x ) mayor que 1.32 y por tanto la información obtenida permite rechazar la hipótesis nula y apoyar a la hipótesis alternativa. 4.2.4 Región de rechazo y de no rechazo Como se acaba de señalar, para rechazar o apoyar una hipótesis se debe hacer una comparación del estadístico o estimador con un valor crítico b , de manera que si X b> , en una prueba de hipótesis

0 0:H µ µ= contra

1 0:H µ µ> ,

se esta en condiciones de rechazar la hipótesis nula y en caso de que X b≤ , no se tienen las razones suficientes para rechazar a la hipótesis nula. Lo anterior nos lleva a la noción de región de rechazo y de no rechazo (llamada también región de aceptación) , el valor crítico b produce una región de rechazo y otra de no rechazo como se ilustra en la figura 1 , en la cual se muestra a partir de cuando se rechazará la hipótesis nula y cuando no debe ser rechazada.

Figura 1 (Región de rechazo de cola derecha)

A esta región se llama de extremo derecho o de cola derecha , en virtud de que a la derecha del valor b queda la región de rechazo.

b

Región de rechazo Región de no rechazo

X b≤ X b>

115

De manera similar se puede tener una región de rechazo de extremo izquierdo o de cola izquierda , es decir cuando se desea poner a prueba la hipótesis nula

0 0:H µ µ= , contra la alternativa

1 0:H µ µ< deberá existir un

valor crítico a , de forma que si X a< , la hipótesis nula 0

H será rechazada y

si X a≥ , 0

H no se rechazará. La figura 2 ilustra este tipo de región.

Figura 2 (Región de rechazo de cola izquierda)

Finalmente cuando se tiene la hipótesis nula 0 0:H µ µ= en contra de la

alternativa 0 0:H µ µ≠ , es decir solo se indica que la media poblacional es

diferente a 0

µ , se producen dos valores críticos, a saber a y b tal que, si

X b> o X a< la hipótesis nula se rechazará y en caso contrario no será rechazada ( cuando a X b≤ ≤ ). A dicha región se le llama de extremos derecho e izquierdo o bien de dos colas y en la figura 3 se ilustra tal región.

Figura 3 (Región de rechazo de dos colas)

4.2.5 Desición estadística (Regla de desición) En base al tipo de región de rechazo que se vaya a considerar en una prueba de hipótesis, se deberá tomar una desición al respecto de si se rechaza ó no la hipótesis nula

0H , ello por lo regular se conoce como desición estadística .

La desición estadística se lleva a cabo después de recabar la información de una muestra aleatoria de cierto tamaño, tomada de la población que se esta estudiando, y quiere decir que pueden ser significativos los datos de la muestra para rechazar ó no la hipótesis nula, tal desición depende en gran medida de la muestra (valores de los estimadores puntuales) y de la hipótesis nula que se desea poner a prueba. Por ello a la probabilidad de cometer el error tipo I, es decir ( )P Error tipo Iα = se le conoce como nivel de significancia.

Si tomamos a manera de ilustración, el caso de una prueba de hipótesis para una media µ tendremos que la desición estadística queda como:

Región de no rechazo

a X a< X b> b a X b≤ ≤

Región de rechazo Región de rechazo

Región de rechazo Región de no rechazo

a X a< X a≥

116

Para una región de rechazo de cola derecha ( )0 0 1 0: :H vs Hµ µ µ µ= > ,

si el valor de X ( )x en una muestra aleatoria, es mayor que el valor cr ítico

b ( )x b> , entonces la hipótesis nula 0

H será rechazada, en caso contrario

no se rechaza dicha hipótesis. Para una región de rechazo de cola izquierda ( )0 0 1 0: :H vs Hµ µ µ µ= < , si el valor de X ( )x en una muestra

aleatoria, es menor que el valor crítico a ( )x a< , entonces la hipótesis

nula 0

H será rechazada, en caso contrario no se rechaza ta l hipótesis. Para una región de rechazo de dos colas ( )0 0 1 0: :H vs Hµ µ µ µ= ≠ , si

el valor de X ( )x es mayor que el valor crítico b o bien menor que el valor

crítico a ( )x b o x a> < , entonces la hipótesis nula 0

H deberá ser

rechazada y en caso contrario no se podrá rechazar t al hipótesis. Se puede observar que en la desición estadística intervienen los valores de los estimadores puntuales, es decir las estimaciones puntuales, por ello se escribe entre paréntesis con letras minúsculas. Recordemos lo visto desde los capítulos 2 y 3 (Distribuciones muestrales y Estimación de parámetros). Ahora ya estamos en condiciones de precisar las diferentes pruebas de hipótesis que se pueden trabajar para los principales parámetros poblacionales, comenzando con la media poblacional µ . 4.3 Prueba de hipótesis para una media Para su mejor comprensión, así como lo hicimos en los intervalos de confianza en el capítulo 3, veremos los distintos casos que se presentan para las pruebas de hipótesis para cada parámetro. Iniciamos con la media poblacional µ e iremos describiendo los cinco elementos básicos de la prueba desarrollados en los apartados anteriores. Caso 1: Si la población es normal, con varianza pobl acional 2σ conocida. Planteamiento de las hipótesis : Aquí se pueden presentar tres posibles hipótesis alternativas para la hipótesis nula, a saber

0 0:H µ µ= , contra

1 0

1 0 0

1 0

:

:

:

H

H es un valor especifico

H

µ µµ µ µµ µ

><≠

117

El nivel de significancia : α este valor se proporciona de ante mano o en su defecto se da como 0.05α = , es decir 5%α = regularmente. Recordemos que nos da la probabilidad de cometer el error tipo I, al rechazar la hipótesis nula

0H .

El estadístico de prueba : Este tercer elemento resulta fundamental en la prueba, ya que será el que nos permita tomar una desición al respecto de el rechazo ó no de la hipótesis nula

0H y para poder compararlo con el valor

crítico, debemos obtener su valor para una muestra aleatoria particular, lo que significa que el estadístico de prueba para este caso es

XZ

n

µσ−=

Por lo estudiado en las distribuciones muestrales. Ahora el valor de este estadístico de prueba , para una muestra aleatoria de tamaño n tomada de la población lo escribimos como:

0c

xz

n

µσ−=

Lo llamaremos el valor calculado del estadístico de prueba y en realidad será el que utilizaremos en la prueba de hipótesis. La región de rechazo : Para poder comparar el valor del estadístico de prueba, debemos contar con un valor crítico, el cual lo obtendremos de la tabla 2 de valores para la curva normal estándar, dependiendo del tipo de región que vayamos a considerar, es decir de la hipótesis alternativa que tengamos en el planteo de las hipótesis. De manera que si la hipótesis alternativa es

1 0:H µ µ> , la región de rechazo es

de cola derecha y buscamos el valor zα de la variable normal estándar en la tabla 2, para el cual el área bajo la curva a su derecha sea igual a α , es decir

( )P Z zαα = > y la región de rechazo esta comprendida por todos los valores de

Z que son mayores a zα y por consiguiente la región de no rechazo estará

conformada por aquellos valores de Z menores o iguales que zα , es decir

( )1 P Z zαα− = ≤ . En la figura 4 se aprecia la región de rechazo y la de no

rechazo para una prueba de hipótesis de cola derecha o extremo superior, tomando la curva normal estándar.

118

Si la hipótesis alternativa asegura que

1 0:H µ µ< , la región de rechazo será de

cola izquierda y tendremos que buscar el valor zα− de la variable normal estándar en la tabla 2, para el cual el área bajo la curva a su izquierda sea igual a α , es decir ( )P Z zαα = < − , de forma que la región de rechazo estará

comprendida por todos los valores de Z menores que el valor zα− y la región de no rechazo queda determinada por aquellos valores de Z mayores o iguales que zα− , es decir ( )1 P Z zαα− = ≥ − . En la figura 5 se observa la región

de rechazo de cola izquierda para el caso normal.

Si la hipótesis afirma que

1 0:H µ µ≠ , la región de rechazo será de dos colas o

dos extremos y se deben buscar dos valores en la tabla 2 de la variable normal estándar, a saber

2

zα− y 2

zα , de manera que el área bajo la curva a la

izquierda de 2

zα− , sumada con el área bajo la curva a la derecha de 2

zα sea

Figura 4 Región de rechazo de cola derecha

zα Región de no rechazo Región de rechazo

Figura 5 Región de rechazo de cola izquierda

Región de rechazo zα− Región de no rechazo

119

igual a α , es decir ( ) ( )2 2

P Z z P Z zα αα = < − + > , así la región de rechazo estará

comprendida por todos los valores de Z menores que 2

zα− y mayores que 2

zα .

La región de no rechazo estará formada por aquellos valores de Z mayores o iguales que

2

zα− y menores o iguales que 2

zα , como se ilustra en la figura 6 .

Desición estadística : De acuerdo al valor del estadístico de prueba y el valor encontrado de la tabla 2 para la normal estándar, se tomarán las siguientes desiciones según la región de rechazo a considerar. Para una región de rechazo de cola derecha, la hipótesis nula

0H se rechaza,

si el valor calculado del estadístico de prueba cz , es mayor que el valor zα de

la tabla 2, es decir 0

H se rechaza cuando cz zα> y no se rechaza en caso

contrario cz zα≤ . Para una región de rechazo de cola izquierda, la hipótesis nula

0H se rechaza,

si el valor calculado del estadístico de prueba cz , es menor que el valor zα− de

la tabla 2, es decir 0

H se rechaza cuando cz zα< y no se rechaza en caso

contrario cz zα≥ − . Para una región de rechazo de dos colas, la hipótesis nula

0H se rechaza, si el

valor calculado del estadístico de prueba cz , es menor que el valor 2

zα− o bien

mayor que 2

zα de la tabla 2, es decir 0

H se rechaza cuando 2

cz zα< − o bien

cuando 2

cz zα> y no se rechaza en caso contrario 2

cz zα≥ − y 2

cz zα≥ .

Figura 6 Región de rechazo de dos colas

2

zα− 2

zα Región de no rechazo Región de rechazo Región de rechazo

120

Ejemplo 1 : Una empresa que fabrica materiales para la construcción desarrollo un nuevo aditivo para cierto tipo de cemento y afirma que el coeficiente promedio a la compresión es de 1500 kg por cm3 con una desviación estándar de 120 kg por cm3. Desea probar la hipótesis

0: 5000H µ = en contra de la

alternativa 1: 5000H µ < , para ello toma una muestra aleatoria de 50 piezas de

este tipo de cemento y obtiene que 4970x = kg por cm3. Suponga que la población es normal y use un nivel de significancia del 5%. Respuesta : De acuerdo a los datos del problema, tenemos una población normal con desviación estándar 120σ = y se quiere realizar una prueba de hipótesis de cola izquierda, ya que se van a contrastar las siguientes hipótesis Planteamiento de las hipótesis.

0

1

: 5000

: 5000

H

H

µµ

=<

Nivel de significancia.

( )0.05 5%α =

Valor del estadístico de prueba.

4970 50001.768

120

50

cz−= = −

Región de rechazo. La región es de cola izquierda por lo afirma la hipótesis alternativa, de la tabla 2 se determina el valor de 1.645zα− = − con ( )0.05 5%α = y en la figura 7 se

ilustra la región de rechazo, así como la de no rechazo.

Desición estadística. Como el valor del estadístico de prueba cae dentro de la región de rechazo (figura 7 ), ya que 1.768 1.645cz zα= − < = − , la hipótesis nula debe ser rechazada de acuerdo a los datos obtenidos de la muestra. Por lo que podemos inclinarnos en aceptar la hipótesis alternativa, es decir el coeficiente promedio de compresión es menor que 5000 kg por cm3.

1.645zα− = −

1.768cz = −

Región de rechazo


Figura 7

121

Conviene aclarar que tal desición fue tomada en base a los datos de esta muestra particular y significa que para otra muestra la desición podría ser totalmente diferente, por ello en muchas ocasiones se recomienda llevar a cabo varias pruebas de hipótesis con diversas muestras aleatorias del mismo tamaño, para determinar la significatividad de tal desición. Ejemplo 2 : Los tiempos que tardan las personas en llegar a su centro de trabajo se distribuyen normalmente, con una desviación estándar de media hora. Un investigador afirma que el tiempo promedio que se tardan las personas es superior a una hora, se toma una muestra aleatoria de 25 tiempos y se obtiene que tiempo promedio es de 1.5 horas. Con un nivel de significancia del 5% ¿se puede decir que el investigador tiene razón? Respuesta : Los datos son los siguientes, población normal, con desviación conocida 0.5σ = , tamaño de muestra 25n = y 0.05α = . Planteamiento de las hipótesis.

0: 1H µ =

1: 1H µ > , hipótesis del investigador

Nivel de significancia. 0.05α = Valor del estadístico de prueba.

1.5 15

0.5

25

cz−= =

Región de rechazo. Por la hipótesis alternativa, la región de rechazo es de cola derecha y el valor crítico que la delimita es 1.645zα = de la tabla 2 para la variable normal estándar (ver figura 8 )

Desición estadística. Dado que el valor del estadístico de prueba cae dentro de la región de rechazo (ver figura 8 ), ya que 5 1.645cz zα= > = , la hipótesis se rechaza. Por lo tanto, el investigador tiene razón de acuerdo al los datos de la muestra.

1.645zα =

Región de rechazo

5cz =


122

Caso 2: Si la población no normal, con varianza pobl acional 2σ desconocida y muestra grande. En este caso lo único que cambia es el valor del estadístico de prueba, ya que los demás elementos de la prueba son los mismos que el caso 1. Por lo solo escribimos de forma simbólica los elementos. Planteamiento de las hipótesis.


1 0

1 0 0

1 0

:

:

:

H


H

µ µµ µ µµ µ

><≠

Nivel de significancia. ( )P Error tipo Iα =

Valor del estadístico de prueba. 0

c

xz

s

n

µ−=

Región de rechazo. De cola derecha, cuando

1 0:H µ µ>

De cola izquierda, cuando 1 0:H µ µ<

De dos colas, cuando 1 0:H µ µ≠

Desición estadística.

0H , se rechaza, si cz zα> (Región de rechazo de cola derecha)

0H , se rechaza, si cz zα< − (Región de rechazo de cola izquierda)

0H , se rechaza, si

2 2c cz z o z zα α< − > (Región de rechazo de dos colas)

Ejemplo 3 : En estudios realizados sobre la dureza a un determinado metal, se observo que en una muestra aleatoria de 100n = piezas de este tipo de metal, se tenía una dureza promedio de 15.5 kg, con una desviación estándar de 5 kg. El fabricante asegura que la dureza promedio de sus piezas que produce es superior a 15 kg, pruebe la hipótesis anterior con un nivel de significancia del 1% Respuesta : La población no es normal, pero la muestra es grande, luego estamos en el caso 2. Planteamiento de las hipótesis.

0: 15H µ =

1: 15H µ >


15.5 151

5100

cz−= =

123

Región de rechazo. Es de cola derecha por la hipótesis alternativa, de la tabla 2 para la variable normal, con 0.01α = , se tiene que 2.326zα = (ver la figura 9 )

Desición estadística. Como el valor del estadístico de prueba no cae en la región de rechazo (ver figura 9 ), ya que 1 2.326cz zα= < = , la hipótesis nula no se puede rechazar con la información de esta muestra aleatoria. Por lo que el fabricante no tiene razón. Caso 3: Si la población es normal, con varianza pobl acional 2σ desconocida y muestra pequeña.

Para este caso el estadístico de prueba es X

TS

n

µ−= , el cual tiene una

distribución t de Student con 1n − grados de libertad, lo que significa que debemos trabajar con la distribución t de Student (tabla 3 ) y no con la curva normal estándar. Los elementos de la prueba cambian en el valor del estadístico de prueba y la región de rechazo. Planteamiento de las hipótesis .


1 0

1 0 0

1 0

:

:

:

H


H

µ µµ µ µµ µ

><≠



0c

xt

s

n

µ−=

2.326zα =

Región de rechazo

1cz =



124

Región de rechazo (RR).

Donde

2 2

, ,t t t y tα αα α− − se obtienen de la distribución t de Student (tabla 3) con

1n − grados de libertad. Desición estadística. Dependiendo del tipo de región de rechazo, se tiene la siguiente desición. La hipótesis nula

0H se rechaza, si ct tα> (RR de cola derecha).

La hipótesis nula 0

H se rechaza, si ct tα< − (RR de cola izquierda).

La hipótesis nula 0

H se rechaza, si 2

ct tα< − o 2

ct tα> (RR de dos colas).

Ejemplo 4 : De una población normal se extrae una muestra de tamaño 9n = y se obtiene, 7.3x = con 2 2s = . Pruebe la hipótesis nula de que la media poblacional es igual a 7, en contra de la hipótesis alternativa de que µ es diferente de 7. Utilice un nivel de significancia de 10%α = Respuesta : Nos encontramos en el caso 3, con 9n = , 7.3x = , 2 2s = y

0.10α = Planteamiento de las hipótesis.

0

1

: 7

: 7

H

H

µµ

=≠


7.3 70.64

2

9

ct−= =

Región de rechazo. Es de dos colas por la hipótesis alternativa, de modo que de la tabla 3, con

1 8n − = grados de libertad, se tienen los valores críticos 2

1.860tα− = − y

2

1.860tα = como se ilustra en la figura 10 .

de cola derecha de cola izquierda de dos colas

α α 2α

2α

tα tα− 2

tα− 2

tα RR RR RR RR

125

Desición estadística. Como se puede observar en la figura 10, el valor del estadístico de prueba no cae en la región de rechazo (RR), ya que

2 2

1.860 0.64 1.860ct t tα α− = − < = < = .

Por lo tanto, la hipótesis nula 0: 7H µ = no se rechaza con los datos recabados

de la muestra, al nivel de significancia del 10%α = 4.4 Prueba de hipótesis para una diferencia de medi as Ahora se desarrollan los elementos básicos de una prueba de hipótesis para una diferencia de medias poblacionales, en muchas ocasiones se puede estar interesado, como ya se dijo antes, en comparar por ejemplo la efectividad de dos medicamentos A y B para combatir una determinada enfermedad y un investigador puede decidir cual es mejor que otro, mediante una prueba que involucre las medias o promedios, a través de la diferencia. De manera análoga como se realizo en los intervalos de confianza, veremos los cinco casos posibles que se pueden presentar, según las poblaciones y las muestras correspondientes. Caso 1: Poblaciones normales con varianzas 2

1σ y 2

2σ conocidas.

Planteamiento de las hipótesis.

0 1 2 0:H µ µ µ− = , contra

1 1 2 0

1 1 2 0 0

1 1 2 0

:

:

:

H


H

µ µ µµ µ µ µµ µ µ

− >− <− ≠


2

1.860tα− = − 2

1.860tα =

RR RR


0.64ct =

20.05α =

20.05α =

126


( )1 2 0

2 2

1 2

1 2

c

x xz

n n

µσ σ− −

=+

Región de rechazo. Según la hipótesis alternativa. De cola derecha, cuando

1 1 2 0:H µ µ µ− >

De cola izquierda, cuando 1 1 2 0:H µ µ µ− <

De dos colas, cuando 1 1 2 0:H µ µ µ− ≠




0H , se rechaza, si


Ejemplo 5 : Una muestra aleatoria de tamaño

125n = extraída de una población

normal con desviación estándar 1

5.2σ = , tiene una media muestral 1

81x = , una

segunda muestra aleatoria de tamaño 2

36n = , sacada de una población

diferente normal, con desviación estándar 2

3.4σ = , tiene una media muestral

176x = . Probar la hipótesis de que

1 2µ µ= , contra la alternativa

1 2µ µ≠ , con un

nivel de significancia del 6%. Respuesta : Las poblaciones son normales y dado que sus desviaciones estándar son conocidas, sus varianzas también lo son, por lo estamos en el caso 1 de una prueba de hipótesis para una diferencia de medias. Planteamiento de las hipótesis.

( )0 1 2 1 2: 0H µ µ µ µ− = =

( )1 1 2 1 2: 0H µ µ µ µ− ≠ ≠


( )( ) ( )2 2

81 76 04.22

5.2 3.4

25 36

cz− −

= =

+

127

Región de rechazo. Por la hipótesis alternativa, la región es de dos colas y en la figura 11 se aprecian los valores críticos de la variable normal estándar, que limitan esta región. Dichos valores se obtienen de la tabla 2, para porcentajes, tomando el 94% se determina que

2

1.881zα− = − y 2

1.881zα = .

Desición estadística. Como el valor del estadístico de prueba cae dentro de la región de rechazo , ya que

2

4.22 1.881cz zα= > = (ver figura 11 ), la hipótesis nula 0

H debe ser

rechazada. Por lo que, las medias de las poblaciones no son iguales, como resultado de la información recopilada a partir de estas muestras aleatorias. Caso 2: Poblaciones no normales con varianzas 2

1σ y 2

2σ desconocidas,

pero muestras grandes (e independientes). Planteamiento de las hipótesis.

0 1 2 0:H µ µ µ− = , contra

1 1 2 0

1 1 2 0 0

1 1 2 0

:

:

:

H


H


− >− <− ≠



( )1 2 0

2 2

1 2

1 2

c

x xz

s s

n n

µ− −=

+

2

1.881zα− = − 2

1.881zα =

RR RR


4.22cz =

20.03α =

20.03α = 1 0.94α− =

128


1 1 2 0:H µ µ µ− >






0H , se rechaza, si


Ejemplo 6 : Un fabricante afirma que el coeficiente promedio a la tensión de una fibra “A” excede al coeficiente promedio a la tensión de la fibra “B” en al menos 12 kilogramos. Para probar su afirmación se prueban 50 piezas de cada tipo de fibra bajo condiciones similares. La fibra tipo “A” dio un coeficiente promedio a la tensión de 86.7kg con una desviación estándar de 6.8 kg, mientras que la fibra “B” tuvo una resistencia promedio a la tensión de 77. 8 kg con una desviación estándar 5.61 kg. ¿El fabricante tiene razón en su afirmación, con un nivel de significancia del 5%? Respuesta : Dado que las muestras son suficientemente grandes, las poblaciones no se nos dice que sean normales y las variancias de estas se desconocen. Nos encontramos en el caso 2, para una prueba de hipótesis de una diferencia de medias. Planteamiento de las hipótesis. Si consideramos que

1µ es el coeficiente promedio a la tensión de la fibra “A” y

2µ es el coeficiente promedio a la tensión de la fibra “B”, tenemos que “al menos” significa mayor o igual que, por lo que la hipótesis nula es aquella que involucra al mayor o igual que y la alternativa al menor que.

( )0 1 2 1 2: 12 12H µ µ µ µ− ≥ ≥ + , hipótesis del fabricante.

( )1 1 2 1 2: 12 12H µ µ µ µ− < < +

Nivel de significancia. 0.05α =

129

Valor del estadístico de prueba. Dado que

1 2

1 2

1 2

50 50

86.7 77.8

6.8 5.61

A B

n n

x x

s s

= == == =

( )

( ) ( )2 2

86.7 77.8 122.49

6.8 5.61

50 50

cz− −

= = −

+

Región de rechazo. La región es de cola izquierda, como muestra en la figura 12 y el valor crítico

1.645zα− = − , lo sacamos de la tabla 2 de porcentajes, para la variable normal estándar.

Desición estadística. Como el valor del estadístico de prueba 2.49cz = − cae en la región de

rechazo , ya que 2.49 1.645cz zα= − < − = − , la hipótesis nula 0

H se rechaza, luego entonces el fabricante no tiene razón al hacer su afirmación de acuerdo con los datos recabados en las muestras, es decir el coeficiente promedio a la tensión de la fibra “A”, no excede, en al menos 12 kg al coeficiente promedio a la tensión de la fibra “B”.

1.645zα− = −

2.49cz = −

Región de rechazo



130

Caso 3: Poblaciones normales con varianzas desconoci das pero iguales ( 2 2

1 2σ σ= ) y muestras pequeñas e independientes.


0 1 2 0:H µ µ µ− = , contra

1 1 2 0

1 1 2 0 0

1 1 2 0

:

:

:

H


H


− >− <− ≠



( )1 2 0

1 2

1 1c

p

x xt

sn n

µ− −=

+

con ( ) ( )2 2

1 1 2 2

1 2

1 1

2p

n s n ss

n n

− + −=

+ −


1 1 2 0:H µ µ µ− >




0H , se rechaza, si ct tα> (Región de rechazo de cola derecha)

0H , se rechaza, si ct tα< − (Región de rechazo de cola izquierda)

0H , se rechaza, si

2 2c ct t o t tα α< − > (Región de rechazo de dos colas)

Donde tα , tα− , 2

tα− y 2

tα son valores de la variable T de Student con 1 2

2n n+ −

grados de libertad.


α α 2α

2α

tα tα− 2

tα− 2

tα RR RR RR RR

131

Ejemplo 7 : Se pretende averiguar cual de dos medicamentos es mejor para reducir la presión arterial, para ello se seleccionan 25 pacientes a los cuales se les suministra el medicamento I y se obtienen los siguientes resultados

1117x = ,

15s = . A otros 5 pacientes se les administra el medicamento II y se

obtiene 2

122x = , 2

10s = . Si suponemos que las poblaciones son normales, con

varianzas desconocidas pero iguales ( )2 2

1 2σ σ= y que las muestras son

independientes. Con un nivel de significancia del 10%, pruebe la hipótesis de que el medicamento I es mejor que el medicamento II. Respuesta : Consideremos que

1µ y

2µ es la presión arterial media producida

por los medicamentos I y II respectivamente, que el medicamento I sea mejor que el medicamento II, significa que

1 2µ µ< . Por lo que.


0 1 2: 0H µ µ− = Los dos medicamentos tienen la misma efectividad.

1 1 2: 0H µ µ− < El medicamento I es mejor que el II.


( )0.10 10%α =


Como 1 2

1 2

1 2

25 5

117 122

5 10

I II

n n

x x

s s

= == == =

, entonces ( )117 122 0

1.711 1

5.9825 5

ct− −

= = −+

ya que , ( ) ( )2 225 1 5 5 1 10

5.9825 5 2

ps− + −

= =+ −

Región de rechazo. La región de rechazo es de cola izquierda como aparece en la figura 13 , debido a la hipótesis alterna. El valor 1.3125tα− = − se obtiene de la tabla 3, con

1 22 28n n+ − = grados de libertad y un 0.10α = .

1.3125tα− = −

1.71ct = −

Región de rechazo



132

Desición estadística. Dado que el valor del estadístico de prueba cae dentro de la región de rechazo , ya que 1.71 1.3125ct tα= − < − = − , se rechaza la hipótesis nula

0H .

Por lo tanto, el fabricante no tiene razón en su afirmación de acuerdo a los datos que proporcionan las muestras aleatorias. Caso 4: Poblaciones normales, con varianzas desconoc idas diferentes ( 2 2

1 2σ σ≠ ) y muestras pequeñas e independientes.


0 1 2 0:H µ µ µ− = , contra

1 1 2 0

1 1 2 0 0

1 1 2 0

:

:

:

H


H


− >− <− ≠



( )1 2 0

2 2

1 2

1 2

c

x xt

s s

n n

µ− −=

+


1 1 2 0:H µ µ µ− >




α α 2α

2α

tα tα− 2

tα− 2

tα RR RR RR RR

133




0H , se rechaza, si

2 2c ct t o t tα α< − > (Región de rechazo de dos colas)


tα− y 2

tα son valores de la variable T de Student, con ν

grados de libertad que se obtienen de la tabla 3, tal que ν esta dado por 2

2 2

1 2

1 2

2 22 2

1 2

1 2

1 21 1

s s

n n

s s

n n

n n

ν

+

= +

− −

Ejemplo 8 : Una gran fábrica de automóviles está tratando de decidir si compra llantas “A” o “B” para sus nuevos modelos. Para ayudar a tomar la desición se lleva a cabo un experimento en el cual se utilizan 12 llantas de cada marca los resultados fueron:

1 2

1 1

" " " "

37900 39800

5100 5900

Marca A Marca B

x km x km

s km s km

= == =

Probar la hipótesis, con un nivel de significancia de 5% de que no hay diferencia entre los dos tipos de llantas. Suponga que las poblaciones son normales y que las muestras son independientes. Respuesta : Nos encontramos en el caso 4, ya que las poblaciones son normales, sus varianzas son desconocidas y como no se dice nada de ellas se supone que son diferentes, además de que las muestras son pequeñas e independientes. Planteamiento de las hipótesis. Dado que se afirma que no hay diferencia entre los dos tipos de llantas, significa que las medias poblacionales son iguales, en contra de que son diferentes. Lo anterior traducido en las hipótesis queda de la siguiente manera.

0: 0B AH µ µ− =

1: 0B AH µ µ− ≠


( )( ) ( )2 2

39800 37900 00.844

5900 5100

12 12

ct− −

= =

+

134

Región de rechazo. La región de rechazo es de dos colas y los valores críticos de la tabla 3 para la T de Student son

2

2.074tα− = − y 2

2.074tα = con 22ν = grados de libertad,

como se muestra en la figura 14 , donde

( ) ( )

( ) ( )

22 2

2 22 2

5900 5100

12 1221.55 22

5900 5100

12 12

12 1 12 1

ν

+

= = ≈ +

− −

Desición estadística. El valor del estadístico de prueba no cae en la región de rechazo , como se puede observar en la figura 14 , dado que

2 2

2.074 0.844 2.074ct t tα α− = − < = < =

Luego la hipótesis nula 0H no se rechaza y en consecuencia no hay diferencia significativa en cuanto a los dos tipos de llantas que usará en sus nuevos modelos, de acuerdo con la información obtenida en las muestras.

2

2.074tα− = − 2

2.074tα =

RR RR


0.844ct =

20.025α =

20.025α = 1 0.95α− =

135

Caso 5: Poblaciones normales y muestras pequeñas de pendientes (muestras apareadas). Planteamiento de las hipótesis.

0 0: dH µ µ= , contra 1 0

1 0 0

1 0

:

:

:

d

d

d

H


H

µ µµ µ µµ µ

><≠

Donde dµ es la media de las diferencias poblacionales Nivel de significancia. ( )P Error tipo Iα =


0dc

d

xt

s

n

µ−=

Con dx y ds los valores de la media y la desviación estándar de las diferencias

muestrales id , respectivamente. Además de que 1 2n n n= = . Región de rechazo. Según la hipótesis alternativa. De cola derecha, cuando 1 0: dH µ µ>

De cola izquierda, cuando 1 0: dH µ µ<

De dos colas, cuando 1 0: dH µ µ≠




0H , se rechaza, si 2 2

c ct t o t tα α< − > (Región de rechazo de dos colas)


tα− y 2

tα son valores de la variable T de Student con 1n −

grados de libertad.


α α 2α

2α

tα tα− 2

tα− 2

tα RR RR RR RR

136

Ejemplo 9 : En un estudio se registraron los siguientes datos acerca de la concentración de residuos de acido sórbico en jamón, en partes por millón, inmediatamente después de introducir el jamón por un instante en una solución sórbica y después de 60 días de almacenamiento. Antes 224 270 400 444 590 660 1400 680 Después 116 96 236 329 437 597 689 576 Diferencia 108 174 164 115 153 63 711 104 Si suponemos que las poblaciones son normales, ¿hay evidencias suficientes con un nivel de significancia del 5%, para decir que el periodo de almacenamiento reduce las concentraciones residuales de acido sórbico? Respuesta : Aquí las muestras la consideramos dependientes, ya que el jamón es el mismo antes y después del almacenamiento, por lo que estamos en el caso 5. El valor de la media y la desviación estándar de las diferencias son 199dx = y

210.09ds = , respectivamente. Como se ilustro en los intervalos de confianza para muestras dependientes del capítulo 3. Planteamiento de las hipótesis.

0 1 2: 0dH µ µ µ= − = El almacenamiento no reduce la concentración de acido.

1 1 2: 0dH µ µ µ= − > El almacenamiento si reduce la concentración de acido. Nivel de significancia. 0.05α = Valor del estadístico de prueba.

199 02.68

210.09

8

ct−= =

Región de rechazo. Es de cola derecha, ya que la hipótesis alterna afirma que 0dµ > y el valor

crítico de la tabla 3 es 1.895tα = con 1 7n − = grados de libertad (figura 15 ).

1.895tα =

Región de rechazo

2.68ct =



137

Desición estadística. Como el valor del estadístico de prueba si cae en la región de rechazo , ya que 2.68 1.895ct tα= > = , véase la figura 14 , la hipótesis nula 0H se rechaza. Por lo que si existen evidencias suficientes de que el periodo de almacenamiento reduce la concentración de acido sórbico en el jamón. 4.5 Prueba de hipótesis para una proporción Otro parámetro muy utilizado en la estadística es la proporción p y al igual que la media y diferencia de medias podemos hablar de su prueba de hipótesis. Si la muestra es suficientemente grande, se trabaja con la variable normal estándar , en virtud el teorema central del limite (TLC), mientras que para muestras pequeñas se usaría la variable binomial . Como se presenta en los siguientes casos. Caso 1: Muestras pequeñas Planteamiento de las hipótesis.

0 0:H p p= , contra 1 0

1 0 0

1 0

:

: ,

:

H p p

H p p p es un valor especifico

H p p

><≠


Valor del estadístico de prueba. Esta dado por ( )0b P X x cuando p p= ≥ = , donde x es el número de éxitos en

la muestra aleatoria de tamaño n , si las alternativas son ( )0 0p p o p p> < .

Cuando la alternativa sea 0p p≠ , el valor del estadístico de prueba es

( )( )

0 0

0 0

b P X x cuando p p si x np

b P X x cuando p p si x np

= ≤ = <

= ≥ = >

Región de rechazo. Cuando se tienen alguna de las alternativas ( )0 0 0p p o p p o p p> < ≠ , la

región de rechazo esta formada por aquellos valores menores o iguales que α . Desición estadística.

138

Si el valor b es menor o igual que α , la hipótesis nula 0 0:H p p= se rechaza. Ejemplo 10 : Un Urbanista asegura que el 70% de los hogares en una localidad tienen sistema de aire acondicionado, ¿se puede estar de acuerdo con dicha hipótesis, si en una muestra aleatoria de casas en esta ciudad, 6 de 9 tienen aire acondicionado? considere que el nivel de significancia es del 10% Respuesta: Planteamiento de las hipótesis.

0

1

: 0.70

: 0.70

H p

H p

=≠

Nivel de significancia. 0.10α = Valor del estadístico de prueba. Como 0 0.70p = y 9n = , 06 6.3x np= < = El valor del estadístico de prueba es

( )

( )

0

6

0

2 6 0.70

2 ,9,0.7 2(0.5372) 1.0744

x

b P X cuando p

b B x

=

= ≤ =

= = =∑

Región de rechazo. Esta formada por aquellos valores de b menores o iguales que 0.10α = Desición estadística. Como 1.0744b = no es menor o igual que 0.10α = , la hipótesis nula 0H no se rechaza, ello significa que el Urbanista tiene razón de acuerdo con la muestra aleatoria. Caso 2: Muestras grandes ( )( )0 030 1 5n o bien np y n p≥ − ≥


0 0:H p p= , contra 1 0

1 0 0

1 0

:

: ,

:

H p p

H p p p es un valor especifico

H p p

><≠



( )0

0 0

ˆ

1c

p pz

p p

n

−=−

donde p es el valor de la proporción muestral Región de rechazo. De cola derecha, si la alternativa es 1 0:H p p>

De cola izquierda, si la alternativa es 1 0:H p p<

139

De dos colas, si la alternativa es 1 0:H p p≠ Desición estadística.




c cz z o z zα α< − > (Región de rechazo de dos colas)

Ejemplo 11 : Se cree que al menos el 60% de los residentes de cierta área están en contra de un nuevo impuesto. ¿Qué se puede concluir si de 250 habitantes de esa zona 140 no están de acuerdo con el nuevo impuesto? utilizar un nivel de significancia del 8% Respuesta : Dado que la muestra es grande, estamos en el caso 2 para una proporción. Planteamiento de las hipótesis.

0 : 0.60H p ≥ , al menos el 60% de los residentes están en contra

1 : 0.60H p < , menos del 60 % de los residentes están en contra Nivel de significancia. 0.08α = Valor del estadístico de prueba.

( )

1500.60

250 1.2910.60 0.40

250

cz

−= = −

Región de rechazo. Por la hipótesis alternativa, la región es de cola izquierda como se aprecia en la figura 15 . El valor crítico se obtiene de la tabla 2 de los porcentajes para la variable normal estándar y es 1.751zα = − con 0.08α = ( )1 0.92α− = .


α α 2α

2α

zα zα− 2

zα− 2

zα RR RR RR RR

1.751zα− = −

1.291cz = −

Región de rechazo



140

Desición estadística. Dado que el valor del estadístico de prueba 1.291cz = − no cae en la región de

rechazo , ya que 1.291 1.751cz zα= − > − = − como se ve en la figura 15 , se

concluye que la hipótesis nula 0H no se rechaza y por tanto la creencia de que al menos el 60% de los residentes en esa área están en contra del nuevo impuesto, es aceptable, con un nivel de significancia del 8% 4.6 Prueba de hipótesis para una diferencia de prop orciones Aquí se supondrá que las muestras son suficientemente grandes y tenemos dos casos, que son: Caso 1: Muestras grandes, con ( )1 2 0 0p p o bien p= =


0 1 2 0:H p p p− = , contra 1 1 2 0

1 1 2 0 0

1 1 2 0

:

: ; 0

:

H p p p

H p p p p

H p p p

− >− < =− ≠



( )

1 2

1 2

ˆ ˆ

1 1ˆ ˆ1

c

p pz

p pn n

−=

− +

Donde 1 2

1 2

ˆx x

pn n

+=+

es el valor de la proporción agrupada para las muestras

aleatorias de tamaños 1n y 2n , respectivamente. 1x y 2x son el número de éxitos en las muestras respectivas. Región de rechazo. De cola derecha, si la alternativa es 1 1 2 0:H p p p− >

De cola izquierda, si la alternativa es 1 1 2 0:H p p p− <

De dos colas, si la alternativa es 1 1 2 0:H p p p− ≠ Desición estadística.





141

Ejemplo 12 : Una empresa fabricante de cigarros elabora dos marcas de este producto. Encuentra que 56 de 200 fumadores prefieren la marca “A” y 29 de 150 prefieren la marca “B”, ¿se puede concluir, con un nivel de significancia del 6%, que la marca “A” se prefiere más que la marca “B”? Respuesta : Los datos del problema permiten garantizar que las muestras son suficientemente grandes, además que estamos en el caso 1 para una diferencia de proporciones.

1 2

1 2

1 1

200 150

56 29

56 29ˆ ˆ0.28 0.19

200 150

Muestra A Muestra B

n n

x x

p p

= == =

= = = =

La proporción agrupada es 56 29 85

ˆ 0.24200 150 350

p+= = =+


0 1 2: 0A BH P P o bien P P= − = (No hay preferencia por alguna de las marcas)

0 1 2: 0A BH P P o bien P P> − > (La marca A es más preferida que la marca B) Nivel de significancia. 0.06α = Valor del estadístico de prueba.

( )

0.28 0.191.95

1 10.24 0.76

200 150

cz−= = +

Región de rechazo. La región de rechazo es de cola derecha, por la hipótesis alternativa, el valor crítico de la tabla 2 de porcentajes es 1.555zα = para 0.06α = , como se ilustra en la figura 16 .

1.555zα =

Región de rechazo

1.95cz =



142

Desición estadística. Como el valor del estadístico de prueba cae en la región de rechazo (véase figura 16 ), es decir 1.95 1.555cz zα= > = , la hipótesis nula se rechaza. Por lo que si se puede asegurar que la marca “A” es preferida sobre la marca “B”. Caso 2: Muestras grandes, con ( )1 2 0 0p p o bien p≠ ≠


0 1 2 0:H p p p− = , contra 1 1 2 0

1 1 2 0 0

1 1 2 0

:

: ; 0

:

H p p p

H p p p p

H p p p

− >− < ≠− ≠



( )1 2 0

1 1 2 2

1 2

ˆ ˆ

ˆ ˆ ˆ ˆc

p p pz

p q p q

n n

− −=

+

Donde 1 21 2

1 2

ˆ ˆx x

p y pn n

= = son los valores de las proporciones para las

muestras aleatorias de tamaños 1n y 2n , respectivamente, tomadas de su

respectiva población. Además de que 1 1 2 2ˆ ˆ ˆ ˆ1 1q p y q p= − = − .

Región de rechazo. De cola derecha, si la alternativa es 1 1 2 0:H p p p− >

De cola izquierda, si la alternativa es 1 1 2 0:H p p p− <

De dos colas, si la alternativa es 1 1 2 0:H p p p− ≠ Desición estadística.





Ejemplo 13 : Una clínica especialista en nutrición asegura que el porcentaje de hombres que padece obesidad, es superior en más de un 15% sobre la proporción de mujeres con este problema. De una muestra aleatoria de 100 hombres 45 tienen problemas de obesidad, mientras que de una muestra aleatoria de 120 mujeres 35 son obesas. ¿Se puede concluir que la clínica tiene razón, con una significancia del 10%? Respuesta : Si 1p y 2p es la proporción de hombres y de mujeres con problemas de obesidad, respectivamente, entonces tenemos que

143


0 1 2: 0.15H p p− = La diferencia de proporciones es menor o igual al 15%

1 1 2: 0.15H p p− > La diferencia de proporciones es superior al 15% Nivel de significancia. 0.10α = Valor del estadístico de prueba.

1 2

1 2

1 1

100 120

45 35

45 35ˆ ˆ0.450 0.292

100 120

Hombres Mujeres

n n

x x

p p

= == =

= = = =

( )

( ) ( )0.45 0.292 0.15

0.1230.45 0.55 0.292 0.708

100 120

cz− −

= =

+

Región de rechazo. Es de cola derecha y el valor crítico es 1.282zα = para 0.10α = de la tabla 2 de porcentajes para variable normal estándar, como se muestra en la figura 17 .

Desición estadística. Dado que el valor del estadístico de prueba no cae en la región de rechazo , ya que 0.123 1.282cz zα= < = como se puede ver en la figura 17. La hipótesis

nula 0H no se rechaza, es decir la clínica no tiene razón en su afirmación de acuerdo con los datos recibidos en las muestras.

1.282zα =

Región de rechazo

0.123cz =



144

4.7 Potencia de una prueba y el tamaño de la muestr a Al estudiar los principales elementos de una prueba de hipótesis, se dijo que existen dos tipos de errores cuando se toma una desición al respecto de la hipótesis nula 0H , fueron llamados error tipo I y error tipo II . El error tipo I, se presenta al tomar la desición d e rechazar la hipótesis nula 0H cuando en realidad es correcta o verdadera.

El error tipo II, se da al no rechazar la hipótesis nula 0H cuando en realidad es incorrecta o falsa. La probabilidad de cometer el error tipo I la simbolizamos con la letra griega α , es decir ( )P Cometer el error tipo Iα = y con la letra β a la probabilidad de

cometer el error tipo II, así que ( )P Cometer el error tipo IIβ = y La potencia de

una prueba se define como 1 β− . En general es imposible calcular el valor de β , a menos que en la hipótesis alternativa 1H , se de un valor especifico o concreto para el parámetro que se este considerando. El valor de α por lo regular se conoce o se propone, ya que como se dijo con anterioridad, quien va efectuar la prueba desea preferentemente rechazar 0H . En esta sección veremos como se puede obtener el valor de β , bajo ciertas restricciones y su relación que guarda con el tamaño de la muestra n , para pruebas de hipótesis de una media µ , una diferencia de medias 1 2µ µ− y una proporción p . Todo bajo la condición de que la población sea normal con

varianza 2σ conocida , o bien que las muestras sean grandes . Para facilitar el estudio, supondremos que se tiene una prueba de hipótesis para una media poblacional µ y que la región de rechazo es de cola derecha (de forma análoga se realiza si la región es de cola izquierda o de dos colas con ligeras modificaciones). Prueba de hipótesis para una media, población norma l y 2σ conocida. Se toma una muestra aleatoria de tamaño n de la población, se desea probar la hipótesis nula 0 0:H µ µ= contra la alternativa 1 0:H µ µ> y se tiene un valor

específico 1µ , tal que 1µ µ= , es decir 1 1:H µ µ= .

0 0:H µ µ=

( )1 1 1 0:H µ µ µ µ= >

El nivel de significancia establece que ( )P Cometer el error tipo Iα =

( )0 , P Se rechaza H cuando es correctaα =

Para rechazar la hipótesis nula 0H , se tiene que cumplir, que el valor de la

media muestral X debe ser mayor que el valor crítico b , lo que en forma simbólica se escribe como

145

[ ]( )0 0

0

0 0

,

,

P X b cuando H es correcta

X bP cuando

n n

b bP Z entonces z

n n

α

α µ µ

µ µα µ µσ σ

µ µα σ σ

= > =

− −= > =

− −= > =

En la figura 18 , se puede observar lo que representa 0b

n

µσ−

y por que es igual

a zα

De manera similar la probabilidad de cometer el error tipo II, es decir β se interpreta como:

( )( )( )

0

1 1

1

,

, :

,

P Cometer el error tipo II

P No se rechaza H cuando es incorrecta

P X b cuando H es correcta

X bP cuando

n n

ββ

β µ µ

µ µβ µ µσ σ

=

=

= ≤ =

− −= ≤ =

zα

( )P Z zαα = >

Región de rechazo


Figura 18 Interpretación del valor crítico

0bz

n

αµ

σ− =

0

146

1 1b bP Z entonces z

n n

βµ µβ σ σ

− −= ≤ = −

En la figura 19 , se ilustra la interpretación de 0b

n

µσ−

y por que es igual a zβ− .

Ahora si lo vemos desde la perspectiva de las hipótesis nula 0H y alternativa

1H , el valor crítico b nos indica a partir de que valores para la media muestral

X se tendrá que rechazar la hipótesis 0H y a partir de cuales no se rechazará. En la figura 20 se ilustra tal situación.

Figura 20 Región de rechazo de extremo superior o de cola dere cha en una prueba

de hipótesis para una media µ

zβ−

( )P Z zββ = ≤ −

Región de rechazo


Figura 19

Interpretación de 1bz

n

βµ

σ− = −

0

b

Región de rechazo

Si X b> , 0H se rechaza Si X b≤ , 0H no se rechaza


Valor crítico

147

Dado que estamos en el caso normal, es decir la población es normal, la variable X también es normal y en la figura 21 , se aprecian tanto α y β , como áreas bajo las curvas normales con medias 0µ y 1µ , respectivamente, con el valor crítico b . Nos podemos dar cuenta, que a si disminuimos el valor de α , entonces aumentamos el valor de β , lo que se desearía es que ambos valores fueran lo más pequeños posible. Sin embargo no podemos disminuir uno de ellos, en virtud de entonces el otro aumenta. La forma de reducir los dos valores de α y β , es aumentando el tamaño de la muestra como lo veremos un poco más adelante.

Determinación del tamaño de la muestra. De acuerdo con lo señalado en las figuras 18 y 19 , donde se asegura que para α , β y el valor crítico b . Se tiene lo siguiente:

0bz

n

αµ

σ− = y 1b

z

n

βµ

σ− = − , respectivamente. Al despejar a b se llega que

0 1b z y b zn n

α βσ σµ µ= + = −

Igualando estas ecuaciones.

0 1z zn n

α βσ σµ µ+ = −

1 0( )z zn

α βσ µ µ+ = −

0µ 1µ

α β

b

Figura 21 Prueba de hipótesis de cola derecha con

0 0:H µ µ= y 1 1 1 0:H dondeµ µ µ µ= > b es el valor crítico que delimita la región de rech azo y no rechazo

148

( )1 0

z zn

α β σµ µ

+=

−, elevando al cuadrado

( ) 2

1 0

z zn

α β σµ µ

+=

−

Por lo que la expresión que determina el tamaño de la muestra, en una prueba de hipótesis de cola derecha, está dada por

( ) 2

1 0

z zn

α β σµ µ

+=

−

Dicha fórmula es la misma para el caso de que la prueba de hipótesis sea de cola izquierda. Para el caso de una prueba de hipótesis para µ de dos colas, la expresión es

( )2

2

1 0

z z

nα β σ

µ µ

+ = −

En una prueba de hipótesis para una diferencia de medias A Bµ µ− de una cola (derecha o izquierda), bajo el supuesto de que las poblaciones sean normales, las varianzas 2

1σ y 2

2σ conocidas y los tamaños de las muestras iguales

( 1 2n n n= = ) se tiene que:

( ) ( )( )

22 2

1 2

2

1 0

z zn

α β σ σ

µ µ

+ +=

−

Donde 1µ es un valor especifico que se da en la hipótesis alternativa. Vale la pena mencionar, que cuando la población o poblaciones no son normales o de naturaleza desconocida y la varianza o varianzas no se conocen se pueden usar la fórmulas anteriores, reemplazando a σ por s en el caso de una media, 2

1σ y 2

2σ por 2

1s y 2

2s , respectivamente, en el caso de una diferencia de medias. Siempre que la o las muestras son suficientemente grandes .

149

Ejemplo 14 : En una prueba de hipótesis para µ , se afirma que 0 : 10H µ = ,

contra 1 : 8.5H µ = , es decir se trata de una prueba de cola izquierda. Se supone que la población es normal con una desviación estándar 3σ = y se toma una muestra aleatoria de tamaño 36n = , con un nivel de significancia del 5%, encuentre la probabilidad de cometer el error tipo II ( β ) y determine la potencia de la prueba. Respuesta : Tenemos los siguientes datos.

0

1

: 10

: 8.5

3

36

0.05

H

H

n

µµ

σ

α

==

==

=

Para obtener la probabilidad de cometer el error tipo II, se requiere de calcular el valor crítico a , tal que ( ), 8.5P X a cuandoβ µ= ≥ = , de modo que primero

interpretamos la probabilidad de cometer el error tipo I, es decir α como se trata de una región de rechazo de cola izquierda .

( )

( )

, 10

101.645 0.05

3

36

P X a cuando

aP Z P Z zα

α µ

α

= < =

−= < = < − = − =

Luego igualamos 10

1.6453

36

a − = − y despejamos " "a para tener que

310 1.645 9.1775

6a

= − =

Ahora ya podemos obtener el valor de β , utilizando el valor crítico 9.1775a = de modo que

( )

( )

1

1

, 8.5

, 8.5

9.1775 8.51.36 ( 1.36) 0.0869

3

36

P X a cuando es correcta

aP Z cuando es correcta

n

P Z P Z

β µ

µβ µσ

β

= ≥ =

−= ≥ =

−= ≥ = ≥ = Φ − =

La potencia de la prueba es 1 0.9131β− = , es decir de un 91.31%

150

Ejemplo 15 : Al realizar una prueba de hipótesis para la media poblacional, se determina que el valor crítico es 12.5b = , para rechazar ó no la hipótesis nula

0 : 12H µ = en contra de la alterna 1 : 13.5H µ = . Se supone que la población es normal con 1.5σ = y el tamaño de una muestra aleatoria es de 25n = . Obtenga α , β y la potencia de la prueba. Respuesta : En esta prueba de hipótesis tenemos una región de rechazo de cola derecha , por lo que si 12.5X b> = , la hipótesis nula 0 : 12H µ = se

rechaza, cuando es correcta y en caso contrario, es decir si 12.5X b≤ = , la hipótesis nula 0 : 12H µ = no se rechaza, cuando es incorrecta (la hipótesis

alterna 1 : 13.5H µ = es la correcta) . Luego entonces los valores para α y β se obtienen de la siguiente manera:

( )

( )

012.5 , : 12

12.5 121.67 0.0495

1.5

25

P X dado que H es correcta

P Z P Z

α µ

α

= > =

−= > = > =

De la tabla 2 para la variable normal estándar.

( )( )0 112.5 , : 13.5P X dado que H es incorrecta H es correctaβ µ= ≤ =

( ) ( )12.5 13.53.33 3.33 0.0004

1.5

25

P Z P Zβ

−= ≤ = ≤ − = Φ − =

De la tabla 2 para la variable normal estándar. En la figura 22 se ilustran ambas probabilidades

La potencia de la prueba es 1 0.9996β− = , la cual es muy alta.

1.67zα =

0.0495α =

Figura 22, valores de α y β

0.0004β =

3.33zβ− = −

151

Ejemplo 16 : Una muestra de 36 servicios que efectúa una maquina expendedora de bebidas, tiene un contenido promedio de 21.9 decilitros con una desviación típica de 1.42 decilitros.

a) Probar la hipótesis de que 22.2µ = dl, en contra de 22.2µ < dl, con un nivel de significancia del 5%

b) ¿Qué tan grande debe ser la muestra si se quiere que la probabilidad de cometer el error tipo II sea del 1% ( )0.01β = , cuando la hipótesis alterna

es correcta con 21.3µ = dl. Respuesta : a) La prueba es de cola izquierda. Planteamiento de la hipótesis .

0

1

: 22.2

: 22.2

H

H

µµ

=>


21.9 22.21.27

1.42

36

c c

xz z

s

n

µ− −= ⇒ = = −

Región de rechazo.

Desición estadística. Como el valor del estadístico de prueba no cae dentro de la región de rechazo, ya que 1.27 1.645cz zα= − > − = − , la hipótesis nula 0 : 22.2H µ = no se rechaza. b) El tamaño de la muestra lo encontramos con la siguiente expresión

( ) 2

1 0

z z sn

α β

µ µ +

= −

Donde s reemplaza a σ , como buena aproximación, ya que la muestra de donde se obtuvo este valor es suficientemente grande. De la tabla normal estándar y lo que aseguran las hipótesis, tenemos que:

0

1

0.05 1.645

0.01 2.326

: 22.2

: 21.3

1.42

z

z

H

H

s

α

β

αβ

µµ

= ⇒ == ⇒ =

==

=

lo que implica ( )( ) 2

1.645 2.326 1.4239.25 40

21.3 22.2n

+ = = ≈ −

Así el tamaño de la muestra sería de 40n = para tener estas probabilidades.

1.645zα− = −

Región de rechazo 1.27cz = −

Región de rechazo de cola izquierda

152

Ejemplo 17 : En una prueba de hipótesis 0 : 15H µ = , contra 1 : 17H µ = se sabe que la población es aproximadamente normal con desviación estándar 9.1σ = . Se quiere que 1%α = y 5%β = , encuentre el tamaño de muestra para tener estas probabilidades de cometer el error tipo I y II respectivamente. Respuesta :

0

1

0.01 2.326

0.05 1.645

: 15

: 17

9.1

z

z

H

H

α

β

αβ

µµ

σ

= ⇒ == ⇒ =

==

=

Luego ( )( ) 2

2.326 1.645 9.1326.48 327

17 15n

+ = = ≈ −

Por lo tanto, el tamaño de la muestra es de 327n = . Si 1%α β= = el tamaño de muestra sería de 449n = . Ejemplo 18 : Un fabricante de láminas de policarbonato afirma que su producto tiene una vida media superior a 10 años. En una muestra aleatoria de 30 láminas de este material se obtuvo una vida promedio de 12.5 años con una desviación estándar de 4.1 años, ¿el fabricante tiene razón con una significancia del 5%?, si 1 : 12H µ = años, obtenga β y la potencia de la prueba. Respuesta : Se efectúa una prueba de hipótesis para la media µ . Planteamiento de las hipótesis.

0

1

: 10

: 10

H

H

µµ

=>


12.5 103.34

4.1

30

cz−= =

Región de rechazo. De cola derecha

Desición estadística. La hipótesis nula 0H se rechaza, ya que el valor del estadístico de prueba si

cae en la región de rechazo , ( 3.34 1.645cz zα= > = ). Se concluye que el fabricante tiene razón en afirmar que sus láminas de policarbonato tienen una vida promedio superior a los 10 años.

1.645zα =

3.34cz =

Región de rechazo

153

Para hallar el valor de β , encontramos el valor crítico b que nos determina la región de rechazo, para ello nos apoyamos del valor que conocemos para

0.05α = . Dado que la prueba es de cola derecha, escribimos ( )0,P X b H correctaα = >

( )00 10 0.05 1.645

bP Z con P Z

n

µα µσ

−= > = = = >

De modo que 10

1.645 11.23134.1

30

bb

− = ⇒ =

Luego, ( )1 : 12P X b con H correctaβ µ= ≤ =

( ) ( )11.2313 121.08 1.08 0.1515

4.1

30

P Z P Zβ

−= ≤ = ≤ − = Φ − =

La potencia de la prueba es 1 0.8485β− = . Nota : Lo expuesto en esta sección se puede aplicar también a las pruebas de hipótesis para proporciones, preferentemente bajo la condición de que las muestras sean grandes, ya que con ello se puede usar la estimación puntual p como buena aproximación a la proporción poblacional p y podemos seguir trabajando con la variable normal de manera aceptable. Si la muestra es pequeña tendríamos que recurrir a la distribución binomial, además que si conocemos el o los valores críticos que determinan la región de rechazo y de no rechazo, es posible obtener las probabilidades de cometer el error tipo I y II respectivamente, siempre que en la hipótesis alternativa se de un valor especifico al parámetro, para ilustrarlo veamos algunos ejemplos. Ejemplo 19 : Los médicos especialistas en artritis reumatoide aseguran que el 40% de pacientes mejoran con un nuevo tratamiento con un ingrediente descubierto recientemente. Para probar su afirmación se les administra el medicamento a un grupo de 7 afectados por artritis reumatoide y si 3 o más pacientes mejoran se acepta la hipótesis nula que asegura 0.40p = , en caso contrario se concluye que 0.40p < .

a) Obtenga α , si se supone que 0 : 0.40H p =

b) Obtenga β , para la alternativa 1 : 0.30H p =

154

Respuesta : Como la muestra es pequeña 7n = , trabajaremos con la distribución binomial. a) Usando la función acumulada de la binomial con 7n = y 0.40p = .

( )0 ,P rechazar H cuando es correctaα =

( )( ) ( ) ( )

( )2

0

3, 0.40

0 1 2

7, , 0.40 0.4199

x

P X cuando p

P X P X P X

b n x p

α

α

α=

= < =

= = + = + =

= = = =∑

De manera que la probabilidad de cometer el error tipo I, es 0.4199α = . b) Usando la función acumulada de la binomial con 7n = y 0.30p = .

( )0 ,P No rechazar H cuando es incorrectaβ =

( )13, : 0.3P X cuando H p es la correctaβ = ≥ =

( )2

0

3 0.30 1 ( 7, , 0.30) 1 0.6471 0.3529

x

P X con p b n x pβ=

= ≥ = = − = = = − =∑

Por lo que la probabilidad de cometer el error tipo II, es 0.3529β = . Ejemplo 20 : en referencia al ejemplo anterior, el tratamiento se aplica a 70 pacientes y la región crítica se define como mayor o igual que 24 pacientes que mejoran, para que la hipótesis nula se acepte. Repetir los dos incisos del ejemplo 19. Respuesta : En este ejemplo, la muestra es suficientemente grande como para aproximar la variable binomial a la normal y aplicamos el factor de corrección por continuidad para una mejor aproximación. a) Para la probabilidad de cometer el error tipo II.

( )

( )( ) ( )

24, 0.40

23.5, 0.40

23.5 281.10 1.10 0.1357

70 0.24

P X cuando p

X np npP con p

npq npq

P Z P Z

α

α

α

= < =

− −≈ < =

− ≈ < = < − = Φ − =

b) la probabilidad de cometer el error tipo II.

( )

( )( ) ( )

124, : 0.30

23.5, 0.30

23.5 210.65 0.65 0.2578

70 0.21

P X cuando H p es correcta

X np npP cuando p

npq np

P Z P Z

β

β

β

= ≥ =

− −≈ ≥ =

− ≈ ≥ = ≥ = Φ − =

155

4.8 Prueba de hipótesis para la varianza Para la varianza poblacional 2σ , se tiene también su prueba de hipótesis. Aquí se utiliza la distribución Ji o Chi- cuadrada y enseguida se dan los elementos básicos de la prueba. Planteamiento de las hipótesis.

2 2

0 0:H σ σ= , contra

2 2

1 0

2 2 2

1 0 0

2 2

1 0

:

: ;

:

H

H es valor especifico

H

σ σσ σ σσ σ

>

<

≠



( ) 2

2

2

0

1c

n sχ

σ−

=

Donde 2s es el valor de la varianza para una muestra aleatoria de tamaño (pequeño ) n , extraída de una población normal . Región de rechazo. De cola derecha, si la alternativa es 2 2

1 0:H σ σ>

De cola izquierda, si la alternativa es 2 2

1 0:H σ σ<

De dos colas, si la alternativa es 2 2

1 0:H σ σ≠

Figura 23

2

αχ

α

Región de rechazo

Cola derecha

2

1 αχ −

α

Cola izquierda

2

2

1 αχ−

2

2αχ

RR

2α

2α

Dos colas

156



c αχ χ> (Región de rechazo de cola derecha)


1c αχ χ −< (Región de rechazo de cola izquierda)


2 2 2 2

1c coα αχ χ χ χ−

< > (Región de rechazo de dos colas)

Los valores 2

αχ , 2

1 αχ − , 2

2

1 αχ−

y 2

2αχ se obtienen de la tabla 4 para la variable Ji o

Chi-cuadrada con 1n − grados de libertad, como se aprecia en la figura 23 . Ejemplo 21 : Cuando un proceso de producción está funcionando adecuadamente, la varianza de las partes producidas es igual a cuatro. Las medidas de las partes se distribuyen normalmente y se considera que el proceso de producción en la actualidad se encuentra fuera de control: Se selecciona una muestra aleatoria de nueve partes producidas y se obtienen las siguientes medidas.

9, 10, 12, 13, 12, 8, 6, 11 y 9 ¿Se tiene razón en afirmar que en la actualidad el proceso de producción está fuera de control? utilice un nivel de significancia del 10% Respuesta : De acuerdo a la información cuando la varianza 2 4σ = , el proceso está funcionando correctamente y cuando 2 4σ ≠ está fuera de control. Así que la prueba de hipótesis que se realizará es para la varianza 2σ . Planteamiento de las hipótesis.

2

0

2

1

: 4

: 4

H

H

σσ

=

≠

Nivel de significancia. 0.10α = Valor del estadístico de prueba. El valor de la varianza para la muestra dada es 2 5s = , por lo que tenemos lo siguiente.

( )29 1 5

104

cχ−

= =

Región de rechazo. Es de dos colas y en la figura 24 , se ilustra los valores críticos 2

0.95 2.7326χ = y 2

0.05 15.5073χ = con 1 8n − = grados de libertad, sacados de la tabla 4 para la Chi-cuadrada, que delimitan la región de rechazo.

2

0.95 2.7326χ = 2

0.05 15.5073χ =

2α

2α

2 10cχ =

RR RR

Figura 24

157

Desición estadística. La hipótesis nula 2

0 : 4H σ = no se rechaza, ya que el

valor del estadístico de prueba 2 10cχ = no cae en la región de rechazo , por

que 2 2 2

0.95 0.052.7326 10 15.5073cχ χ χ= < = < = . Como se puede observar en la figura 24 . Por lo que, en base estos datos el proceso de producción está funcionando adecuadamente con una significancia del 10% Ejemplo 22 : En una empresa refrescera, se considera que una maquina está funcionando dentro de los márgenes de calidad, si su varianza en los contenidos netos es de 20 ml2. En caso de que la varianza sea superior a los 20 ml2 la maquina requiere ajustarse. De una muestra de los contenidos de 24 envases, se obtiene que 2 37s = ml2, suponiendo que la población de contenidos es normal, ¿se puede concluir que la maquina requiere ajustarse? usar un nivel de significancia del 1% Respuesta : Planteamiento de las hipótesis.

2

0 : 20H σ = La maquina funciona adecuadamente.

2

1 : 20H σ > La maquina requiere ajustarse. Nivel de significancia. 0.01α = Valor del estadístico de prueba.

( )224 1 37

42.5520

cχ−

= =

Región de rechazo. Es de cola derecha, por lo que asegura la hipótesis alternativa y en la figura 25 aparece el valor crítico 2

0.01 41.6383χ = con 1 23n − = grados de libertad de la tabla 4 para la Chi-cuadrada.

Desición estadística. Dado que el valor del estadístico de prueba si cae en la región de rechazo (Figura 25 ), ya que 2 2

0.0142.55 41.6383cχ χ= > = . Se concluye que la hipótesis

nula 2

0 : 20H σ = se rechaza, es decir la maquina debe ajustarse.

2

0.01 41.6383χ =

2 42.55cχ =

Figura 25

158

4.9 Prueba de hipótesis para la razón de varianzas Finalizamos el capítulo con la prueba de hipótesis para la razón de varianzas

2

1

2

2

σσ

, bajo la condición de que las poblaciones sean normales, como se

trabajaron en los intervalos de confianza (capítulo 3). Al comparar las varianzas, nos interesa que estas sean iguales, en contra de que una sea mayor que otra o bien simplemente diferentes y los elementos de dicha prueba son: Planteamiento de las hipótesis.

22 2 1

0 1 2 0 2

2

: : 1H Hσσ σσ

= =

, contra

22 2 1

1 1 2 1 2

2

22 2 1

1 1 2 1 2

2

22 2 1

1 1 2 1 2

2

: : 1

: : 1

: : 1

H H

H H

H H

σσ σσ

σσ σσ

σσ σσ

> >

< <

≠ ≠



2

1

2

2

c

sf

s=

Donde 2

1s y 2

2s son los valores de las varianzas para las muestras aleatorias de

tamaño 1n y 2n , respectivamente, extraídas de poblaciones normales . Región de rechazo.

De cola derecha, si la alternativa es 2

2 2 11 1 2 1 2

2

: : 1H Hσσ σσ

> >

De cola izquierda, si la alternativa es 2

2 2 11 1 2 1 2

2

: : 1H Hσσ σσ

< <

De dos colas, si la alternativa es 2

2 2 11 1 2 1 2

2

: : 1H Hσσ σσ

≠ ≠

En la figura 26 se ilustran la tres regiones de rechazo y en ellas aparecen los respectivos valores críticos de la variable F de Fisher para α , 1 α− ,

2α y

21 α− con sus grados de libertad para el numerador y denominador respectivamente, según el caso.

159

Figura 26 Regiones de rechazo para una prueba de hipótesis de la razón de

varianzas

Donde 1 1 1nν = − y 2 2 1nν = − son los grados de libertad.

( )1 2,fα ν ν

α

Región de rechazo (RR)

De cola derecha

( ) ( )1 1 2

2 1

1,

,f

fα

α

ν νν ν− =

α

De cola izquierda

( ) ( )2

2

1 212 1

1,

,f

fα

α

ν νν ν−

= ( )2

1 2,fα ν ν

RR

2α 2

α

De dos colas

RR RR

160

Desición estadística. Si ( )1 2,cf fα ν ν> , entonces 0H se rechaza, en una región de cola derecha.

Si ( ) ( )1 1 2

2 1

1,

,cf f

fα

α

ν νν ν−< = , 0H se rechaza, en una región cola izquierda.

Si ( ) ( )2

2

1 212 1

1,

,cf f

fα

α

ν νν ν−

< = o ( )2

1 2,cf fα ν ν> , 0H se rechaza, en una región

de dos colas. Ejemplo 23 : Un investigador considera que la variabilidad en los tiempos de atención vía telefónica en un banco A es superior que en los tiempos de otro banco B. Para ello toma una muestra de 15 tiempos del banco A y obtiene una varianza de 2

1 15s = , mientras que en una muestra de 12 tiempos del banco B

su varianza resulto de 2

2 5.5s = . Pruebe la hipótesis del investigador con un nivel de significancia del 10% Respuesta : Si tomamos como 2

1σ y 2

2σ la varianza de los tiempos del banco A

y del banco B respectivamente, 1 15n = y 2 12n = los tamaños de las muestras aleatorias, tenemos lo siguiente: Planteamiento de las hipótesis.

22 2 1

0 1 2 2

2

: 1Hσσ σσ

= =

Las varianzas son iguales.

22 2 1

0 1 2 2

2

: 1Hσσ σσ

> >

La varianza en los tiempos del banco A es mayor que

los del banco B. Nivel de significancia. 0.10α = Valor del estadístico de prueba.

152.73

5.5cf = =

Región de rechazo. De cola derecha, el valor crítico es ( ) ( )1 2 0.10, 14,11 2.179f fα ν ν = = obtenido de la

tabla 5 para la variable F de Fisher, donde 1 1 1 14nν = − = para el numerador y

2 2 1 11nν = − = para el denominador. En la figura 27 se ilustra dicha región de

rechazo de cola derecha y el valor crítico ( )0.10 14,11 2.179f = .

161

Desición estadística. Como el valor del estadístico de prueba cae en la región de rechazo , ya que

( )0.102.73 14,11 2.179cf f= > = (ver figura 27 ), se rechaza la hipótesis nula 0H ,

es decir el investigador tiene razón en afirmar que la variabilidad en los tiempos de atención vía telefónica del banco A, es mayor que la del banco B. Ejemplo 24 : Se requiere conocer la variación que existe en la efectividad de dos tipos de medicamento, se toma una muestra de tamaño 1 5n = del medicamento I y las mediciones son: 5.3, 5.6, 5.1, 5.7 y 5.9. De una segunda muestra de 1 8n = para el medicamento II, se obtuvieron los siguientes datos 5.0, 5.2, 5.3, 5.8, 5.6, 5.7, 5.8 y 5.5. Suponiendo que las poblaciones son normales y utilizando un nivel de significancia del 5%

a) Pruebe la hipótesis de que la varianza de la población I, es mayor que 0.5.

b) Realice una prueba de hipótesis para contrastar la afirmación de que las varianzas 2

1σ y 2

2σ son diferentes. Respuesta : De los datos dados se tiene lo siguiente.

1 2

1 2

2 2

1 2

5 8

5.52 5.49

0.102 0.0869

Muestra I Muestra II

n n

x x

s s

= == == =

a) Planteamiento de las hipótesis.

2

0 1: 0.5H σ = 2

0 1: 0.5H σ >

( )0.10 14,11 2.179f =

0.10α =

Figura 27 Región de rechazo de cola derecha.

2.73cf =

162


( )25 1 0.102

0.8160.5

cχ−

= =

Región de rechazo. Es de cola derecha, el valor crítico 2 9.4877αχ = , se obtiene de la tabla 4 para la

variable Chi-cuadrada con 1 1 5 1 4n − = − = grados de libertad. Desición estadística. Dado que el valor del estadístico de prueba 2 0.816cχ = no cae en la región de rechazo , se concluye que la hipótesis nula no es rechazada, es decir la varianza de la población I es igual a 0.5. b) Planteamiento de las hipótesis.

22 2 1

0 1 2 2

2

: 1Hσσ σσ

= =

22 2 1

0 1 2 2

2

: 1Hσσ σσ

≠ ≠


20.05 0.025αα = ⇒ =


0.1021.1737

0.0869cf = =

Región de rechazo.

Es de dos colas, los valores críticos son ( ) ( )2

2

1 212 1

1 1, 0.181

, 5.532f

fα

α

ν νν ν−

= = = y

( )2

1 2, 9.074fα ν ν = , donde 1 5 1 4ν = − = y 2 8 1 7ν = − = son los grados de libertad,

los cuales se obtienen de la tabla 5 para la variable F de Fisher. En la figura 28 , se pueden apreciar estos valores que delimitan la región de rechazo.

( )2

1 21, 0.181f α ν ν

−= ( )

21 2, 9.074fα ν ν =

1.1737cf =

Figura 28

163

Desición estadística. Dado que el valor del estadístico de prueba 1.1737cf = no cae en la región de rechazo (ver figura 28 ), se concluye que la hipótesis nula no es rechazada, es decir las varianzas poblacionales son iguales. RESUMEN Los elementos básicos de una prueba de hipótesis so n:

1) Planteamiento de las hipótesis. 2) Nivel de significancia. 3) Valor del estadístico de prueba. 4) Región de rechazo. 5) Desición estadística.

En términos generales, el valor del estadístico de prueba es el que se modifica, dependiendo del parámetro considerado en las hipótesis, de las condiciones de la o las poblaciones, de los tamaños y tipos de muestras aleatorias. De manera que escribimos los valores de los diferen tes estadísticos de prueba en este resumen.

Para una media µ ; 0c

xz

n

µσ−= 0

c

xz

s

n

µ−= 0c

xt

s

n

µ−=

Para una diferencia de medias 1 2µ µ− ; ( )1 2 0

2 2

1 2

1 2

c

x xz

n n

µσ σ− −

=+

( )1 2 0

2 2

1 2

1 2

c

x xz

s s

n n

µ− −=

+

( )1 2 0

1 2

1 1c

p

x xt

sn n

µ− −=

+

( )1 2 0

2 2

1 2

1 2

c

x xt

s s

n n

µ− −=

+ 0d

cd

xt

s

n

µ−=

Para proporciones; 0

0 0

ˆc

p pz

p q

n

−= 1 2 0

1 2

ˆ ˆ( )

1 1ˆ ˆ

c

p p pz

pqn n

− −=

+

1 2 0

1 1 2 2

1 2

ˆ ˆ( )

ˆ ˆ ˆ ˆc

p p pz

p q p q

n n

− −=

+

Para varianzas; ( ) 2

2

2

0

1c

n sχ

σ−

= 2

1

2

2

c

sf

s=

164

Ejercicios:

1) Para verificar la afirmación de una compañía de seguros de vida, la cual señala que el tiempo promedio de vida es de 15 años, en las personas que tienen más 60 años. Se toma una muestra aleatoria de 20 adultos mayores y resulta que su promedio de vida fue de 12 años, ¿la compañía tiene razón con un nivel significancia del 5%? suponga que la población es aproximadamente normal con una desviación estándar de 5 años.

2) Un laboratorio farmacéutico, afirma que un nuevo medicamento para

combatir la hipertensión arterial, surte efecto en promedio a los 45 minutos de ser suministrado y por experiencia la desviación estándar poblacional es de 8 minutos. Al seleccionar una muestra aleatoria de 12 pacientes que recibieron este medicamento, se obtuvo un tiempo promedio en surtir efecto de 52 minutos. ¿Favorecen estos datos la hipótesis del fabricante con un nivel de significancia del 10%?

3) El gerente de producción de cierto tipo de artículos, considera que el

tiempo medio de producción es de a lo más 8 minutos, de lo contrario la producción tiene problemas y debe revisarse el proceso para corregirse. Se mide el tiempo promedio de producción de 80 artículos y se tiene que

8.5x = y 2 16s = ¿presentan estos datos suficientes evidencias para que el proceso de producción sea revisado? utilice un nivel de significancia del 2%

4) En un estudio realizado en el D. F., sobre los gastos que los usuarios del

transporte público hacen cotidianamente para desplazarse de su hogar a su trabajo, se encuestaron a 100 personas aleatoriamente y resulto que en promedio gastan diariamente 25 pesos con una desviación estándar de 4 pesos, en transporte, ¿Puede decirse que el gasto promedio de los usuarios del transporte público es distinto a 20 pesos? con 0.06α = .

5) Una empresa empacadora de atún afirma que el contenido neto

promedio es de 125 gramos, sin embargo al tomar una muestra de 49 latas de esta empresa resulta que su peso promedio fue de 115 gramos con una desviación estándar de 5 gramos. ¿Presenta esta información suficiente evidencia, para rechazar la hipótesis de la empresa empacadora? utilice 0.05α = .

6) Se asegura que el tiempo promedio para contestar un examen de

admisión es de máximo 3 horas y se supone que los tiempos para contestar dicho examen se distribuyen en forma normal. Al tomar una muestra de 10 tiempos se obtuvo que: 2.5, 3.2, 3.0, 2.8, 3.5, 3.2, 2.9, 3.4, 3.6 y 2.7 horas. Con 0.10α = ¿se tiene razón en tal afirmación?

165

7) De una población normal se saca una muestra aleatoria de tamaño 24n = y se tiene que 3.68x = y 2 14s = . Pruebe la hipótesis nula

0 : 4H µ = , en contra de la alternativa 1 : 4H µ ≠ . Con un nivel de significancia del 1%

8) Se realizó un estudio para determinar si los estudiantes pertenecientes a

dos grupos étnicos, A y B, tienen distintos coeficiente intelectual (C.I.) promedio. Se sabe que las varianzas de los C.I. en los grupos A y B son respectivamente, 225 y 196. Se toma una muestra de 25 alumnos del grupo A y otra de 27 alumnos del grupo B, resultando que 102Ax = y

98Bx = . Probar la hipótesis nula de que los alumnos de los dos grupos étnicos tienen C.I. promedio idénticos, en contra de la alternativa de que los dos grupos tienen C.I. promedio diferentes, con 0.04α = y suponga normalidad en las poblaciones.

9) Cierta gran compañía emplea tanto hombres como mujeres para realizar

el mismo tipo de trabajo. Se cree que la producción promedio de los hombres es menor que la de las mujeres, de manera que se seleccionan muestras aleatorias de 36 hombres y mujeres, obteniéndose la siguiente información

1 2

1 2

2 2

1 2

36 36

148 154

65 72

Hombres Mujeres

n n

x x

s s

= == == =

¿Es correcta la afirmación de que la producción promedio de los hombres es inferior a las de las mujeres? con un nivel de significancia del 8%

10) Un nutriólogo desea comparar la efectividad de dos dietas para reducir el peso. Se proporcionan los siguientes datos en donde aparecen las reducciones promedio y las varianzas de cada dieta, respectivamente.

1 2

1 2

2 2

1 2

40 60

9 11

50 55

Dieta I Dieta II

n n

x x

s s

= == == =

Con un nivel de significancia del 12%, ¿puede decirse que la dieta I produce una perdida menor en el peso que la dieta II?

11) Dos maquinas producen tornillos idénticos. Se considera que las longitudes de los tornillos producidos por las dos maquinas se distribuyen normalmente y tienen la misma varianza. Se sospecha que la longitud promedio de los tornillos producidos por una maquina es distinta a la de los tornillos producidos por la otra maquina, se toman dos muestras independientes y en la tabla que sigue se presentan los datos:

166

1 2

1 2

2 2

1 2

18 10

2.7 2.6

0.0065 0.0042

Maquina I Maquina II

n n

x x

s s

= == =

= =

¿Señalan estos datos suficiente evidencia al 10%, para afirmar que si existe diferencia entre las longitudes medias de los tornillos producidos por estas dos maquinas?

12) Para comparar dos técnicas de elaboración en la fabricación cerámica,

se considera que la técnica I es mejor que la técnica II, para ello se mide el tiempo de vida (meses) a temperaturas extremas antes de sufrir fracturas, los datos que siguen proporcionan los resultados obtenidos en muestras independientes. Se supone que las poblaciones son normales y la varianzas desconocidas diferentes.

1 2

1 2

2 2

1 2

12 10

18 15

5 6

Tecnica I Tecnica II

n n

x x

s s

= == == =

¿Se tiene razón en la afirmación, con un nivel de significancia del 5%?

13) Se asegura que las personas cuando se encuentran sometidas a fuertes periodos de estrés, su tensión arterial aumenta en promedio en más de 15 puntos, lo cual es relativamente riesgoso. Se toma una muestra de 12 personas a las cuales se les mide su tensión arterial antes y después de un periodo fuerte de estrés, obteniéndose los datos que aparecen en la tabla

1 2 3 4 5 6 7 8 9 10

115 121 124 120 118 120 124 130 126 126

141 129 140 132 138 141 145 150 132 139

Persona

Antes

Despues

Realice una prueba de hipótesis para contrastar la afirmación de que el estrés produce un incremento en más de 15 puntos, en contra de la hipótesis nula de que es menor o igual a 15 dicho aumento. Considere que 0.05α = .

14) En la actualidad una enfermedad que crece cada vez más, es la obesidad y la secretaría de salud ha llegado a la conclusión de que más del 60% de los adultos con edades de 30 a 50 años tienen una cintura mayor de 90 centímetros, lo cual se cataloga como obesidad. De una muestra aleatoria de 500 adultos con estas edades, se obtiene que 345 tienen problemas de obesidad. Pruebe la hipótesis de la secretaría de salud con un nivel de significancia del 8%

15) Una compañía de seguros determina que el 15% de sus pólizas de

seguro son cobradas por sus clientes legalmente, mientras que la procuraduría federal del consumidor afirma que el porcentaje es menor al 15%, en base una muestra aleatoria de 700 clientes que contrataron el seguro con dicha compañía, en donde 90 reclamaron legalmente su

167

seguro. ¿Tiene razón la procuraduría federal del consumidor? utilice un nivel de significancia del 10%

16) Un vendedor de productos para limpieza, ha decidido que el 50% de

amas de casa consumen sus productos. El dueño de la fabrica asegura que tal porcentaje es incorrecto, ya que de una muestra de 250 amas de casa 110 utilizan los productos. Realice una prueba de hipótesis al 5%, para determinar quien tiene razón, de acuerdo a los resultados recabados en la muestra.

17) Una compañía de automotriz esta interesada en conocer la preferencia

de sus clientes, por dos modelos A y B. De 150 clientes 85 prefieren el modelo A, mientras que de otros 120 clientes 65 prefieren el modelo B. En base a esta información, se puede concluir que los dos modelos tienen la misma preferencia con nivel de significancia del 1%

18) La compañía fabricante de neumáticos Good Year, asegura que para los

rines de 13 pulgadas el modelo I es superior que el modelo II en un 10%, ya que de una muestra de 100 compradores de llantas de dicha medida 75 prefieren el modelo I y de otra muestra de 125 compradores 68 prefieren el modelo II. ¿Se puede considerar como valida la afirmación del fabricante con un nivel de significancia del 8%?

19) En una prueba de hipótesis para una media µ , se sabe que la población

es normal con varianza 2 1.5σ = , la hipótesis nula afirma que 12µ = y la alternativa dice que 13.6µ = . En una muestra aleatoria de tamaño

22n = , la región de rechazo esta dada por 12.6X > . a) Obtenga la probabilidad de cometer el error tipo I ( )α .

b) Obtenga la probabilidad de cometer el error tipo II ( )β y la potencia

de la prueba.

20) En una prueba de cola izquierda, la región de rechazo esta dada por 9X < , se toma una muestra de tamaño 81n = y su desviación estándar

es de 3s = . Se tiene las hipótesis 0 : 10H µ = vs 1 : 7.9H µ = , obtenga el valor de α y β , respectivamente.

21) La región de rechazo esta constituida por aquellos valores de X , tal que

8.5 11.5X< < , es decir se tiene una región de rechazo de dos colas. Una muestra de tamaño 40n = tiene una varianza de 2 25s = y se desea probar las hipótesis 0 : 10H µ = en contra ( )1 1: 10.8 : 10H Hµ µ= ≠

a) Obtenga la probabilidad de cometer el error tipo I ( )α .


de la prueba.

168

22) En una prueba de hipótesis para una proporción, la región de rechazo esta dada por 8X > , donde X es el número de éxitos. Se toma una muestra aleatoria de tamaño 50n = y la hipótesis son 0 : 0.70H p = vs

( )1 1: 0.75 : 0.70H p H p= >

a) Obtenga la probabilidad de cometer el error tipo I ( )α .


de la prueba.

23) Se sospecha que hay un incremento en el ingreso promedio de las familias de es casos recursos en los Estados Unidos Mexicanos y se dice que el ingreso medio de estas familias es de $4500.00 mensuales. Al tomar una muestra aleatoria de 100 familias en toda la republica de manera aleatoria, resulto que el ingreso promedio fue de $3750.00, con una desviación estándar de $100.00. a) Pruebe la hipótesis de que el ingreso medio es inferior a $4500.00 mensuales, 0.05α = b) Si se desea que 0.05α = y 0.02β = , ¿de tamaño tendría que ser la muestra para alcanzar estas probabilidades?

24) Un comerciante de aguacates, determina que el precio promedio de las cajas del producto es de $250 pesos ( )0 : 250H µ = , mientras que otro

asegura que el precio promedio es de $265 pesos ( )1 : 250H µ > , se toma

una muestra aleatoria de 75 cajas de aguacates y el costo promedio es de $260 pesos con una desviación estándar de $5 pesos. ¿Qué comerciante se puede decir, que tiene razón, con 0.04α = ? Si la probabilidad de cometer el error tipo I ( )α es del 4%. Obtenga la

probabilidad de cometer el error tipo II ( )β y la potencia de la prueba.

25) En una prueba de cola izquierda para una media se sabe que 2 4.1σ = ,

tenemos que 0 : 7.8H µ = ; 1 : 7.1H µ = ¿De que tamaño debe ser la muestra para que 0.01α β= = ?

26) Un banco desea conocer la variación en el tiempo de estancia de los

clientes, que continuamente asisten a realizar algunos trámites financieros, con el objeto de implementar un programa vía Internet, que le permita a los usuarios llevar a cabo estos trámites sin necesidad presentarse físicamente a la sucursal bancaria. se toman 15 tiempos (minutos) de manera aleatoria y la información aparece enseguida: 34.5, 21.2, 14.2, 10.5, 9.0, 12.3, 5.6, 12.5, 15.5, 24.5, 39.0, 40.5, 9.5, 4.5 y 12.5. Pruebe la hipótesis de que la varianza es de 20, en contra de la alternativa de que es mayor a 20. Utilizar un nivel de significancia del 5% y suponga que los tiempos se distribuyen normalmente.

169

27) para decidir si una maquina se encuentra fuera de control, existe el criterio de que cuando la desviación estándar de una muestra aleatoria sea menor o igual a 3.5, se considera que está dentro de los rangos aceptables y en caso contrario está fuera de control. Al tomar 25 mediciones se tiene que su desviación estándar es de 4.1, ¿presentan estos datos suficiente evidencia para afirmar que la maquina se encuentra fuera de control? Suponga normalidad y que 0.10α = .

28) En el ejercicio 11, se hace la suposición de que las poblaciones son

normales y las varianzas desconocidas pero iguales ( )2 2

1 2σ σ= .

Tomando un nivel de significancia del 5%, ¿Se tiene razón en dicha suposición?

29) En el ejercicio 12, se hace la suposición de que las poblaciones son

normales y sus varianzas diferentes ( )2 2

1 2σ σ≠ ¿se tiene razón en tal

suposición? con un nivel 0.01α = .

30) Para comparar la eficiencia de dos métodos en la fabricación de cierto producto, se toma una muestra de 14 tiempos de elaboración por el método A, obteniéndose los siguientes resultados 8.5Ax = y 1.5As = minutos, mientras que de otra muestra de 10 tiempos del método B, se obtuvo que 9.5Bx = y 0.9Bs = minutos. Bajo la condición de que los tiempos de ambos métodos son aproximadamente normales.

a) Pruebe la hipótesis de que las varianzas poblacionales son iguales, en contra de que son distintas, con un nivel de significancia del 5%

b) De acuerdo a lo concluido en el inciso a), realice una prueba, para determinar si diferencia entre las medias poblacionales en los dos métodos, es mayor a 30 segundos, con un nivel de significancia del 10% y 1%, respectivamente.

170

Capítulo 5 ANALISIS DE REGRESIÓN

n muchas situaciones prácticas, se puede estar interesado por el estudio de la relación que existe entre dos o más variables, dentro de la Estadística el tema se conoce comúnmente como Análisis de

Regresión . En este capítulo desarrollaremos los principales aspectos de uno de los casos más sencillos sobre este tema, nos referimos a la regresión lineal simple , es decir al estudio de la relación de dos variables X y Y , especialmente cuando se relacionan en forma lineal, por ello el nombre de lineal simple. Cabe aclarar que para los objetivos del libro solo abordaremos esta relación. Existen varios problemas en donde se presenta la regresión, por ejemplo: cuando se quiere ver la relación entre el tiempo de reacción a un fármaco y la dosis aplicada a los pacientes con cierta enfermedad, la cantidad de agua que se almacena en una presa y el número de días que durante un año llueve, la calificación que un educando le asigna a su profesor y la calificación que obtuvo en el semestre anterior, la velocidad que un atleta de alto rendimiento le imprime a sus carreras y el tiempo que logra alcanzar al término de ellas, la producción en una fabrica en relación con la cantidad de horas laboradas, la cantidad de partículas suspendidas de contaminantes en la zona metropolitana en relación con la temperatura ambiente, la dispersión de los contaminantes y la fuerza de los vientos en un área urbana, la densidad de un gas y la presión ejercida, la resistencia de un metal y su espesor, entre otras. Un primer aspecto importante de los ejemplos anteriores puede ser, el desarrollar un método de predicción que permita estimar el tiempo de reacción ( Y ) de un enfermo, cuando se aplica una determinada dosis del fármaco ( X ), o bien que nos permita estimar el nivel de agua en una presa cuando se tiene una cantidad de días lluviosos en cierto periodo de tiempo, etc. De manera que la estadística plantea el problema de cómo llegar a la mejor estimación de la relación entre dos variables. Por lo regular cuando se trabajan dos o más variables, alguna de ellas depende de la o las otras, esta se suele llamar variable dependiente o variable respuesta Y , mientras que las otras se conocen como variables independientes o variables de regresión 1, , kx xK . 5.1 Ajuste de curvas Cuando se estudia la relación existente entre dos o más variables, se pueden establecer diversos modelos (ecuaciones) que de alguna manera intentan

E

171

reflejar dicha relación, especialmente cuando se tienen dos variables X e Y tenemos modelos como el lineal, cuadrático, cúbico y en general a través de un polinomio de grado n de la forma 1

1 1 0

n n

n nY A X A X A X A−−= + + + +L donde iA

es un número real. Además se cuenta con modelos logarítmicos, exponenciales, trigonométricos, entre otros. En la figura 1 , se muestran algunos de dichos modelos gráficamente, así como su correspondiente ecuación de regresión. Comúnmente se le conoce a este tema ajuste de curvas o análisis de regresión .

5.2 Método de mínimos cuadrados Para construir los modelos de regresión mencionados, existe un método muy usado para ello, el cual se conoce como método de mínimos cuadrados , se fundamenta en la idea de minimizar la suma de los cuadrados de los errores, mediante una aproximación al modelo ideal que mejor ajuste a un conjunto de puntos en el plano o bien a una colección de n parejas ordenadas ( , )x y tomadas como una muestra de una población en estudio. Las bases teóricas para comprender dicho método, se apoyan del Cálculo diferencial integral en varias variables (derivadas parciales y el concepto de mínimo relativo). En este libro solo trabajaremos con el método de mínimos cuadrados para el caso más elemental, es decir lo ilustraremos en el modelo de regresión lineal simple . En la siguiente sección se desarrolla la idea del método para obtener estimaciones puntuales de los parámetros poblacionales.

.

. . . .

.

.

. . .

. . .

. .

.

.

.

. . .

.

.

.

. .

.

.

.

.

. .

. . .

.

Lineal Y Xα β= +

Cuadrática 2Y X Xα β ϕ= + +

Exponencial XY eβα= Logarítmica

log( )Y Xα β=

Figura1 Ajuste de curvas

172

5.3 Modelo de regresión lineal simple En muchos casos las variables independientes no son consideradas como aleatorias, ya que pueden ser controladas en el experimento o por el investigador, ello significa que dichas variables pueden no tener distribución de probabilidades, es por ello que las podremos escribir con letras minúsculas. Una variable dependiente esta supeditada de alguna manera a la variable independiente, por ejemplo en el caso del tiempo de reacción, esta es la variable dependiente y la dosis suministrada del fármaco es la variable independiente, el nivel del agua en la presa es la variable dependiente y la cantidad de días lluviosos es la variable independiente (aunque en este caso esta variable se puede catalogar como aleatoria, ya que el número de días lluviosos no está controlado por el investigador). Un segundo aspecto, es que la relación entre variables se caracteriza por medio de una ecuación de predicción, conocida como ecuación de regresión o modelo de regresión . El caso más sencillo es cuando se tiene una variable dependiente Y y una variable dependiente x y lo llamamos Regresión lineal simple . Dicho modelo será estudiado en este capítulo y el caso más general, es decir cuando se tengan dos o más variables independientes, queda fuera de los objetivos del libro. Primero tomemos una muestra aleatoria de n parejas ordenadas ( ),i ix y con

1,2,3, ,i n= K , donde ix y iy son valores que toman las variables x y Y , respectivamente. Resulta lógico decir que al tomar otra muestra aleatoria de n parejas ordenadas ( ),i ix y , para los mismos valores de los ix , los iy

cambiarán, ya que son valores de una variable aleatoria Y . Se conviene que la variable Y correspondiente a la variable x , será denotada por Y x , y en el caso de su valor esperado y varianza de la variable

Y correspondiente a la variable x , se escribe como Y x

µ y 2

Y xσ ,

respectivamente. De modo que si suponemos que ix x= , entonces iY x , iY x

µ

y 2

iY xσ son valor de Y correspondiente al valor ix , la media o valor esperado

del valor de Y correspondiente al valor ix y la varianza del Y correspondiente

al valor ix , respectivamente. Cuando se habla de regresión lineal , quiere decir que la media de variable Y correspondiente a la variable x (

Y xµ ) tiene una relación lineal con la variable x

y por consecuencia la ecuación de regresión lineal simple queda expresada

como: Y xxµ α β= + , donde los coeficientes α y β se conocen como los

parámetros del modelo de regresión lineal simple , reciben el nombre de la ordenada al origen y la pendiente del modelo (cabe aclarar que estos símbolos fueron usados para denotar las probabilidades de cometer el error tipo I y tipo II, respectivamente, en el capítulo 4; En este apartado se refieren a

173

la ordenada y la pendiente poblacionales del modelo de regresión lineal simple)

Los estimadores puntuales de α y β son Α y Β , respectivamente y sus

estimaciones puntuales serán a y b , a partir de una muestra aleatoria de n

parejas ordenadas o puntos en el plano cartesiano ( ),i ix y , así Y xµ se

puede estimar por y , de manera que una estimación muestral para el modelo de regresión lineal simple es

y a bx= +

El y se utiliza para distinguir el valor estimado o pronosticado por el modelo de regresión lineal y el valor real observado en una muestra aleatoria, para cierto valor x , para ilustrar la idea del modelo de regresión lineal simple tomemos el siguiente ejemplo, en el que se proporcionan 15 parejas de datos en donde se nos presentan las mediciones del tiempo de reacción y la dosis suministrada (en miligramos) de un nuevo medicamento para contrarestar la presión arterial elevada. En la tabla 1 que sigue aparece la información como parejas ordenadas. Tabla 1

Dosis del medicamento en mg

( x )

Tiempo de reacción en minutos

( y ) 5 20 6 22 7 18 8 15 9 12

10 15 11 8 12 9 13 8 14 9 15 6 16 7 17 8 18 5 19 6

Los puntos aparecen en la figura 2 , en ella se pueden apreciar dos rectas, una

es la recta del modelo de regresión lineal simple Y xxµ α β= + y la otra es

una estimación puntual al modelo de regresión lineal simple y a bx= +

174

Figura 2

Observando la figura 2 , se puede decir que los puntos están en el plano cartesiano colocados de tal manera, que es razonable aceptar de alguna forma que el modelo lineal parece ser adecuado. 5.3.1 Ecuación de la recta y sus parámetros El objetivo principal es la obtención de estimaciones para los parámetros del modelo, es decir para α y β , a partir de un conjunto de parejas o puntos en el plano usando el método de mínimos cuadrados. Consideremos una colección de n parejas de la forma ( ),i ix y , para un ix el error de la recta de regresión

lineal simple i iy xα β= + es iε y una estimación de dicho error es ie , es

decir i i iy xα β ε= + + y su estimación ajustada queda como

i i iy a bx e= + + , en la figura 3 se aprecia una comparación del error iε y

su estimación ie .

.

.

.

.

.

.

. . . .

. . .

. .

22

5

5 19

Y xxµ α β= +

y a bx= +

y

x

. } iε {ie

i i iy a bx e= + +

Figura 3

i i iy xα β ε= + + ( ),i ix y

175

Al utilizar la ecuación de la recta estimada y a bx= + , para expresar a ie como

ˆi i ie y y= − y la suma de los cuadrados de las estimaciones de los errores

( )SCE obtenemos una función en dos variables

( ) ( ) ( )( ) ( )22 22

1 1 1 1

ˆ,

n n n n

i i i i i i i

i i i i

f a b SCE e y y y a bx y a bx

= = = =

= = = − = − + = − −∑ ∑ ∑ ∑

Ahora se desea obtener los valores de las estimaciones a y b que minimicen esta función, lo anterior se logra derivando parcialmente con respecto a “a ” y “b ”, respectivamente e igualando a cero cada derivada parcial, como se indica enseguida. Derivada parcial con respecto a “a ”

( )1 1 1 1

2 2

n n n n

i i i i

i i i i

SCEy a bx y a b x

a = = = =

∂ = − − − = − − − ∂ ∑ ∑ ∑ ∑

Al igualar a cero tenemos

1 1 1

1 1

2 0

n n n

i i

i i i

n n

i i

i i

y a b x

na b x y

= = =

= =

− − − =

+ =

∑ ∑ ∑

∑ ∑

Derivada parcial con respecto a “b ”

( ) 2

1 1 1 1

2 2

n n n n

i i i i i i i

i i i i

SCEx y a bx x y ax b x

a = = = =

∂ = − − − = − − − ∂ ∑ ∑ ∑ ∑

Al igualar a cero se tiene que

2

1 1 1

2

1 1 1

2 0

n n n

i i i i

i i i

n n n

i i i i

i i i

x y ax b x

a x b x x y

= = =

= = =

− − − =

+ =

∑ ∑ ∑

∑ ∑ ∑

Con ello llegamos a un sistema de dos ecuaciones con dos incógnitas, llamadas regularmente ecuaciones normales por mínimos cuadrados .

1 1

n n

i i

i i

na b x y

= =

+ =∑ ∑

2

1 1 1

n n n

i i i i

i i i

a x b x x y

= = =

+ =∑ ∑ ∑

Al resolver este sistema por medio de la regla de Cramer o matrices se obtienen expresiones que permiten calcular los valores de a y b .

176

Las fórmulas para la estimación de los parámetros del modelo de regresión lineal simple son:

Para la pendiente 1 1 1

2

2

1 1

n n n

i i i i

i i i

n n

i i

i i

n x y x y

b

n x x

= = =

= =

− =

−

∑ ∑ ∑

∑ ∑

Para la ordenada 1 1

n n

i i

i ii i

y b x

a y bxn

= =

−= = −∑ ∑

Ejemplo 1 : Tomando los 15 puntos proporcionados en la tabla 1, podemos obtener las estimaciones para la pendiente y ordenada del modelo de regresión lineal simple. Respuesta : Las sumas se pueden determinar apoyándose de la gran mayoría de las calculadoras de bolsillo y son:

15 15 15 15 15

2 2

1 1 1 1 1

180 ; 2440 ; 168 ; 2302 ; 1704i i i i i i

i i i i i

x x y y x y

= = = = =

= = = = =∑ ∑ ∑ ∑ ∑

Redondeando a los cuatro primeros dígitos después del punto decimal, tenemos las estimaciones para la pendiente y ordenada respectivamente.

( ) ( ) ( )( ) ( )2

15 1704 180 1681.1143

15 2440 180b

−= = −

−

( )168 1.1143 180

24.571615

a− −

= =

Luego entonces 1.1143b = − y 24.5716a = Así la ecuación de la recta que ajusta a los puntos dados es ˆ 24.5716 1.1143y x= −

Con esta ecuación podemos obtener predicciones de la variable y para cada valor que le demos a x , las cuales serán estimaciones para la variable aleatoria dependiente Y . Además que con dos valores de x y la ecuación es

177

posible construir un par de puntos por donde pasa la recta que ajusta al conjunto de parejas y por consecuencia podremos dibujar la gráfica de la recta. Si por ejemplo le damos a la variable independiente los valores de 5x = y

15x = , se tiene los valores ˆ 19.0001y = y ˆ 7.8571y = , respectivamente al evaluarlos en la ecuación de la recta. En la figura 4 aparecen los puntos ( )5,19.0001 y ( )15,7.8571 marcados con una “x”, así como la gráfica de la recta

ajustada ˆ 24.5716 1.1143y x= − .

Figura 4

Gráfica de la recta ˆ 24.5716 1.1143y x= − que ajusta a los puntos

Nota: Es importante señalar que el modelo obtenido en el ejemplo, se ajusta a los puntos dentro un dominio restringido, es decir, no tiene sentido darle un valor a la variable x (dosis de medicamento) de cero , o valores próximos a cero, ni superiores a veintidós miligramos en la ecuación encontrada, ya que no corresponden a la ló gica del problema. Cabe aclarar entonces que los modelos obtenidos describen de buena forma el comportamiento de una muestra de parejas, mediante los cuales se pueden hacer generalizaciones a la población, dicho de otra manera, a la relación entre las variables en estudio.

.

.

.

.

.

.

. . . .

. . .

. .

22

5

5 15 19

ˆ 24.5716 1.1143y x= −

y

x

x

x

19.0001

7.8571

178

Ejemplo 2 : Al estudiar la relación entre tiempo (horas) que hacen las personas que utilizan su auto para llegar a su trabajo y la cantidad de combustible (litros) que se gasta en los días de mucho tráfico, se obtuvieron los siguientes datos. Tiempo 0.30 0.35 0.41 0.50 0.54 1.20 1.24 1.30 1.45 2.10 Cantidad de combustible

5

5.6

6.1

7.5

8.3

10.4

10.8

12.5

13.4

16.6

Obtener la ecuación de la recta que ajusta estos puntos por mínimos cuadrados y use ésta para determinar la cantidad de combustible que se gastará un auto cuando una persona tarda en llegar a su trabajo 2.5 horas. Respuesta : La variable independiente en el ejemplo es el tiempo ( )x , mientras

que la variable dependiente es la cantidad de combustible gastado ( )y , luego

entonces hay que calcular las sumas correspondientes, es decir

10 10 10 10

2 2

1 1 1 1

10

1

9.39 ; 12.1023 ; 96.2 ; 1054.88

110.605

i i i i

i i i i

i i

i

x x y y

x y

= = = =

=

= = = =

=

∑ ∑ ∑ ∑

∑

Aplicando las fórmulas para las estimaciones de la pendiente y ordenada respectivamente, se tiene que:

( ) ( )( )( ) ( )2

10 110.605 9.39 96.26.1713

10 12.1023 9.39b

−= =

−

( )96.2 6.1713 9.39

3.825110

a−

= =

Por lo tanto, la ecuación de la recta por mínimos cuadrados queda determinada por ˆ 3.8251 6.1713y x= + . Para determinar la cantidad de combustible que se gastará en 2.5 horas, solo basta con sustituir 2.5x = en la ecuación obtenida y se tiene que

( )ˆ 3.8251 6.1713 2.5 19.2534y = + = , es decir la cantidad de combustible que se

gastará un auto en 2.5 horas será de 19.2534 litros aproximadamente.

179

5.3.2 Intervalos de confianza para los parámetros d el modelo de regresión lineal simple Los estimadores insesgados de los parámetros α y β (ordenada y pendiente ) para el modelo de regresión lineal son A y B , respectivamente, y como se dijo anteriormente sus estimaciones son a y b . En consecuencia con el capítulo 3 podemos hablar de intervalos de confianza para α y β . La varianza de cada estimador la denotamos por 2

Aσ y 2

Bσ , respectivamente y están dadas por

( )2 21

2

1

n

i

iA n

i

i

x

n x x

σ σ=

=

=−

∑

∑ y

( )

22

2

1

B n

i

i

x x

σσ

=

=−∑

Donde 2σ es la varianza de los errores del modelo y por ende de la variable aleatoria dependiente ( )Y .

Un estimador insesgado de 2σ es 2S y un valor de dicho estimador (estimación) está dada por

2

2

yy xys bss

n

−=

−

De manera que:

2

12

1

n

in

i

xx i

i

x

s xn

=

=

= −∑

∑

2

12

1

n

in

i

yy i

i

y

s yn

=

=

= −∑

∑

1 1

1

n n

i in

i i

xy i i

i

x y

s x yn

= =

=

= −∑ ∑

∑

180

Intervalo de confianza para la ordenada. Para construir un intervalo de confianza para la ordenada al origen α , se usa la variable

2

1

n

i

i

xx

AT

x

Sn s

α

=

−=

∑

Que tiene una distribución t de Student con 2n − grados de libertad. Así, un intervalo de confianza para la ordenada al origen del ( )1 100%α− , esta

determinado por:

2 2

2 2

1 1

n n

i i

i i

xx xx

t s x t s x

a an s n s

α α

α= =− < < +∑ ∑

O bien 2

2

1

n

i

i

xx

t s x

an s

α

=±∑

, donde 2

tα es un valor de la variable t de Student con

2n − grados de libertad. Ejemplo 3 : Construir un intervalo de confianza al 95% para la ordenada al origen del modelo de regresión lineal con los datos del ejemplo 2. Respuesta : Con la información que ya tenemos del ejemplo 2, podemos obtener un intervalo de confianza para la ordenada al origen.

10 10 10 10

2 2

1 1 1 1

10

1

9.39 ; 12.1023 ; 96.2 ; 1054.88

110.605

i i i i

i i i i

i i

i

x x y y

x y

= = = =

=

= = = =

=

∑ ∑ ∑ ∑

∑

( )29.39

12.1023 3.285110

xxs = − =

( )296.2

1054.88 129.43610

yys = − =

( )( )9.39 96.2110.605 20.2732

10xys = − =

Luego ( )2

129.436 6.1713 20.27320.5405

8s

−= = , entonces 2 0.7352s s= =

De la tabla 3, con 8 grados de libertad 0.0252

α = se tiene que 2

0.025 2.306t tα = =

181

Como 3.8251a =

Sustituyendo en 2

2

1

n

i

i

xx

t s x

an s

α

=±∑

tenemos un intervalo de confianza del 95%,

para ordenada al origen será:

( )( )

2.306 0.7352 12.10233.8251 3.8251 1.029

10 3.2851± ⇒ ±

O bien 2.7961 4.8541α< < Intervalo de confianza para la pendiente. Para el caso de la pendiente β , un intervalo de confianza en la recta de

regresión Y xxµ α β= + está dado por

2 2

xx xx

t s t sb b

s s

α α

β− < < +

O bien 2

xx

t sb

s

α

± , donde 2

tα se obtiene de la tabla 3 con 2n − grados de

libertad. Ejemplo 4 : Construir un intervalo de confianza al 95% para la pendiente β del modelo de regresión lineal con los datos del mismo ejemplo 2.

Respuesta : Al sustituir directamente, usando los valores correspondientes llegamos, a que un intervalo de confianza al 95% para la pendiente β queda como:

( )2.306 0.73526.1713 6.1713 0.9354

3.2851± ⇒ ±

O bien 5.2359 7.1067β< <

182

5.3.3 Pruebas de hipótesis para los parámetros del modelo de regresión lineal simple. Siguiendo los elementos básicos de las pruebas de hipótesis indicados en el capítulo 4, podemos escribirlos para la ordenada al origen y la pendiente. Elementos de una prueba de hipótesis para la ordena da α . Planteamiento de las hipótesis .

0 0:H α α= , contra 1 0

1 0 0

1 0

:

:

:

H


H

α αα α αα α

><≠

Nivel de significancia. ( )P Error tipo Iα = Aquí se debe aclarar el símbolo del nivel de significancia,

no representa lo mismo que el símbolo usado en las hipótesis. Valor del estadístico de prueba.

0

2

1

cn

i

i

xx

at

x

sn s

α

=

−=

∑


Donde

2 2


2n − grados de libertad. Decisión estadística. Dependiendo del tipo de región de rechazo, se tiene la siguiente decisión. La hipótesis nula 0H se rechaza, si ct tα> (RR de cola derecha).

La hipótesis nula 0H se rechaza, si ct tα< − (RR de cola izquierda).

La hipótesis nula 0H se rechaza, si 2

ct tα< − o 2



α α 2α

2α

tα tα− 2

tα− 2

tα RR RR RR RR

183

Ejemplo 5 : Considérese el ejemplo 2, ¿se tiene razón en afirmar que la ordenada al origen es superior a 3? use un nivel de significancia del 10%. Respuesta : Se desea llevar a cabo una prueba de hipótesis, cuyos elementos quedan de la siguiente manera. Donde el parámetro es la ordenada α . Planteamiento de las hipótesis.

0

1

: 3

: 3

H

H

αα

=>

Nivel de significancia. ( ) 0.10P Error tipo Iα = =


Dado que 3.8251a = ; 10

2

1

12.1023i

i

x

=

=∑ ; 3.2851xxs = ; 0.7352s =

( )

3.8251 31.849

12.10230.7352

10 3.2851

ct−= =

Región de rechazo. La región es de cola derecha, en la figura 5 se ilustra dicha región, así como el valor crítico 0.10 1.3968t tα = = con 2 8n − = grados de libertad.

Decisión estadística. La hipótesis nula 0H se rechaza, ya que el valor del estadístico de prueba cae en la región de rechazo como se aprecia en la figura 5 , ya que

1.849 1.3968ct tα= > = , por lo que, si existe suficiente evidencia para afirmar que la ordenada al origen es superior a 3.

1.3968tα =

Región de rechazo

1.849ct =



184

Elementos de una prueba de hipótesis para la pendie nte β . Planteamiento de las hipótesis .

0 0:H β β= , contra 1 0

1 0 0

1 0

:

:

:

H


H

β ββ β ββ β

><≠



0c

xx

bt

s

s

β−=


Donde

2 2


2n − grados de libertad. Decisión estadística. Dependiendo del tipo de región de rechazo, se tiene la siguiente decisión. La hipótesis nula 0H se rechaza, si ct tα> (RR de cola derecha).

La hipótesis nula 0H se rechaza, si ct tα< − (RR de cola izquierda).

La hipótesis nula 0H se rechaza, si 2

ct tα< − o 2


Ejemplo 6 : Considérese de nuevo el ejemplo 2 y supongamos que se quiere realizar una prueba de hipótesis para determinar si la pendiente es diferente a 6 con la información recabada en la muestra de las 10 parejas. Use un nivel de significancia del 5%.


α α 2α

2α

tα tα− 2

tα− 2

tα RR RR RR RR

185

Respuesta : Planteamiento de las hipótesis.

0

1

: 6

: 6

H

H

ββ

=≠

Nivel de significancia. ( ) 0.05P Error tipo Iα = =

Valor del estadístico de prueba. Dado que 6.1713b = ; 3.2851xxs = ; 0.7352s =

6.1713 60.129

0.7352 3.2851ct

−= =

Región de rechazo. La región es de dos colas, los valores críticos

20.025 2.306t tα− = − = − y

20.025 2.306t tα = = se obtienen con 2 8n − = grados de libertad de la tabla 3 en el

apéndice. En la figura 6 se muestra la región así como los valores críticos.

Decisión estadística. Dado que el valor del estadístico de prueba no cae en la región de rechazo, como se observa en la figura 6 , la hipótesis nula 0H no se rechaza. Por lo que, no se tiene evidencia suficiente para apoyar la afirmación de que la pendiente es diferente a 6.

2

2.306tα− = − 2

2.306tα =

RR RR


0.129ct =

20.025α =

20.025α = 1 0.95α− =

186

5.4 Predicción Con la ecuación y a b x= + se puede obtener el valor de la respuesta media

0Y xµ para 0x x= , donde 0x es prácticamente cualquier valor que se le quiera

dar a la variable independiente y no necesariamente algunos de los valores seleccionados o elegidos de antemano, es decir se puede predecir el valor de la respuesta media a partir de un valor arbitrario de x , a ello se le suele llamar predicción , también la ecuación y a b x= + puede utilizarse para predecir un valor de 0y de la variable 0Y cuando 0x x= . 5.4.1 Intervalo de confianza y prueba de hipótesis Si se desea construir un intervalo de confianza para la respuesta media

0Y xµ ,

se usa el estadístico

( )00

2

0

ˆ

1

Y x

xx

YT

x xS

n S

µ−=

−+

El cual tiene una distribución t de Student con 2n − grados de libertad. De manera que un intervalo de confianza para la respuesta media

0Y xµ al

( )1 100%α− está dado por

( ) ( )2 2

2 2

0 0

0 0

1 1ˆ ˆ

xx xx

x x x xy t s y t s

n s n sα α

− −− + < + +

O bien ( )

2

2

0

0

1ˆ

xx

x xy t s

n sα

−± +

donde

2

tα se obtiene de la tabla 3 (distribución t de Student) con 2n − grados

de libertad. En el caso de que se quiera obtener un intervalo de predicción para cualquier valor 0y de la variable 0Y , se usa el estadístico

( )0 0

2

0

ˆ

11

xx

Y YT

x xS

n S

−=−

+ +

El cual tiene una distribución t de Student con 2n − grados de libertad.

187

De modo que un intervalo de confianza del ( )1 100%α− para una “respuesta”

0y queda dado por

( ) ( )2 2

2 2

0 0

0 0

1 1ˆ ˆ1 1

xx xx

x x x xy t s y t s

n s n sα α

− −− + + < + + +

O bien ( )

2

2

0

0

1ˆ 1

xx

x xy t s

n sα

−± + +

donde

2

tα se obtiene de la tabla 3 (distribución t de Student) con 2n − grados

de libertad. Ejemplo 7 : En referencia al ejemplo 2, construir un intervalo de confianza al 95% para la respuesta media

0Y xµ y para 0y , respectivamente, cuando 0 1x =

(una hora). Respuesta : Tomando la ecuación de la recta de regresión obtenida en el ejemplo 2, calculamos 0y para 0 1x =

ˆ 3.8251 6.1713y x= + ; entonces ( )0ˆ 3.8251 6.1713 1 9.9964y = + =

Además 0.939x = ; 3.2851xxs = ; 0.7352s = y 2

0.025 2.306t tα = =

Un intervalo de confianza para la respuesta media 1Y

µ , al 95% queda como:

( ) ( )21 0.9391

9.9964 2.306 0.735210 3.2851

9.9964 0.5392

−± +

±

Por lo tanto,

19.4572 10.5356

Yµ< < es un intervalo de confianza para la

respuesta media 1Y

µ , al 95%.

De forma análoga, para 0y cuando 0 1x = .

( ) ( )21 0.9391

9.9964 2.306 0.7352 110 3.2851

9.9964 1.7790

−± + +

±

Por lo tanto, 08.2174 11.7754y< < es un intervalo de confianza para la

“respuesta ” 0y , cuando 0 1x = , al 95%

188

5.5 Correlación 5.5.1 Concepto de correlación Al estudiar la relación que dos variables tienen, es conveniente poder saber o por lo menos tener idea de la “fuerza” de dicha relación, es decir conocer el grado de relación que guardan dos variables como X e Y en muchos problemas de investigación resulta muy importante, ya que ello permite comparar modelos para decidirse por el más adecuado o el que ajusta mejor un conjunto de datos de la forma ( ),X Y , en donde las variables se pueden

considerar provenientes de una población con función de densidad conjunta, particularmente cuando estamos trabajando el modelo lineal simple Y Xα β= + , ya que la media del error aleatorio es cero. Podemos decir entonces que el concepto de correlación está en la idea de medir la relación existente entre dos variables de interés, mediante un número. 5.5.2 Coeficiente de correlación El número que mide la relación lineal entre variables se conoce como coeficiente de correlación de la población y se denota con la letra griega ρ (rho). Su estimación puntual de este parámetro ρ es r conocido como coeficiente de correlación de Pearson o coeficiente de correlac ión muestral y está dada por

xy

xx yy

sr

s s=

El coeficiente de determinación es 2ρ y su estimación puntual es 2r , que está dada por

2

2 xy

xx yy

sr

s s=

Representa la proporción de variación total en los valores de la variable Y que puede ser explicada por una relación lineal con los valores de la variable X .

189

5.5.3 Coeficiente de correlación en el modelo de re gresión lineal simple y su interpretación En el modelo de regresión lineal simple como se mencionó en el apartado anterior, el coeficiente de correlación poblacional es ρ y su estimación es r . Los valores de r oscilan entre – 1 y 1, su interpretación se da de acuerdo a lo siguiente: Cuando el valor del coeficiente de correlación muestral esté próximo a los valores – 1 o a 1, quiere decir que hay una “muy buena” relación lineal, sin embargo cuando hay valores dentro del intervalo [ ]1,1− se debe tener

cuidado con la interpretación, ya que valores de 0.2 y 0.4 no significa que la correlación de una sea el doble de la otra, solo se puede decir que una es más fuerte que la otra. En el análisis de correlación se presenta una prueba de hipótesis muy particular y es cuando se desea contrastar la hipótesis 0ρ = (no hay relación lineal) en contra de que 0ρ ≠ (si hay relación lineal, aunque sea muy ligera) y para eso se cuenta con los siguientes elementos: Planteamiento de hipótesis.

0

1

: 0

: 0

H

H

ρρ

=≠



2

2

1c

r nt

r

−=−

Región de rechazo. De dos colas. Decisión estadística. Si

2ct tα− < o bien

2ct tα > , entonces la hipótesis nula 0H se rechaza, donde

2

tα−

y 2

tα se obtienen de la tabla 3, con 2n − grados de libertad.

Ejemplo 8 : considere la tabla del ejemplo 2, para calcular el coeficiente de correlación muestral, interprételo y realice una prueba de hipótesis de 0ρ = en contra de 0ρ ≠ con un nivel de significancia del 10% Respuesta : Sabemos que 3.2851xxs = ; 129.436yys = ; 20.2732xys = de modo

que ( )

20.27320.9832

3.2851 129.436r = =

En virtud de que el valor del coeficiente de correlación muestral está muy cercano a 1, podemos interpretarlo como que la relación lineal es muy buena .

190

Para la prueba de hipótesis se tiene que: Planteamiento de hipótesis.

0

1

: 0

: 0

H

H

ρρ

=≠


( )2

0.9832 10 215.24

1 0.9832ct

−= =−

Región de rechazo. La región es de dos colas y de la tabla 3, se tiene que

20.05 1.860t tα− = − = − y

20.05 1.860t tα = = con 8 grados de libertad. En la figura 7 se aprecia la región de

rechazo de dos colas (RR)

Decisión estadística. Dado que el valor del estadístico de prueba si cae en la región de rechazo (véase figura 7 ) ya que 15.24ct = >

2

1.860tα = , la hipótesis nula se rechaza, es

decir si existe relación lineal y además es bastante buena como ya se había observado en la interpretación del coeficiente de correlación muestral.

2

1.860tα− = − 2

1.860tα =

RR RR


15.24ct =

20.05α =

20.05α = 1 0.90α− =

191

RESUMEN Modelo de regresión lineal simple: Y Xα β= +

Estimación del modelo de regresión lineal simple: y a bx= + Estimaciones de los parámetros del modelo de regres ión lineal simple.

Para la pendiente 1 1 1

2

2

1 1

n n n

i i i i

i i i

n n

i i

i i

n x y x y

b

n x x

= = =

= =

− =

−

∑ ∑ ∑

∑ ∑


n n

i i

i ii i

y b x

a y bxn

= =

−= = −∑ ∑

Intervalos de confianza y prueba de hipótesis para l os parámetros del modelo de regresión lineal simple.

2

2

yy xys bss

n

−=

−

2

12

1

n

in

i

xx i

i

x

s xn

=

=

= −∑

∑

2

12

1

n

in

i

yy i

i

y

s yn

=

=

= −∑

∑

1 1

1

n n

i in

i i

xy i i

i

x y

s x yn

= =

=

= −∑ ∑

∑

192


2 2

1 1

n n

i i

i i

xx xx

t s x t s x

a an s n s

α α

α= =− < < +∑ ∑

0

2

1

cn

i

i

xx

at

x

sn s

α

=

−=

∑

Para la pendiente 2 2

xx xx

t s t sb b

s s

α α

β− < < +

0c

xx

bt

s

s

β−=

Intervalos de confianza y pruebas de hipótesis para la respuesta media

0Y xµ y la respuesta 0y .

Para la respuesta media 0Y x

µ : ( )

2

2

0

0

1ˆ

xx

x xy t s

n sα

−± +

( )00

2

0

ˆ

1

Y x

xx

YT

x xS

n S

µ−=

−+

Para la respuesta 0y : ( )

2

2

0

0

1ˆ 1

xx

x xy t s

n sα

−± + +

( )0 0

2

0

ˆ

11

xx

Y YT

x xS

n S

−=−

+ +

193

Correlación. Coeficiente de correlación muestral:

xy

xx yy

sr

s s=


2

2

1c

r nt

r

−=−

Ejercicios:

1) Al estudiar el desgaste que un tipo de neumático sufre cuando se realiza un frenado brusco, se obtienen los siguientes resultados en la tabla, donde la fuerza de frenado se mide en kilogramos por centímetro cuadrado y el desgaste en milímetros.

Fuerza de frenado (x)

25

28

36

45

50

67

71

75

81

85

Desgaste del neumático(y)

0.3

0.4

0.4

0.5

0.6

0.8

0.7

0.8

1.0

1.1

a) Represente los puntos en el plano cartesiano. b) Obtenga la ecuación de la recta que ajusta estos puntos, por el método

de mínimos cuadrados y trace su gráfica en el mismo plano. c) Construya un intervalo de confianza del 90% para la ordenada al origen

( )α del modelo de regresión lineal.

d) Construya un intervalo de confianza del 95 % para la pendiente ( )β del

modelo. e) Obtenga un intervalo de confianza del 90% para desgaste medio de los

neumáticos, cuando la fuerza de frenado es de 55 kilogramos ( 0 55x = ). f) Construya un intervalo de confianza del 94% para el desgaste de los

neumáticos, cuando la fuerza de frenado es de 100 kilogramos. g) Pruebe la hipótesis de que la pendiente es inferior a 0.03, con un nivel

de significancia del 5% h) Calcule el coeficiente de correlación de Pearson e interprételo.

194

2) Para lograr una mejor flexibilidad en la varillas que se usan en la industria de la construcción, se ha determinado que cuando la aleación se realiza a mayores temperaturas se obtienen varillas más flexibles, se seleccionan 8 varillas que se produjeron a diferentes temperaturas, obteniéndose los siguientes resultados

a) Dibuje los puntos en el plano cartesiano. b) Por el método de mínimos cuadrados, encuentre la ecuación de la recta

que ajusta a estos puntos y dibuje su gráfica en el mismo plano del inciso a).

c) Construya un intervalo de confianza del 96% para la ordenada. d) Construya un intervalo de confianza del 98% para la pendiente. e) Construya un intervalo de confianza del 95% para la flexibilidad media,

cuando la temperatura es de 1360°. f) Construya un intervalo de confianza del 95% para la flexibilidad, cuando

la temperatura es de1360°. g) Pruebe la hipótesis de que la ordenada al origen es diferente a 2, con

una significancia del 10% h) Calcule el coeficiente de correlación muestral. i) Con un nivel de significancia del 1%, ¿Qué puede decirse al respecto de

la relación lineal? (realice una prueba de hipótesis para el coeficiente de correlación lineal)

3) Se considera que existe una relación lineal entre las variables (calificación obtenida por el alumno (x) y el puntaje (y) que le asigna al docente en su desempeño durante un semestre), por lo que se toman 15 alumnos como muestra y se les pide que informen de su calificación obtenida, así como la calificación que le asignaron al profesor. En la tabla aparece dicha información. x 3 3 4 5 6 6 7 7 8 8 9 9 9 10 10 y 2 4 4 6 5 7 7 8 8 6 8 9 10 9 10

a) Dibuje los puntos de la tabla. b) Obtenga la ecuación de la recta por medio del método de mínimos

cuadrados, con ella calcule el valor de predicción para la calificación que se le asignaría al profesor (y), si el alumno tiene una calificación de 8.5 ( 0 8.5x = ) y trace su gráfica en el mismo plano del inciso a).

c) Construya un intervalo de confianza del 99% para la ordenada al origen. d) Pruebe la hipótesis de que la pendiente del modelo es diferente a 1, con

un nivel de significancia del 10%

Temperatura 1100° 1150° 1200° 1300° 1455° 1600° 1762° 1800° Flexibilidad 4.51 4.56 4.65 4.86 4.96 5.42 5.68 6.12

195

e) Construya un intervalo de confianza del 95% para y , cuando 0 8.5x = . f) Calcule el coeficiente de correlación de Pearson. g) ¿Qué puede afirmarse al respecto de la relación lineal entre estas dos

variables? use un nivel de significancia del 1% 4) Al realizar una investigación en cierto hospital privado, para estudiar la relación entre el tiempo (x) que un paciente pasa en el hospital (en días) y los gastos hospitalarios completos (y) (honorarios médicos, cuarto, medicamentos, laboratorio, etc) en miles de pesos, se tiene la creencia de que dicha relación es lineal . Para indagarlo se obtiene la información de 9 pacientes como muestra aleatoria, la cual aparece en la tabla

Tiempo de

estancia

Gastos en miles de pesos

1 23.1 1 29.0 2 34.2 3 39.4 4 55.1 4 65.5 4 70.3 5 81.8 6 85.9

a) Represente los puntos de la tabla en el plano cartesiano, obtenga la

ecuación de la recta que los ajusta por mínimos cuadrados, calcule el gasto de un paciente que dure 7 días en el hospital y dibuje la gráfica de la ecuación.

b) Pruebe la hipótesis de que la pendiente es superior a 12, con una significancia del 10%

c) Construya un intervalo de confianza al 90% para la ordenada al origen. d) Construya un intervalo de confianza al 95% para el gasto de

predicción ( )y , cuando un paciente se encuentre hospitalizado siete

días. e) Calcule el coeficiente de correlación de Pearson e interprételo. f) Con un nivel de significancia del 1%, ¿se puede afirmar que la relación

lineal entre estas variables es muy buena?

196

BIBLIOGRAFÍA: Chao L. Introducción a la Estadística. Editorial: C E C S A. Chao L., Estadística para las ciencias administrativas. Editorial: Mc Graw Hill. Chou Lun Ya, Análisis Estadístico. Editorial: Interamericana. Daniel W., Bioestadística. Editorial: Noriega Limusa. Freund-Manning, Estadística. Editorial: Prentice-Hall. Kreyszig E. Estadística matemática. Editorial: Limusa. Mason-Lind, Estadística para Administración y Economía. Editorial: Alfaomega. Mendenhall W., Estadística para Administradores. Editorial: grupo Editorial Iberoamerica. Mendenhall-Reinmuth, Estadística para Administración y Economía. Editorial: Grupo editorial Iberoamerica. Mendenhall-Scheaffer-Wackerly, Estadística Matemática con aplicaciones. Editorial: Grupo editorial Iberoamérica. Miller I., Freund J., Jonson R., Probabilidad y Estadística para Ingenieros. Editorial: Prentice-Hall Hildebrant- Ott, Estadística aplicada a la Administración y a la Economía. Editorial Addison- Wesley. Hines-Montogomory, Probabilidad y Estadística para Ingeniería. Editorial C E C S A. Scheaffer-Mendenhall-Ott, Elementos de muestreo. Editorial: Grupo editorial Iberoamerica. Walpole-Miers, Probabilidad y estadística para ingenieros. Editorial: Mc-Graw Hill.

197

Índice alfabético A Aceptación, región de 111 Acumulada, distribución 11

• Aleatoria, variable • binomial 47 • continua 33 • discreta 30, 31 • media de 32 • muestral 30 • normal 33

Alternativa, hipótesis 109 Análisis de varianza en regresión 176

B Barras, diagrama de 10, 11 Bilateral, alternativa hipótesis 112

C Clase, intervalo de 8, 9

• límite de 9 • punto medio de 9

Coeficiente de determinación 185 Confianza, grado de 75

• intervalo de 74 • para diferencia de medias 81 • para diferencia de proporciones 90 • para media 76 • para proporción 89 • para razón de varianzas 98 • para varianza 94 • límites de 75

Continua, distribución de probabilidad 31 Contraste 108 Correlación, coeficiente de 185 Crítica región 111, 112 Crítico valor 111, 112

D Decisión, regla 112 Diferencia, entre dos medias 43, 81

• entre dos proporciones 48, 90 • intervalo de confianza para 81, 90

Dependientes, muestras 87

198

Derecha, prueba de hipótesis 111 Dispersión diagrama 171 Distribución, continua de probabilidad

• F de Fisher 63 • Ji-cuadrada 63 • normal 40 • t de Student 56

Dos colas, prueba de hipótesis 112

E Error, tipo I y tipo II 110

• en estimación de la media 91 • en estimación de la proporción 92

Estadística, hipótesis 109 • decisión 112

Estadístico 70 Estándar, desviación 19

• muestral 19 • poblacional 19

Esperado, valor 31, 40 Estimación, teoría de 70

• por intervalo 75 • puntual 70

Estimador • insesgado 72 • más eficiente 74 • consistente 75

F F, distribución de Fisher 63 Frecuencias distribución de 7,9

• relativas 9 • acumuladas 9

G Gauss, distribución de 33 Gosset W. S. 56 Grados de libertad 57

• en la F de Fisher 63 • en la ji-cuadrada 61 • en la t de Student 56

H Hipótesis alterna 109

• nula 109 Histograma, de frecuencias 10

199

I Independientes, muestras 81

• variables aleatorias 32 Intervalo, estimación por 81 Izquierda, prueba de cola 112

L Lineal, regresión 167

• inferencias para 176 • prueba de 177

M Más eficiente, estimador 74 Matemática, esperanza 32 Mediana 14 Media, de una muestra 13

• de una variable aleatoria 32 • error de estimación 91 • propiedades de 36

Método de mínimos cuadrados 168 Moda 14 Modelo de regresión lineal 169 Muestra 2

• media 13 • mediana 14 • tamaño de 91, 141 • varianza 16

Muestreo, distribución de 29 • diferencias de medias 48 • diferencias de proporciones 48 • una media 36 • una proporción 47 • una suma de variables 30 • observaciones pareadas 88

N Nivel de significancia 110 Normal, tabla de la 194

• área bajo la curva 194 • distribución de probabilidad 194 • estándar 194 • varianza de la 33 • variable aleatoria 33

Nula, hipótesis 109

P Parámetro 29

200

Pareadas, observaciones 88 • distribución muestral 29 • intervalo de confianza 88 • prueba de hipótesis 132

Población 2 Potencia de una prueba 141 Predicción 183

• intervalo para 183 Probabilidades, distribución de

• para una diferencia de medias 43 • para una diferencia de proporciones 48 • para una media 36 • para una proporción 47 • para una suma de variables 30

Proporción, distribución muestral para una 47 • estimación del error 92 • estimación puntual 71 • intervalo de confianza 89 • prueba de hipótesis 134

Pruebas de hipótesis 108 • coeficiente de correlación 186 • coeficientes de regresión 177, 178 • de dos colas 112 • diferencia de medias 122 • diferencia de proporciones 137 • de una media 113 • observaciones apareadas 132 • de una proporción 134 • para una razón de varianzas 153 • de una varianza 152

Puntual, estimación 70 • para diferencia de medias 71 • para diferencia de proporciones 71 • para una media 71 • para una proporción 71 • para una razón de varianzas 71 • para una suma de variables 71 • para una varianza 71

R Rango 8 Razón de varianzas 70 Regla de decisión 112 Regresión lineal simple 169 Relativa, frecuencia 9

S Simetría 57 Simple, regresión lineal 169

• ecuación de 171 • estimación de parámetros 173 • intervalos de confianza 177 • prueba de hipótesis 177

201

T T, distribución 56 Tipo I y tipo II, errores 110 Teorema de límite central 49 Tamaño de la muestra 91, 141

U Una cola, prueba de 111, 112

V Variable, aleatoria muestral 29

• diferencia de medias 43 • diferencia de proporciones 48 • media 36 • proporción 47 • razón de varianzas 63 • suma 30 • varianza 61

gutierrez gonzalez estadistica

Documents