libro de estadistica

276
Fernando Alberto González Cáceres

Upload: ruddy-sanchez-campos

Post on 18-Jul-2015

923 views

Category:

Engineering


8 download

TRANSCRIPT

Page 1: Libro de estadistica

Fernando Alberto González Cáceres

Page 2: Libro de estadistica

1

La elaboración de esta pequeña guía de apuntes se ha caracterizado por la compañía que

me ha dado a lo largo de seis años que di comienzo a escribirla, son muchos los aportes de mis

alumnos a lo largo del tiempo, es un recopilación de temas que con el transcurrir de los días se

fueron mejorando en las aulas de clase, con la lectura de muchos autores y con la tesonera

resolución de ejercicios en cada uno de los términos y semestres que he compartido con todos

ustedes.

Es por ello que la dedico a los que han hecho posible su elaboración y a los que permitirán

su corrección.

A mi Dios Todo Poderoso A mi Familia, Especialmente al Dr. Virgilio Cáceres (Q.e.p.d)

A mis Alumnos

Esta primera aproximación será el inicio de muchos intentos por seguir dando material

escrito para todas aquellas personas que a bien tengan su uso, por muchas revisiones, siempre se

pasan algunos, espero me lo hagan saber, pues ellos son los que en definitiva nos mueven cada

día a hacer mejor las cosas, me refiero a los errores.

Agradezco a Dios por permitirme estar con todos ustedes, a mis padres por esa formación que me han dado, a mi esposa Liz por la paciencia, a mis dos hijos Luís y Sebastián Fernando, motivo de permanente superación, a mi familia, a mis amigos, a mis compañeros de Trabajo, a la Universidad Nacional Experimental de la Fuerza Armada, a todos Mis Alumnos son ustedes el motivo inspirador de esta publicación.

Mil Gracias a Todos.

Fernando

Page 3: Libro de estadistica

2

PRESENTACION

La matemática ha sido considerada, durante mucho tiempo, como una ciencia exacta. Esto

se refleja en la enseñanza de la misma en todos los niveles educativos, en donde se pone fuerte

énfasis en la exactitud de los resultados.

De esta manera, los problemas en los que no es posible obtener resultados exactos van

quedando fuera. El pensamiento determinista ha sido y es el eje de acción de toda la matemática,

por lo cual ha quedado siempre asociado, en nuestro medio social, a la certidumbre y exactitud de

los resultados.

De esto se desprende la necesidad de dar cabida al pensamiento no determinista

(probabilista) ya que toda actividad humana está asociada a cierto grado de incertidumbre frente a

la cual hay que tomar decisiones.

Se hace necesario, entonces, mostrar que los modelos teóricos de la Matemática actuando

en la realidad dan aproximaciones de ella. De esta manera, debemos reconocer que en la práctica

cotidiana se hacen aproximaciones y que el error en los resultados finales puede ser acotado pero

no evitado. Por ejemplo, cuando se realiza una medición, el valor que se obtiene es una

aproximación de la medida: basta con realizar una experiencia y observar que si se mide varias

veces el mismo objeto, los resultados que se obtiene tienen variaciones.

La estadística y la probabilidad comienzan a desarrollarse en distintos momentos y

separadamente. En un comienzo la estadística se inicia vinculada a la recolección de datos del

estado: por ejemplo, interesaba conocer la población, la cantidad de habitantes, los recursos

disponibles, las cosechas, etcétera. Los gobernantes necesitaban saber con cuántos hombres

contaban para la guerra, cuánto impuesto podían exigir a sus contribuyentes. Así, ejemplos de

censos aparecen desde miles de años atrás; tal vez el ejemplo más conocido es el que aparece en

la Biblia, cuando el nacimiento de Cristo hace 2000 años, pero se encuentran datos de censos o

recuentos anteriores.

Los primeros estudios de probabilidad surgen vinculados con los juegos de azar; es

posible que esta sea una de las razones por la cual su desarrollo matemático se haya demorado.

Existen vestigios de juegos de azar en muchas comunidades ya que es una actividad que atrajo

siempre el interés del hombre tanto como actividad lúdica como para predecir el futuro.

La incorporación de la estadística y la probabilidad dentro de los pensum de estudios en el

nivel universitario es de vieja data, pero su trabajo en el aula, como un aspecto importante de la

Page 4: Libro de estadistica

3

educación matemática del alumno, aun no se ha logrado suficientemente, a pesar de la

importancia de la misma para decodificar la información que se nos presenta del mundo actual.

Estamos en permanente contacto con datos estadísticos: basta con abrir un diario y observar la

información que allí se brinda; se realizan encuestas previas a las elecciones y encuestas a

consumidores, se proporcionan datos del tiempo, así como comentarios estadísticos en los

deportes, entre otros. Es por esto la importancia de la asignatura, ya que un profesional de la

Ingeniería debe estar en capacidad, no solo de conocer sino de poder leer correctamente esta

información e interpretarla adecuadamente.

La enseñanza de la estadística y la probabilidad debe estar estrechamente vinculada con el

accionar diario de nuestros alumnos: por ello, los ejemplos y las actividades deben estar de

acuerdo a sus intereses y al momento que se vive. Es necesario que quienes egresen como

ingenieros estén en condiciones de comprender y apreciar datos estadísticos que aparecen no solo

en los distintos medios de comunicación, sino de que manera se debe organizar, presentar y

analizar información útil para la toma de decisiones.

El texto que se presenta para la enseñanza de la probabilidad y la estadística, más que

cumplir con el objetivo de los contenidos programáticos de la asignatura que se dicta en el tercer

semestre del Ciclo Básico de Ingeniería de la Universidad Nacional Experimental de la Fuerza

Armada, se fija otros no mas importantes, pero de seguro fortalecerán el proceso de aprendizaje

de nuestros alumnos, en el se hace énfasis del papel que juega la estadística en nuestra sociedad.

Se resalta la utilidad de la estadística en otras ciencias, la importancia de ella para la toma

de decisiones, como interpretar correctamente datos estadísticos que aparecen diariamente en

nuestro entorno, así como los que aparecen en medios de comunicación, la relación que existe

entre la estadística y la probabilidad.

Cuando se hace referencia al estudio de la probabilidad se da a conocer el significado de

lo que es un Fenómeno, un experimento aleatorio, cuándo se está en presencia de una situación

cuyo resultado es incierto y la interpretación de ella muchas veces no es clara y lleva a una

interpretación errónea.

La existencia de vocablos de uso corriente, vinculados al tema, de los cuales no siempre

los alumnos conocen correctamente su significado e incluso, en algunos casos, pueden utilizar

unos por otros, por ejemplo: seguro, posible, imposible, probable. La fuerte vinculación de la

probabilidad a los juegos, se resalta en el mismo, es por ello que este texto además puede ser

utilizado como libro no solo de los Alumnos Cursantes de la Asignatura; sino también de

cualquier otra persona interesada en la materia, como material de consulta.

Page 5: Libro de estadistica

4

ÍNDICE GENERAL

Estadística Descriptiva

Mapa Conceptual de la Probabilidad y Estadística

Clasificación de la estadística…………………………………………………………….

Definición de términos básicos…………………………………………………………..

Usos de la estadística……………………………………………………………………..

El símbolo de la sumatoria……………………………………………………………….

Ordenación u Organización de los datos………………………………………………….

Redondeo de datos…………………………………………………………………………

Distribución de Datos

Datos directos……………………………………………………………………………….

Datos agrupados en intervalos de clase……………………………………………………..

Representación grafica………………………………………………………………………

Escala de medida …………………………………………………………………………….

Problemas propuestos de agrupación de datos……………………………………………….

Medidas de Tendencia Central

La media o valor esperado……………………………………………………………………

La moda………………………………………………………………………………………

La mediana……………………………………………………………………………………

Aplicaciones de las medidas de tendencia central…………………………………………….

Relaciones entre las medidas de tendencia central. …………………………………………..

Medidas de tendencia central secundarias……………………………………………………

Medidas de Posición

Percentiles………………………………………………………………………………………

Deciles………………………………………………………………………………………….

Quartiles………………………………………………………………………………………..

Rangos percentiles………………………………………………………………………………

Desviación cuartil………………………………………………………………………………

Page 6: Libro de estadistica

5

Medidas de la Dispersión de la Distribución

Rango………………………………………………………………………………………

Desviación estándar……………………………………………………………………….

Varianza……………………………………………………………………………………

Desviación media…………………………………………………………………………..

Coeficiente de variación de Pearson………………………………………………………

Medidas de Forma

Asimetría……………………………………………………………………………………

Curtosis……………………………………………………………………………………..

Problemas propuestos de medidas Estadísticas……………………………………………….

Introducción a las Probabilidades

Conceptos Básicos de Probabilidad

Probabilidad………………………………………………………………………………….

Fenómeno y tipos de fenómenos……………………………………………………………..

Espacio muestral……………………………………………………………………………..

Eventos……………………………………………………………………………………….

Relación de eventos…………………………………………………………………………..

Operación con eventos……………………………………………………………………….

Combinación de eventos……………………………………………………………………..

Probabilidades

Definición de Probabilidad como Frecuencia

Idea Intuitiva de probabilidad………………………………………………………………..

Regla de LAPLACE………………………………………………………………………….

Definición axiomática de probabilidad……………………………………………………….

Propiedades básicas de la probabilidad……………………………………………………….

Eventos y sus probabilidades………………………………………………………………….

Métodos de enumeración……………………………………………………………………...

Ejercicios propuestos de cálculo de probabilidades…………………………………………..

Page 7: Libro de estadistica

6

Probabilidad Condicional

Introducción a la Probabilidad Condicional……………………………………………

Tablas de contingencia y diagramas de árbol………………………………………………

Partición de un espacio muestral ………………………………………………………….

Teorema de la probabilidad total………………………………………………………….

Teorema de Bayes………………………………………………………………………….

Ejercicios propuestos de probabilidad condicional y probabilidad total…………………..

Variable Aleatoria

Discreta

Función de probabilidad…………………………………………………………………

Función de distribución………………………………………………………………….

Parámetros de la variable………………………………………………………………..

Continua

Función de densidad……………………………………………………………………..

Función de distribución…………………………………………………………………..

Parámetros de la variable………………………………………………………………...

Ejercicios propuestos de variable aleatoria………………………………………………

Distribución de Probabilidad

Discreta

La Distribución Binomial…………………………………………………………………

La Distribución de Poisson………………………………………………………………..

La Distribución Geométrica……………………………………………………………….

La Distribución Hipergeométrica………………………………………………………….

Ejercicios propuestos de distribución de probabilidades discretas……………………….

Continua

La Distribución Normal……………………………………………………………………

La Distribución Gamma……………………………………………………………………

La Distribución Exponencial ………………………………………………………………

La Distribución Chi-cuadrada……………………………………………………………..

La Distribución T de Student………………………………………………………………

Page 8: Libro de estadistica

7

La Distribución Beta …………………………………………………………………….

La Distribución Weibull…………………………………………………………………

La Distribución F de Snedecor…………………………………………………………..

Ejercicios propuestos de distribución de probabilidades continuas……………………..

Estadística Inferencial

Introducción a la Estadística Inferencial

Objetivo de la estadística…………………………………………………………………..

Estadística inferencial………………………………………………………………………

Parámetros y estadísticos…………………………………………………………………..

Función de parámetros y estadísticos……………………………………………………..

Uso de estadísticos para estimar parámetros………………………………………………

Símbolos estándar………………………………………………………………………….

Muestreo aleatorio simple………………………………………………………………….

Distribuciones muéstrales y el teorema central del limite. ………………………………..

Concepto de distribución de muestreo…………………………………………………….

Media………………………………………………………………………………………

Varianza……………………………………………………………………………………

Desviación típica o estándar……………………………………………………………….

Distribución Muestral de Medias

Muestreo con reemplazamiento……………………………………………………………

Muestreo sin reemplazamiento…………………………………………………………….

El teorema del límite central……………………………………………………………….

Propiedades de los estimadores y estimación puntual……………………………………..

Definición de estimador……………………………………………………………………

Definición de estimación…………………………………………………………………..

Criterios para seleccionar un buen estimador……………………………………………...

Cualidades de un buen estimador…………………………………………………………..

Búsqueda del mejor estimador…………………………………………………………….

Tipos de estimación………………………………………………………………………..

Definición de estimación puntual………………………………………………………….

Desventajas de las estimaciones puntuales………………………………………………....

Definición de estimación de intervalo…………………………………………………….

Page 9: Libro de estadistica

8

Estimador sesgado e insesgado……………………………………………………………

Estimación por Intervalos

Intervalos de confianza para la media con σ conocida…………………………………...

Intervalos de confianza para la media con σ desconocida………………………………..

Intervalos de confianza para la diferencia entre dos medias con σ conocida…………….

Intervalos de confianza para la diferencia entre dos medias con σ desconocida…………

Intervalos de confianza para la proporción de la población………………………………

Intervalos de confianza para la diferencia entre dos proporciones…………………………

Intervalos de confianza para la desviación Standard............................................................

Ejercicios Propuestos……………………………………………………………………….

Pruebas de Hipótesis Paramétricas

Introducción ………………………………………………………………………………..

Pasos básicos de la prueba de hipótesis con el método de valor crítico……………………..

Errores Tipo I y Tipo II en pruebas de hipótesis……………………………………………..

Para la media con varianza poblacional conocida……………………………………………

Para la media con varianza poblacional desconocida………………………………………..

Para la diferencia entre medidas con varianzas poblacionales conocidas…………………..

Para la diferencia entre medias con varianzas poblacionales desconocidas…………………

Para la proporción de la población…………………………………………..………………

Para la diferencia entre dos proporciones poblacionales…...........………………………….

Para Varianzas poblacionales…...........…………………………............................................

Ejercicios propuestos………………………………………………………………………….

Variable Aleatoria Bidimensional

Variables Estadísticas Bidimensionales

Distribuciones de frecuencias………………………………………………………………..

Representaciones gráficas……………………………………………………………………

Parámetros estadísticos de la v. a. bidimensional……………………………………………

Regresión lineal......................................................................................................................

Correlación lineal. ……………………………………………………………………………

Ejercicios resueltos……………………………………………………………………………

Ejercicios propuestos………………………………………………………………………….

Page 10: Libro de estadistica

9

ESTADÍSTICA

Conceptos

Básicos

Estadística

Descriptiva

Población Muestra

PROBABILIDAD

Conceptos Básicos

Distribuciones de

Probabilidad

Distribuciones en

el Muestreo

Desigualdad de Tchebysheff,

Ley de los grandes Números,

Teorema Central del Límite.

INFERENCIAL

Estimación

Prueba de Hipótesis

para una y dos

poblaciones

Parámetro Estimador

Discretas Binomial,

Poisson, otras.

Continuas, Normal,

Exponencial, Chi-

cuadrado, T de

Student, otras.

Student

Puntual Por intervalos

Distribución de

Frecuencia

Tendencia

Central Dispersión

Forma

Posición

Page 11: Libro de estadistica

10

ESTADISTICA

Estudia eventos reales Obtiene datos numéricos

Recopilar

Clasificar CONCLUSIONES

ESTADISTICA Presentar → =============

(Método científico). Analizar LOGICAS

Interpretar

Descriptiva (describe características)

ESTADISTICA

(Clasificación) Inferencial (infiere dentro de límites probables)

Infinitas Probabilísticas

POBLACION MUESTRA (El todo) Finitas (La parte) No Probabilísticas

PARAMETROS ESTADISTICOS (Medidas de la población) (Medidas de la muestra)

= Media Aritmética X = Media Aritmética

= Desviación Standard S = Desviación Standard

DATO ========= Característica Medible

Cualitativas. Indican alguna propiedad

(Atributos) de los hechos observados

MEDIDAS

Cuantitativas. Las cualidades toman

(Variables) distintos valores

Continúas (sin interrupciones)

VARIABLES

(Valores que puede tomar) Discretas (con interrupciones)

Page 12: Libro de estadistica

11

La Estadística es la disciplina de las matemáticas que se refiere a los métodos de

recolección, clasificación, presentación, de Información para el análisis e interpretación de un

conjunto de datos para la toma de decisiones. Se divide en:

Estadística Descriptiva

Estadística Infencial o Inferencia Estadística

Estadística Descriptiva – Aquellos métodos que incluyen la recolección, presentación y

caracterización de un conjunto de datos con el fin de describir apropiadamente las diversas

características de ese conjunto.

Estadística Inferencial – Aquellos métodos que hacen posible la estimación de una

característica de una población o la toma de una decisión con respecto a una Población,

basándose sólo en los resultados de una Muestra.

Definición de Términos Básicos

Dato:

Números o medidas que han sido recopiladas como resultado de observaciones

Ejemplo: Numero de personas que son fanáticos de determinado equipo de Béisbol.

Caso:

Individuos sobre los cuales se va a tomar observaciones o variables.

Medición:

Consiste en asignar números a los objetos de acuerdo a determinadas reglas.

Población:

Conjunto completo de individuos, objetos o medidas que poseen una característica común

observable.

Ejemplo: los estudiantes de la UNEFA Núcleo Puerto Cabello.

Muestra:

Es una parte o un subconjunto de una población.

Ejemplo: los estudiantes de Ingeniería Naval de un semestre cualquiera.

Parámetro:

Es una medida obtenida a partir de las observaciones de una población.

Ejemplo: la Media de la Población.

Page 13: Libro de estadistica

12

Estadístico:

Es una medida obtenida a partir de las observaciones de una muestra.

Ejemplo: la Media de la Muestra.

Atributo:

Es una característica discontinua, es decir, solo puede manifestarse bajo una sola modalidad en

una variable cualitativa.

Ejemplo: El estado civil, el sexo, la nacionalidad y la profesión.

Variable:

Es una característica que puede manifestarse según dos o más modalidades.

Ejemplo: El peso, la estatura y la edad.

Variable cualitativa:

Cuando se describen cualidades o categorías de las mediciones realizadas.

Ejemplo: el color de los carros vendidos.

Variable cuantitativa:.

Cuando se suelen asignar cantidades a la representación de la variable.

Ejemplo: El numero de carros vendidos.

Tipos de variables Cuantitativas

Variables cuantitativas Discretas:

Son aquellas que representan mediciones dentro del conjunto de números enteros, es decir, son

valores puntuales y que entre ellos no pueden existir otros valores en la escala.

Ejemplo: el número de automóviles vendidos en un año.

Variables cuantitativas Continuas:

Son aquellas que expresan continuidad en dos valores puntuales.

Ejemplo: La longitud, la fuerza y la edad.

Tipos de Muestras

Muestras aleatorias simples:

Son aquellas que se obtienen de tal manera que cada individuo, objeto o medida de una población

tenga igual oportunidad de ser seleccionada.

Muestra estratificada:

Son aquella que se obtienen estratificando los elementos de la población en función de los

Page 14: Libro de estadistica

13

objetivos mismos del muestreo, para luego de cada estrato tomar muestras al azar simple, cuya

magnitud será proporcional a la parte que el estrato representa en toda la población. La

integración de todas estas muestras genera la muestra estratificada.

Mediciones cuantitativas:

Son aquellas que expresan dimensión o capacidad.

Mediciones cualitativas:

Son aquellas que expresan características, atributos, actitudes, etc. y no están representadas

numéricamente.

Unidad de observación:

Es un solo miembro de la población que se estudia.

El diseño de experimentos es útil para la toma de “buenas decisiones”, la utilización de un

modelo. Ayuda a:

- Obtener conclusiones de la Investigación Empírica usando Modelos Matemáticos

- Evaluar y juzgar discrepancia entre la observación y la teoría

- Tomar decisiones en condiciones de incertidumbre.

En un Estudio Estadístico hay que tener en cuenta:

- Objetivo: ¿Qué queremos hacer?

- Diseño: ¿Cuál es la forma apropiada?

- Recogida de datos: Conseguir información

- Análisis: ¿Qué dice la información?

- Descriptivo: Sobre la muestra

- Inferencial: Sobre la población

- Presentación de resultados: ¿Cómo se transmiten?

Utilidad de la Estadística, la estadística enseña a:

- Evitar sesgos

- Aprovechar mejor la información

- Ahorrar material y dinero

- Proporciona Métodos:

De recogida de datos

De codificación

De control de errores

De Análisis:

Page 15: Libro de estadistica

14

o Descriptivo: Resumen de datos mediante tablas y gráficos.

o Probabilístico: Estimación, contrastes y modelos para la toma de decisiones

¿Quienes usan la Estadística?

• Organismos oficiales.

• Diarios y revistas.

• Políticos.

• Deportes.

• Marketing.

• Control de calidad.

• Administradores.

• Investigadores científicos.

• Médicos

• etc.

Estadística en Administración y Economía

• En una Industria, se hace inspección de los artículos comprados como materia prima. Se debe

entonces contar los artículos defectuosos en el lote comprado.

• En una Industria, se deben llevar registros de la producción, tanto en volumen como en calidad.

• En un estudio de mercado, se toma una muestra de clientes y se pide la opinión de las personas

acerca de las calidades de cierto producto.

• El comerciante detallista debe decidir cada día la cantidad de unidades de artículos perecederos

que debe encargar para el día siguiente. Para ello, debe observar las ventas de artículos, los costos

en que se incurre por quedar con un remanente almacenado, los costos por no satisfacer

completamente la demanda.

Estadística en el Gobierno

• Se recopilan datos sobre población, educación, comercio exterior, impuestos, etc.

• Se usa para la planificación adecuada de las políticas orientadas a la satisfacción de las

necesidades de los ciudadanos.

Los datos también los pueden utilizar:

– Inversionistas Nacionales (negocios)

– Inversionistas Extranjeros

– Instituciones Internacionales

Page 16: Libro de estadistica

15

Estadística en las Ciencias Sociales

• Encuestas de opinión pública: temas de actualidad, “pulso político”, intenciones de voto.

• Generalmente, los resultados que presenta la prensa están basados en estadísticas simples

(cálculos de frecuencias, medias, gráficos de barras o circulares), como las que veremos en este

curso.

Estadística en la Educación

• Un Educador puede dar seguimiento al rendimiento de sus estudiantes mediante los registros de

notas a través del tiempo junto con información familiar, social, etc.

• Si se quiere estudiar los factores que pueden haber influido en las pruebas de sexto grado

realizadas por el Ministerio de Educación, se podría aplicar un cuestionario con preguntas de

selección única tratando de discernir cuales elementos pueden ser tomados en cuenta.

Estadística en las Ingenierías

• Los análisis de Control de Calidad necesitan de la obtención de información acerca de los

productos que son fabricados o de los servicios que se brindan.

• Muchas veces, en el caso de fabricación de productos, se toman muestras y éstas deben pasar

una serie de exámenes de resistencia, durabilidad, etc.

Page 17: Libro de estadistica

16

El Símbolo de la Sumatoria ( )

Sea un conjunto de n valores para una variable x. Entonces, el símbolo

n

ii

x1

, significa que los n

valores se tienen que sumar juntos. O sea,

n

ini

xxxxx1

321....

Ejemplo 1. Supóngase que se tienen las seis observaciones siguientes para la variable x:

x 1 = 2 , x 2 = 5 , x 3 = 0 , x 4 = - 1 , x 5 = 6 , x 6 = 4 , entonces;

6

1654321

ii

xxxxxxx = 2 + 5 + 0 + (-1) + 6 + 4 = 16

Nota: no es lo mismo la suma de los valores cuadrados de x, que la suma de los valores de x al

cuadrado. O sea,

n

i

n

iii

xx1

2

1

2

En el caso del ejemplo 1, la suma de los valores cuadrados de x sería,

6

1

2

6

2

2

2

1

2......

ii

xxxx

82163610254)4()6()1()0()5()2(x 2226

1i

2222

i

Por otro lado, el cuadrado de la suma de x sería,

82256totanloPor;256)16(x 2

26

1i

i

En muchas ocasiones estamos interesados en la suma del producto de dos variables.

Sean x , y dos variables que poseen n observaciones respectivamente. Entonces,

n

inni

yxyxyxyx1

22111......

Page 18: Libro de estadistica

17

Ejemplo 2. Sea y una variable con los valores siguientes: y1 = 1, y2 = 3, y3 = 2

y4 = -2 , y5 = 5 , y6 = 10. Entonces, utilizando los valores del ejemplo 1 para la variable x

obtendremos,

6

16622111

......i

iyxyxyxyx

6

1i

ii )10(4)5(6)2)(1()2(0)3(5)1(2yx = 2 + 15 + 0 + 2 + 30 + 40 = 89

Nota:

n

i

n

ii

n

iiii

yxyx1 11

Del Ejemplo 1, x = 16 mientras que y = 19, por lo tanto: (x) (y) = (16)(19) = 304, Donde

89 304.

Reglas Básicas para las Operaciones con Sumatoria

Regla 1: la sumatoria de la suma de los valores de las variables x & y es igual a la suma de las

sumatorias de los valores de las variables individuales.

n

i

N

I

N

IIIII

YXYX1 1 1

)(

Ejemplo 3:

Sean x 1 =2, x 2 = 5 , x 3 = 1, x 4 = 2 ; y1 = 0, y 2 = 3, y 3 = 1, y 4 = 5

4

1i

)II 197282)52()11()35()02(yx(

4

1I

4

1I

iI 19910yx

Regla 2: La sumatoria de la diferencia de los valores de las variables x & y es igual a la

diferencia de las sumatorias de los valores de las variables individuales.

n

i

n

i

n

iiii

yxyx1 1 1

1)(

Page 19: Libro de estadistica

18

Utilizando los datos del ejemplo 3, tendremos:

4

1i

ii 1)52()11()35()02()yx(

4

1I

4

1I

iI 1910yx

Regla 3: La suma del producto de una constante k multiplicada por una variable x, es igual a la

constante multiplicada por la sumatoria de la variable.

n

1I

n

1I

iI )x(k)x(k

Ejemplo 4: Sea k = 2 y sean x 1 = 3, x 2 = 6, x 3 = 10

3819210632)x(2)x(2)x(k3

1I

3

1I

i

3

1i

iI

Regla 4: la suma de una constante tomada la constante n veces, será igual al producto de n veces

el valor de la constante.

n

1i

knk

Ejemplo 5: sea k = 5 sumado 6 veces, entonces:

6

1i

30555555k ; 3056kn

Page 20: Libro de estadistica

19

Ordenación u Organización de los Datos

En estadística es de suma importancia que los datos recogidos de la fuente de información

estén ordenados, ya que la posición que cada uno de ellos ocupa en la serie de datos, nos

permiten analizar ciertas medidas cuantitativas de la muestra.

Los métodos que se conocen para la ordenación de los datos que mas se utilizan son

ordenación de forma creciente o decreciente.

Ejemplo.

Orden creciente:

1.37 - 1.38 – 1.40 – 1.42 – 1.49 – 150 - 1.51 – 1.54 – 1.58 – 1.62

Orden decreciente:

1.62 – 1.58 - 1.54 - 1.51 – 1.50 – 1.49 – 1.42 – 1.4 – 1.38 – 1.37.

Redondeo de los datos

Los Datos en ocasiones, cuando el estudio lo permite deben ser redondeados, es más

sencillo trabajar con números enteros.

Redondeo de cantidades.

a. Cuando el dígito que se desea redondear es < 5.

Ejemplo: 125,211 = 125

12,42 = 12

460,33 = 1460

b. Cuando el dígito que se desea redondear esta seguido

De otro > 5.

Ejemplo: 68,65 = 69

155,70 = 156

1460,85 = 1461

c. Cuando el dígito que se desea redondear esta seguido del

Dígito 5.

Ejemplo: 0,5 = 0 (defecto) ; 2,5 = 2 (defecto)

0,5 = 1 (exceso) ; 2,5 = 3 (exceso)

Estos criterios son validos para redondear decenas y centenas.

Page 21: Libro de estadistica

20

Distribución de Datos

Distribución de frecuencias por datos directos

Este método se debe aplicar para un número de datos que no exceda los 30

X: Es la letra que identifica a la variable (puntuaciones, edades, tallas, salarios, etc.), y representa

a cada uno de los valores que esta toma.

fo : Son las frecuencias ordinarias absolutas y representa él numero de veces que un dato se

repite.

FA: Son las frecuencias acumuladas absolutas y representa él número de datos comprendidos

entre dos valores dados, uno de los cuales es el inferior real (Li) de toda la distribución.

fro : Son las frecuencias ordinarias relativas e indican el porcentaje que representan los datos de

una casilla determinada con relación al total de datos (n). La suma de las fro debe ser igual al

100%.

FrA: son las frecuencias acumuladas relativas y representan el porcentaje de casos ubicados entre

el extremo inferior (Li mínimo) de la distribución y un valor superior.

Distribución de Frecuencias por datos agrupados en intervalos de clase

Este método se emplea cuando él numero de datos por lo general exceden de 30 y los

valores de una serie se encuentran muy distanciados entre sí. Entonces es conveniente agruparlos

en intervalos de clase. Permitiendo esto simplificar el manejo de los datos.

Los datos se ordenan en clases o categorías, estas clases o categorías están formadas por

dos límites, uno inferior y uno superior, en cada una de las clases se ubican los valores o datos de

la serie comprendidos entre sus respectivos límites. Finalmente, se determinan todos los

elementos de una distribución, iniciándolos en una tabla de frecuencias, la cual debe comprender:

las clases, las frecuencias ordinarias, las frecuencias acumuladas, las frecuencias relativas

ordinarias, las frecuencias relativas acumuladas y los puntos medios o marcas de clase.

Para organizar los datos en una distribución, se puede utilizar indistintamente: los límites

aparentes, los límites reales, los límites completos o abiertos.

En este curso elaboraremos las tablas haciendo uso de los límites completos o abiertos.

Page 22: Libro de estadistica

21

Intervalo de Clase, se define como el conjunto de datos que se encuentran ubicados entre

dos límites establecidos.

Elementos de un intervalo de clase:

Xi, Xs, son los límites aparentes del intervalo (inferior y superior), respectivamente.

Li, Ls, son los límites reales del intervalo (inferior y superior), respectivamente.

Ic, es la Amplitud del intervalo (cantidad de valores cubiertos por el intervalo).

Xm o X

, Marca de Clase o Punto Medio, es el Punto Medio del intervalo (valor que esta situado

a igual distancia de los extremos del intervalo). Para calcular el punto medio de un intervalo de

clase, se utiliza la formula siguiente:

22,

LsLiXiXsXmX

At o R, Amplitud Total o Recorrido, es la Amplitud de la distribución (cantidad de valores

cubiertos por la distribución), y se obtiene, si se conocen los Valores tanto inicial como final o

Superior de la distribución, mediante la ecuación:

At o R = Vs - Vi

Vi = Valor Inferior de la muestra , Vs = Valor Superior de la muestra

Valor real de un número

VR =VA + P VA = Valor Aparente; P = Porción

La media unidad por debajo es el Límite Inferior (Li).

La media unidad por encima es el Límite Superior (Ls).

La porción es igual a 0,5 para cantidades exactas.

La porción es igual a 0,05 para cantidades de un decimal.

La porción es igual a 0,005 para cantidades de dos decimales.

Page 23: Libro de estadistica

22

Ejemplo

Si tenemos una serie de datos que corresponden a las notas finales de 50 alumnos de una

asignatura en cuestión:

58-37-51-21-48-29-51-39-60-59-48-70-59-32-43-31-57-40-51-40-18-31-92-15-69-46-60-65-10-

43-41-44-56-67-49-19-43-30-63-18-59-64-52-61-10-51-73-16-74-71.

Ordenando en forma creciente tenemos:

10-10-15-16-18-18-19-21-29-30-31-31-32-37-39-40-40-41-43-43-43-44-46-48-48-49-51-51-51-

51-51-52-56-57-58-59-59-60-60-61-63-64-65-67-69-70-71-73-74-92

Si tomamos un intervalo de clase (Ic) de 10 y hacemos uso de los límites Reales de clase,

calcularemos los Ls como el Li + Ic tenemos:

Ni Li Ls Xm fo FA fro FrA

1 10 20 15 7 7 14 14

2 20 30 25 2 9 4 18

3 30 40 35 6 15 12 30

4 40 50 45 11 26 22 52

5 50 60 55 11 37 22 74

6 60 70 65 8 45 16 90

7 70 80 75 4 49 8 98

8 80 90 85 0 49 0 98

9 90 100 95 1 50 2 100

50

Cuando trabajamos con esta clase de límites, debemos ser muy cuidadosos al incorporar

cada dato dentro de su clase respectiva, por ejemplo al incorporar los valores 40-60-70 de la

serie, surge una pregunta debemos hacerlo para el 40 en la 3 o en la 4, bueno como estamos

trabajando con límites abiertos los valores de los Ls no pertenecen al intervalo y por consiguiente

el respectivo valor será tomado en cuenta en el intervalo siguiente.

Lo mismo sucede con los restantes valores. De existir un valor con el numero 100, este

deberá ser tomado en cuenta en un intervalo superior, y al no existir otro intervalo lo debemos

crear, para que dicho numero sea contenido en el.

Page 24: Libro de estadistica

23

Métodos a Ser Empleados Para Elaborar la Tabla de Distribución de Frecuencias

Método Empírico

Ni = Cualquier valor comprendido entre 6 y 15 Ic

RoANi t

Método Científico o Formula de Sturges

Logn

AIc t

322,31 ;

Ic

ANi t Donde:

Ni = Numero de intervalos de clase

At = Amplitud total o Recorrido = X mayor – X menor

n = Numero de datos de la serie

Ic = Amplitud del intervalo o Intervalo de Clase

REPRESENTACION GRAFICA

Diagrama de Barras o Polígono de Frecuencias

Se construye en un plano cartesiano, colocando en el eje de las ordenadas (Y) las

frecuencias ordinarias absolutas (fo), y en las abscisas (X) los datos X, si la distribución es por

datos directos, si es por datos agrupados se toman los puntos medios (Xm).

Se recomienda usarlo para datos que provengan de una variable discreta.

Histograma de Frecuencias

Señala la frecuencia ordinaria absoluta correspondiente a cada intervalo de clase por

medio de rectángulos cuya altura es la frecuencia del intervalo (fo) en el eje de las ordenadas (Y),

y la base, esta representada por el intervalo completo (Li – Ls), en el eje de las abscisas (X). Se

debe usar para datos que provengan de una variable continua.

Page 25: Libro de estadistica

24

Ojiva de Galton o Curva Acumulativa

Esta curva señala la frecuencia acumulada correspondiente a cada uno de los intervalos

de clase, en el eje de las ordenadas se coloca las FA o las FrA, en las abscisas los limites reales

superiores (Ls).

Diagrama Circular o en Pastel

Se emplea normalmente para representar distribuciones de razones. La circunferencia

representa la suma del conjunto de la distribución de razones (100%). Para construirla se

multiplica cada porción por 360° (grados de una circunferencia), obteniéndose él número de

grados correspondiente a cada componente. Los grados para cada porción se cuentan en el

sentido de las agujas del reloj en forma sucesiva.

[150,160)

[160-170)

[170-180)

[180,190)

[150,160)

[160-170)

[170-180)

[180,190)

Page 26: Libro de estadistica

25

Escala de Medida.

Los datos estadísticos por lo general provienen de la medida de una o más variables,

dependiendo de la medición y de la esencia de la variable, se obtienen diversas clases de datos

que originan diferentes escalas de medidas. Resulta sumamente importante conocer el tipo de

escala que representan los datos, debido a que, de su esencia depende la técnica estadística que

más se adapta para su análisis.

Escala Nominal.(altos, bajos – normales anormales)

Representa el nivel más bajo de medida. Se utiliza cuando un objeto o evento se

diferencia de otro solamente por la nominación que se conoce. Los procedimientos estadísticos

que más se adaptan, son: Chi-cuadrado, Coeficiente phi, Coeficiente de contingencia, Prueba del

signo, Prueba binomial.

Escala Ordinal. (Estudiantes rendimiento)

Estas escalas distinguen los diferentes valores de la variable, ubicando a los eventos en

orden desde lo mas alto a lo mas bajo. Los procedimientos estadísticos que más se adaptan son:

coeficiente de correlación de Spearman, coeficiente tau de Kendall, prueba de la mediana.

Escala de Intervalos. (a-b,b-c, Comparaciones)

En esta escala se puede indicar la cantidad en la que un evento se diferencia de otro. Esta

escala posee todas las características de una escala nominal y una ordinal y además esta basada

en intervalos iguales.

Escala de Razón. (Contiene todas las escalas)

Es la más potente o sofisticada de las cuatro escalas de medida. Su empleo permite señalar

en cuantas veces es más grande un objeto que otro y además indica la cantidad en que se

diferencian. Esta contiene las características de las otras escalas y dispone de un cero absoluto, lo

cual posibilita las operaciones aritméticas. Para la escala de intervalos y razón

Se recomienda los procedimientos estadísticos: Correlación de pearson, t de student, análisis de

regresión, análisis factorial, análisis discriminante.

Page 27: Libro de estadistica

26

EJERCICIO RESUELTO

En un estudio realizado en varias empresas del sector aduanero se determinaron los

salarios promedio diarios que devengan los trabajadores en diferentes departamentos para tal fin

se estudiaron 30 empresas y se obtuvieron los siguientes datos:

5000 5050 5100 5125 5150 5200 5223 5270 5300 5315 5325 5390 5400

5415 5425 5450 5475 5480 5500 5515 5520 5525 5550 5575 5580 5595

5892 5910 6050 6065 6100 6125 6130 6150 6175 6200 6225 6250 6265

6270 6275 6300 6320 6345 6350 6375 6390 6400 6430 6435 6450 6465

6475 6500 6520 6525 6540 6550 6575 6600 6620 6635 6640 6645 6650

6690 6700 6750 6784 6820 6825 6850 6875 6900 6925 6950 6975 6980

6985 7000

Elabore la tabla de distribución de frecuencias en función al número de intervalos

establecidos por los criterios vistos anteriormente.

Vamos a elaborar la tabla de distribución en 10 intervalos de clase (método empírico),

para ello tenemos como Valor Mayor = 7000, y Valor Menor = 5000

La Amplitud total o recorrido (At) = 7000 – 5000 = 2000

La Amplitud del intervalo (Ic) = 2000/10 = 200, Procedemos a llenar la tabla.

Ni Li Ls Xm fo FA fro FrA

1 5000 5200 5100 5 5 6.25 6.25

2 5200 5400 5300 7 12 8.75 15

3 5400 5600 5500 14 26 17.5 32.5

4 5600 5800 5700 0 26 0 32.5

5 5800 6000 5900 2 28 2.5 35

6 6000 6200 6100 7 35 8.75 43.75

7 6200 6400 6300 12 47 15 58.75

8 6400 6600 6500 12 59 15 73.75

9 6600 6800 6700 10 69 12.5 86.25

10 6800 7000 6900 10 79 12.5 98.75

11 7000 7200 7100 1 80 1.25 100

80

Recuerde que los datos deben estar ordenados y de ser posible redondeados.

Es de hacer notar que se agrego un intervalo, ya que el ultimo valor coincidía con el límite

superior de la tabla de distribución, también es importante resaltar que los valores que coinciden

con los límites superiores son tomados en el intervalo siguiente, las graficas se harán tomando en

cuenta la recomendación dada en clase.

Page 28: Libro de estadistica

27

Ejercicio Práctico

Dada la siguiente serie de datos, representativa de un proceso estadístico cualquiera.

5094-5326-5382-5456-5491-5112-5192-5219-5248-5277-5292-5527-5546-5585-5739-5692-

5719-5824-5865-5897-5924-4950-4987-5024-5094-5935-5962-5989-6012-6045-5135-5165-

6086-6114-5406-5426-6120-6250-5785-5819-5616-5645 5692-5049-5086

Datos Ordenados

4950-4987-5024-5049-5086-5094-5094- 5112- 5135 -5165- 5192-5219-5248-5277-5292-5326-

5382-5406-5426-5456-5491-5527-5546-5585-5616-5645-5692-5692-5719-5739-5785-5819-

5824-5865-5897-5924-5935-5962-5989-6012-6045-6086-6114-6120-6250

n = 45 datos

R o At = Vmayor-Vmenor = 6250 – 4950 = 1300

Método empírico: método que depende del estado de animo de la persona que esta realizando el

proceso estadístico, en este método nos dan como dato él numero de filas, para luego calcular el

intervalo de clase (Este se redondea siempre al inmediato entero superior).

Ni = Numero de filas = 9

Ic = R / # de filas = 1300 / 9 =

Elaboración de la tabla

Li Ls Xm fo FA fro FrA

Método Científico o de Sturges: Método matemático por excelencia, en el que mediante la

aplicación de una formula podemos calcular el Ic (Este se redondea en condiciones normales),

para luego calcular él numero de filas (Se lleva siempre al inmediato entero superior)

Formula de Sturges ---- Ic = R / (1 + 3,322xlogn)

Page 29: Libro de estadistica

28

Li Ls Xm fo FA fro FrA

Representación grafica

Esta se realiza de dos maneras:

1.- Polígono de Frecuencias: También denominado diagrama de líneas, para realizar este

colocamos en el denominado eje de las X a las marcas de clase y en el eje de las Y a las

frecuencias ordinarias.

Frecuencias

Ordinarias

Marcas de clase

Page 30: Libro de estadistica

29

2.- Histograma de Frecuencias: También denominada diagrama de barras, para realizar esta

colocamos en el denominado eje de las X a los límites de clases y en el denominado eje de las Y

a las frecuencias ordinarias.

Graficas comparativas de muestra

Simétrica Asimetría

Positiva

Asimetría

Negativa

Frecuencias

Ordinarias

Límites de clase

Page 31: Libro de estadistica

30

Problemas Propuestos

1.-Las edades de los estudiantes de un curso de informática son:

17-20—21-19-21-17-17-20-21-20-18-18-21-20-20-19-18-19-18-19-18-19-18-17-20-20-19-18-

17-18

Elaborar una tabla de frecuencias y represente los datos con un diagrama adecuado.

2.-A un grupo de 30 personas se les ha tomado el número de pulsaciones por minuto (ritmo

cardiaco) obteniéndose los siguientes resultados:

87-85-61-51-64-75-80-70-69-82-80-79-82-74-90-76-72-73-63-65-67-71-88-76-68-73-70-76-71-

86

3.-En una maternidad se han tomado los pesos (en kilogramos) de 50 recién nacidos:

2.8-3.2-3.8-2.5-2.7-3.0-2.6-1.8-3.3-2.9-2.9-3.5-3.0-3.1-2.2-2.4-3.4-2.0-2.6-3.12.9-2.8-2.7-3.1-

3.0-3.7-1.9-2.6-3.5-2.3-2.1-3.4-2.8-3.1-3.9-3.4-2.5-1.9-3.0-2.9-2.3-3.5-2.9-3.0-2.7-3.1-2.8-2.6-

2.9-3.3

Construya una tabla para datos agrupados con 6 intervalos y una amplitud de 0,.4 kg.

4.- Los datos siguientes corresponden a la medida en cms. De una muestra de productos tomados

en la compañía “X”. Realice una distribución de frecuencias sabiendo que Ni =10

1.50–1.51–1.12–2.14–2.50–3.42–3.00–9.16–5.50–10.50–13.20- 26.76–20.65-20.27–20.62–23.42

18.62–28.45–29.15–29.36

5.- Los siguientes datos corresponden a los pesos de los estudiantes de una Universidad, los pesos

están dados en libras. Construya una tabla de distribución de frecuencias, con I = 5.

110.12–114.78–118.16–119.23–120.05–124.35–126.77–128.36–130.50–134.32–137.16–143.18

135.50–140.50–145.17–149.77–150.50–153.62–154.61–156.38–158.15–159.45–160.50–159.66

115.25–128.30–135.50–148.65–160.25–155.70–118.60-123.10

6.-Dada la siguiente serie de datos, representativa de un proceso estadístico cualquiera. Elabore la

tabla de frecuencia haciendo uso del método científico, así como un polígono de frecuencias.

4950-4987-5024-5049-5086-5094-5094-5112-5135-5165-5192-5219-5248-5277-5292-5326-

5382-5406-5426-5456-5491-5527-5546-5585-5616-5645-5692-5692-5719-5739-5785-5819-

5824-5865-5897-5924-5935-5962-5989-6012-6045-6086-6114-6120-6250

7.- Los siguientes son salarios de los empleados de ciertas compañías del estado Carabobo,

elabore una tabla de frecuencias, y un histograma, tomando en cuenta los criterios vistos en clase.

8200-7500-7800-6900–7350-9260–9500–8700–8150-9620-10150–9400-9700–8625–7950–

8125–11000-10360–9650–9000-7800-8100-7350–9780-10750–11100–8525–9900-10780-

10150–11100–10365-8325-10200-10000.

Page 32: Libro de estadistica

31

Medidas de Tendencia Central

El hecho de tener los datos de una muestra, clasificados y presentados en una tabla de

distribución de frecuencias, haciendo uso de los métodos anteriormente vistos como son el

método Empírico o el de Sturges, no me da garantía alguna que me permita asegurar, que un

valor cualquiera de esa muestra sea él más representativo. Para ello es recomendado calcular unos

indicadores que nos expresen las características particulares de la muestra, uno de esos

indicadores son las llamadas medidas de tendencia central, también conocidas como valores

medios o medidas representativas, estas nos permiten apreciar de que manera los datos de una

muestra se agrupan o tienden a estar ubicados en el centro de la distribución ordenada.

Las medidas de tendencia central están relacionadas con el VALOR de la tendencia

central de una serie de datos ORDENADOS, denominadas también como promedios, y se define

como un valor representativo y predominante dentro de un conjunto de datos. Un promedio es

generalmente un valor ubicado en el centro de la distribución y no en el extremo.

Las medidas de tendencia central se clasifican en dos tipos:

Promedios Matemáticos: son aquellos que necesitan de una formulación matemática

inmediata para poder calcularlos, dentro de estos tenemos:

La Media o Promedio Aritmético Simple ( X ).

La Media o Promedio Aritmético Ponderado (p

X ).

La Media o Promedio Geométrico (G)

La Media o Promedio Armónico (H).

La Tasa de Crecimiento Geométrico o Formula de Interés Compuesto relación, (i).

Promedios no Matemáticos: son aquellos que necesitan de una formulación inicial para

después aplicar la formulación matemática, dentro de estos tenemos:

La Mediana (Xd o Md)

La Moda (Xo o Mo).

Con cada una de ellas se estudian característicos particulares de la muestra, las medidas de

tendencia central se calculan para datos directos (datos ordenados) y para datos agrupados

(colocados en tabla de distribución de frecuencias).

Page 33: Libro de estadistica

32

Calculo de las Medidas de Tendencia Central Para Datos Directos

La Media o Promedio Aritmético ).(X

De las medidas de tendencia central la media aritmética es la que con mayor frecuencia se

usa, y sirve para calcular otros estadísticos. Su definición es clara no se necesita hacer demasiado

esfuerzo para entender su finalidad, no es afectada por las fluctuaciones de los datos de la

muestra, depende de los valores de los datos, se utilizan cálculos algebraicos con facilidad y

permite realizar comparaciones.

No debe ser utilizada cuando los datos extremos difieren notoriamente del resto, es decir

cuando los datos no son homogéneos, o cuando se presenten como una progresión aritmética.

La media aritmética se calcula sumando todos los datos de una serie o distribución y

dividiéndolos entre él numero de ellos.

n

foxXiX

;

n

xXfxXfxXfxXfX nn.......332211

Mediana (Xd).

Se define como el dato, o punto que divide a una distribución o serie de datos en dos

partes exactamente iguales. Es decir que a ambos lados de la serie existe el mismo número de

elementos o datos.

- Se ordena

- Se calcula el lugar que ocupa, 2

1nLugar

Moda, Modo o Promedio Típico (Xo).

Se define como el valor más común, es decir el valor alrededor del cual se concentran la

mayor cantidad de datos (punto de concentración máxima).

La moda no es más que el valor que más se repite.

Calculo de las Medidas de Tendencia Central para Datos Agrupados en Intervalos de Clase

La Media Aritmética o Promedio Aritmético )(X

n

Xf

X

n

1i

mioi

Page 34: Libro de estadistica

33

Una vez construida la tabla de distribución de frecuencias hasta las (FA). Frecuencias

absolutas acumuladas.

a. Calcule los puntos medios Xm.

b. Efectúe el producto de fo por Xm y súmelos.

c. Use la formula inicialmente mostrada.

La Mediana (Xd)

Icfo

Fn

LiXdAi

*2

a. Ubique el cociente 2

n , en la columna FA, si no coincide ninguno, use el inmediato

superior al buscado.

b. Después de ubicado 2

n , extraemos de la tabla los demás términos:

Li = Es él límite inferior del intervalo donde se ubica la mediana.

FAi = Es la frecuencia acumulada absoluta inferior a la ubicación de la mediana.

Fo = Es la frecuencia ordinaria absoluta del intervalo donde se halla la ubicación de la mediana.

La Moda (Xo)

Icdsdi

diLiXo *

a. Se ubica la frecuencia ordinaria modal (fom), si existen dos se selecciona lo que concentre

mayor numero de datos a su alrededor.

b. Se calculan las diferencias entre la frecuencia ordinaria modal (fom) y las que están

alrededor (inferior foi y superior fos).

c. Se toma él límite inferior real del intervalo donde se tomo la frecuencia ordinaria modal, y

se usa la formula antes mostrada.

Fom = Es la mayor frecuencia ordinaria absoluta.

Li = Es él límite real inferior del intervalo que posea la frecuencia ordinaria absoluta mayor.

ds = fom –fos = Diferencia entre frecuencia ordinaria modal (fmo) y la frecuencia ordinaria absoluta

(fos ) que esta por encima de la frecuencia modal.

di = fom –foi = Diferencia entre frecuencia ordinaria modal (fmo) y la frecuencia ordinaria absoluta

(foi ) que esta por debajo de la frecuencia modal.

Ic = Es la amplitud del intervalo de clase.

Page 35: Libro de estadistica

34

Aplicaciones de las Medidas de Tendencia Central.

Cuando hacemos uso de métodos estadísticos, surge la duda sobre la utilización de

cualquiera de ellas es decir, cual de las tres medidas de tendencia utilizar, cuando y porque.

Existen reglas generales para ello que a continuación conoceremos:

La Media )(X

a. Cuando los datos se distribuyen simétricamente.

b. Cuando la serie es de crecimiento aritmético.

c. Cuando se desee obtener otras medidas (estadísticos), como la desviación típica, la

varianza, desviación media.

La Mediana (Xd)

a. Cuando se necesite el valor central exacto de la serie.

b. Cuando existen datos extremos que afecten severamente a la media aritmética

La Moda o Modo (Xo)

a. Cuando se desee una medida de tendencia central rápida y aproximada.

b. Cuando sea interesante conocer el valor que más se repite en una serie

Relaciones Entre las Medidas de Tendencia Central.

En toda distribución o serie simétrica, la media aritmética, la mediana y la moda,

coinciden sin embargo, cuando el grado de asimetría es moderado, la mediana se encuentra

ubicada entre la media aritmética y la moda a una distancia igual a 1/3 de la que separa a estas

dos, partiendo de la media. Si la asimetría es acentuada esta relación no tiene validez.

Matemáticamente, la relación se puede expresar de la siguiente manera:

XXXtoporXXXXXXXX dodood 23:tan)(3)(3

1

Lo que significa que: MODA = 3 veces la MEDIANA – 2 veces la MEDIA

Para una distribución unimodal se cumplen lo siguiente:

1. Cuando ,,,od

XXX son iguales, la distribución de datos es simétrica, es decir la

concentración de valores es igual a ambos valores de la media aritmética.

Page 36: Libro de estadistica

35

2. Cuando X > Xd >Xo, la distribución de los datos es asimétrica o sesgada hacia la derecha

(asimetría positiva), lo que nos indica que más del 50% de los datos están situados por

debajo de la media aritmética.

2. Cuando X < Xd <Xo, la distribución de los datos es asimétrica o sesgada hacia la

izquierda (asimetría negativa), Lo que nos indica que más del 50% de los datos son

superiores al valor de la media aritmética.

Medidas De Tendencia Central Secundarias

.

Media O Promedio Geométrico (G).

Se define como la raíz enésima (raíz del número de datos), del producto de la serie de valores.

Para Datos Directos o no Agrupados

nnXXxXxXG ).().........()()( 321

Tomando lóg. a ambos miembros de la ecuación.

n

LogXLogXLogXLogXLogG n

.........321

Anti-log G = G

Para Datos Agrupados en Intervalos de Clases

i

noooo

f

xLogXmfxLogXmfxLogXmfxLogXmfLogG

.........321

Anti-log G = G

Page 37: Libro de estadistica

36

Usos de la Media Geométrica

La media geométrica se usa en datos que tiendan a una progresión geométrica,

entendiéndose por ello, aquella donde las razones o cocientes entre un término y el anterior sean

constantes o aproximadamente constantes; Existen variables típicamente con esa tendencia

geométrica o exponencial, como son: la población, intereses, índices, etc.

El Promedio Armónico o Media Armónica (H)

Se describe como él reciproco de la media aritmética del reciproco o inverso de los datos

de una serie.

PARA DATOS DIRECTOS ; PARA DATOS AGRUPADOS

iX

NH

1

i

i

i

X

f

fH

Usos de la Media Armónica

Se usa generalmente en aquellos problemas cuando se traten de promediar razones o

cocientes, tales como: Km/Hr, Bs/Doc, Bs/Hr, etc.

Relación que Existe Entre los Promedios Secundarios.

La media aritmética es siempre mayor que la media geométrica y esta a su vez es mayor

que la media armónica, con excepción del caso en que los datos sean iguales, ya que tales

promedios coincidirán.

H < G < X (Datos diferentes)

H = G = X (Datos iguales)

De acuerdo a la siguiente formula, conociendo dos de los tres promedios, podemos

calcular el tercero.

G = H * X ; H = G / X ; X = G / H

Page 38: Libro de estadistica

37 PASOS A SEGUIR PARA CALCULAR MEDIDAS DE TENDENCIA CENTRAL PRINCIPALES

PARA DATOS AGRUPADOS

Media o promedio aritmético.

a. Construya la Tabla de Distribución de Frecuencias Hasta la Columna de las Frecuencias Absolutas

Acumuladas.

b. Calcule los Puntos Medios Xm.

c. Construya la Columna fo * Xm (Columna fo Multiplicada Por La Columna Xm).

d. Use la Formula de la Media Aritmética.

n

foxXmX

La mediana. ,

a. Ubique el cociente n / 2, en la columna de la frecuencia acumulada, si no coincide con ninguno, use el

inmediato superior al buscado.

b. Recuerde la formula de la mediana.

Icfo

FAin

LiXd *2

c. Después de ubicar n / 2, extraemos de la tabla los relación términos.

Li = Es el límite inferior del intervalo donde se ubica la mediana.

FAi = Es la frecuencia acumulada absoluta inferior a la ubicación de la mediana.

fo = Es la frecuencia ordinaria absoluta del intervalo donde se halla la ubicación de la mediana.

La moda.

a. Se ubica la frecuencia modal (fom), si existen dos se selecciona la que concentre mayor numero de

datos a su alrededor.

b. Se calculan las diferencias entre la frecuencia modal (fom) y las que están alrededor (inferior y

superior).

c. Se toma el límite inferior real del intervalo donde se ubico la frecuencia modal, y se usa la formula

siguiente:

Icdsdi

diLiXo *

Li = Es el límite real inferior del intervalo que posee la frecuencia ordinaria absoluta mayor.

di = fom – foi ; Diferencia entre frecuencia modal (fom) y la frecuencia ordinaria absoluta que esta por

debajo de la frecuencia modal.

ds = fom – fos ; Diferencia entre frecuencia modal (fom) y la frecuencia ordinaria absoluta que esta por

encima de ella.

Page 39: Libro de estadistica

38

Ejemplo

Dada la Siguiente Serie de Datos Calcule Todas las Medidas de Tendencia Central Para Datos

Directos y Agrupados

1265 1272 1360 1385 1420 1525 1530 1600 1650 1800 1820 1860 1910 1950 2000

2100 2150 2200 2265 3500 3720 3850 3920 4000 4500 5250 5320 6210 6280 6500

6660 6720 7960 8100 8100 8565 8860 9220 9520 9520 9863 10275 10350 11200 11485

11520 11792 12350 12380 12500 13670 13865 13900 13952

n = 54

Datos Directos

Media: 85.618654

334090

n

foxXiX

Mediana: Se ubica el lugar que ocupa la mediana, Lugar = (54+1)/2 = 27.5, la mediana se

encuentra entre el valor que ocupa el lugar 27 y el 28. Por lo tanto la misma es:

(5320+6210)/2 = 5765 = Xd.

Moda: Es el o los valores que más se repiten: 8100 y 9520.

Datos Agrupados

Elaboración de la Tabla de Distribución de Frecuencias (Ni = 9)

Calculo del Recorrido: 13952-1265 = 12687

Calculo de la Amplitud del Intervalo: Use Ni = 9, 12687/9 = 1409.66 ≈ 1410

LI LS Xm fo FA fo.Xm

1265 2675 1970 19 19 37430

2675 4085 3380 5 24 16900

4085 5495 4790 3 27 14370

5495 6905 6200 5 32 31000

6905 8315 7610 3 35 22830

8315 9725 9020 5 40 45100

9725 11135 10430 3 43 31290

11135 12545 11840 7 50 82880

12545 13955 13250 4 54 53000

54 334800

Page 40: Libro de estadistica

39

Media: Xn

foxXiX

6200

54

334800

Mediana: XdIcfo

FAin

LiXd

549514103

24274085*2

Moda:

14519;19019;5;0;19

81,207614101419

191265*

dsdifosfoifom

Icdsdi

diLiXo

Page 41: Libro de estadistica

40

Medidas de Posición

Se llaman así a todas aquellas que al igual a la Mediana localizan la posición de algún

dato con relación a otros, y estas son:

Percentiles

Deciles

Cuartiles

Rangos Percentiles

Percentiles (Xp). Cuando una serie o distribución de datos es dividida en 100 partes

iguales y obtenemos percentiles del 1 al 99, y es un punto por debajo del cual se encuentra un

determinado porcentaje de casos, por ejemplo 85, es el punto o puntos, por debajo del cual se

encuentra el 85% de los casos de la distribución.

Deciles (Dx). Cuando una serie o distribución es dividida en 10 partes iguales y

obtenemos deciles del 1 al 9.

Cuartiles (Qx). Cuando una serie o distribución es dividida en 4 partes iguales y

obtenemos cuartiles del 1 al 3.

Relación Entre Estas Medidas

Xd

Percentiles

X10 X20 X30 X40 X50 X60 X70 X80 X90

Deciles

D1 D2 D3 D4 D5 D6 D7 D8 D9

Cuartiles

Q1 Q2 Q3

Observando el gráfico nos damos cuenta la relación que existe entre los deciles y los

cuartiles con los percentiles.

D1 = P10, D2 = P20, Q1 = P25, Q2 = P50, Q2 = D5.

Es de notar la coincidencia que existe entre ellos.

Q2 = D5 = P50 = Xd; Es decir el segundo cuartil (Q2), el quinto decil (D5), el percentil 50 (P50) y la

mediana son iguales entre sí en cualquier distribución.

Page 42: Libro de estadistica

41

Percentiles Para Datos Directos.

Xp = Xi + (Xs - Xi) * R

Xp = Percentil buscado.

Xi = Es el dato inferior al percentil buscado.

Xs = Es el dato superior al percentil buscado.

R = Diferencia entre el lugar del percentil buscado y el lugar del dato inferior.

Procedimiento

1. Se ordenan los datos de menor a mayor

2. Se calcula el lugar del percentil buscado (Xp).

3. Se determina el valor de R.

4. Se aplica la formula antes descrita.

5. Se interpreta.

Percentiles Para Datos Agrupados en Intervalos de Clase.

Ic*fo

FAi100

pxn

LiXp

Procedimiento

1. Se calcula el lugar de ubicación del percentil pedido.

2. Se procede igual que el cálculo de la mediana respecto a los valores de Li, FAi, fo.

3. Se interpreta.

Rango Percentil (Px).

Es un estadístico que nos indica el porcentaje de casos que esta ubicado por debajo de un

valor conocido.

Observación:

1. En los percentiles, deciles y cuartiles se da un porcentaje para luego determinar el

dato por debajo del cual se halla el porcentaje dado.

2. En el caso del rango percentil, se da el dato para conseguir el porcentaje de datos que

se halla por debajo del dato conocido.

Rango Percentil Para Datos Directos

Conociendo la formula para él cálculo de percentiles por datos directos y sustituyendo en

ella el valor de R, por la diferencia entre el lugar del percentil buscado y el lugar del dato inferior

Page 43: Libro de estadistica

42

al percentil buscado, obtenemos:

xR)XiXs(XiXp

Ixi

100

pxn)XiXs(Xi

Despejando P tenemos:

Donde:

Xi

is

ipI

XX

XX

n

100P

P = Es el rango percentil buscado.

Xp = Es el dato conocido.

Xi = Es el dato inferior inmediato a Xp.

Xs = Es el dato superior inmediato a Xp.

Ixi = Es el lugar que ocupa Xi.

n = Es el numero de casos o datos de la serie.

Rango Percentil Para Datos Agrupados.

Cuando queremos calcular el rango percentil de un dato en una distribución de datos

agrupados, se despeja de la formula de percentiles para datos agrupados el valor de P (rango

percentil) y obtenemos la siguiente ecuación:

Donde:

FAi

Ic

xfo)LiXp(

n

100Px

Px = Es el rango percentil buscado.

n = Es el numero de datos de la distribución.

Xp = Representa el dato conocido.

Li = Es el límite inferior real del intervalo de clase que contiene al dato conocido (Xp).

fo = Frecuencia ordinaria absoluta del intervalo que contiene al dato conocido (Xp).

FAi = Frecuencia acumulada absoluta inferior al intervalo donde esta ubicado Xp.

Ic = Amplitud de los intervalos de clase.

Desviación Cuartil.

La desviación cuartil de un grupo de datos esta basada en dos valores de la distribución y

no tienen nada que ver con los valores extremos de la serie, sino que se refieren a la tercera y la

primera cuartilla del grupo. Para encontrar las cuartillas, dividimos él número de elementos del

grupo en cuatro partes de acuerdo a sus valores. La primera cuartilla (Q1), es el punto sobre la

escala de valores por debajo del cual, hay un cuarto de los elementos. La segunda cuartilla (Q2),

es el punto por debajo del cual hay la mitad de los datos, por lo que Q2 se corresponde con la

Page 44: Libro de estadistica

43

mediana. La tercera cuartilla (Q3), es el punto por debajo del cual hay las tres cuartas partes de

los elementos, la diferencia entre la tercera y la primera cuartilla, es el llamado recorrido

intercuartilitico.

Cuando esa diferencia es dividida por 2, el cociente es la desviación cuartilitica o

semirecorrido intercuartilitico.

2

13 QQDq

Uno de los elementos de mayor importancia en él calculo de las cuartillas es conocer

primero que lugar ocupa cada cuartilla, para ello debemos tener en cuenta la siguiente relación:

Q1 = n/4 ; Q2 = n/2 ; Q3 = 3n/4.

Cuartillas Para Datos Directos

Para calcular cuartiles para datos directos, nos basamos en la relación que existe entre las

medidas de posición, para ello calculamos el percentil setenta y cinco y el veinticinco para datos

directos, los restamos y los dividimos entre dos.

Cuartillas Para Datos Agrupados

Las cuartillas para datos agrupados, se pueden obtener de la misma forma como se obtiene

la mediana, primero se ubica el lugar que ocupa la cuartilla, y luego aplicando la formula

respectiva, se interpreta de la misma forma que la mediana.

Recordando que el lugar que ocupa cada uno de los cuartiles corresponde a:

Q1 = 25% ; Q2 = 50% ; Q3 = 75%

Icfo

Fn

LiQAi

*41

Icfo

Fn

LiQAi

*22

Icfo

Fn

LiQAi

*4

3

2

Principales Características de la Desviación Cuartilitica.

La desviación cuartilitica, esta basada en dos valores Q1 y Q3, no es afectada por los

valores extremos, los cuales son menores que Q1 y mayores que Q3, existen un 50% de los

elementos entre Q1 y Q3, una desviación baja, indica una pequeña variación entre el 50% de los

elementos centrales, por otra parte una desviación alta significa que la variación entre los

elementos centrales es alta.

Page 45: Libro de estadistica

44

METODOLOGIA PARA CALCULAR MEDIDAS DE POSICION

EN 100 PARTES PERCENTILES

X10 X20 X30 X40 X50 X60 X70 X80 X90

EN 10 PARTES DECILES

D1 D2 D3 D4 D5 D6 D7 D8 D9

EN 4 PARTES CUARTILES

Q1 Q2 Q3

P = RANGOS PERCENTILES (% de Valores)

Xp = PERCENTIL

PERCENTILES PARA DATOS DIRECTOS

Xp = Xi + (Xs – Xi) * R

Xp = Percentil buscado ; Xi = Dato inferior al percentil buscado

Xs = Dato superior al percentil buscado ; R = Diferencia entre el lugar del percentil

Buscado y el lugar del dato inferior.

Procedimiento

a. Se ordenan los datos de menor a mayor. b. Se calcula el lugar del percentil buscado.

c. Se determina el valor de R. d. Se aplica la formula de percentiles. E. Se interpreta.

PERCENTILES PARA DATOS AGRUPADOS

Icfo

FAipxn

LiXp *100

Procedimiento

a. Se elabora la tabla de distribución de frecuencias. b. Se calcula el lugar del percentil buscado.

c. Se procede de la misma forma como se hizo para el calculo de la mediana. D. Se interpreta.

RANGO PERCENTIL (Px). PARA DATOS DIRECTOS.

i

is

ipIX

XX

XX

nP

100

P = Es el rango percentil buscado ; Xp = Es el dato conocido

Xi = Es el dato inferior inmediato a Xp ; Xs = Es el dato superior inmediato a Xp

Page 46: Libro de estadistica

45

Ixi = Es el lugar que ocupa Xi ; n = Es el numero de casos o datos de la serie.

RANGO PERCENTIL PARA DATOS AGRUPADOS.

FAi

Ic

xfoLiXp

nPx

)(100

Li = Es el límite inferior real del intervalo que contiene el dato conocido Xp

FAi = Es la frecuencia acumulada absoluta inferior al intervalo donde esta Xp.

fo = Es la frecuencia ordinaria absoluta del intervalo que contiene el dato Xp.

DESVIACIÓN CUARTILITICA.

2

13 QQDq

EJEMPLO

En el estudio realizado en las empresas del sector aduanero del ejercicio de elaboración de tablas

de distribución de frecuencias se obtuvieron los siguientes datos:

5000 5050 5100 5125 5150 5200 5223 5270 5300 5315 5325 5390 5400 5415 5425 5450

5475 5480 5500 5515 5520 5525 5550 5575 5580 5595 5892 5910 6050 6065 6100 6125

6130 6150 6175 6200 6225 6250 6265 6270 6275 6300 6320 6345 6350 6375 6390 6400

6430 6435 6450 6465 6475 6500 6520 6525 6540 6550 6575 6600 6620 6635 6640 6645

6650 6690 6700 6750 6784 6820 6825 6850 6875 6900 6925 6950 6975 6980 6985 7000

n = 80

Determine: para datos Directos y Agrupados lo siguiente:

a. Cual es el salario más alto que ganan el 40% de los trabajadores que ganan los salarios

más altos que la media.

b. Cual es el salario más alto que ganan el 30% de los trabajadores que ganan los salarios

más bajos.

c. Calcular el % y número de trabajadores se encuentra por debajo del Salario 5347.5.

d. Calcular el % y número de trabajadores se encuentra por encima del salario 6545.25.

e. Calcular el % y número de trabajadores se encuentra entre el salario 6315 y el salario

6825.

f. Calcular la Desviación Cuartilitica.

Page 47: Libro de estadistica

46

Datos Directos

a. Para calcular ese salario debemos primero calcular la madia de la muestra, una vez calculado,

procedemos a calcular el rango percentil para ese valor, conocido este porcentaje, le sumamos el

40% que se encuentra por encima y haciendo uso de la formula para el calculo de percentiles, lo

realizamos para el porcentaje en cuestión.

Media =n

foxXmX

= 490279/80 = 6128.48 = Media

Calculo del rango percentil para Xp = 6128.48; Haciendo uso de la Formula:

i

is

ipIX

XX

XX

nP

100 ; P = %87.4032

61256130

612548.6128

80

100

A este porcentaje le sumamos 40% y llegamos a 80.87%, Calculamos el percentil para el 80.87%

Calculamos el lugar que ocupa el percentil buscado 696.61100

8087.80

100

np y usamos

Xp = Xi + (Xs – Xi) * R → 6620 + (6635-6620) x 0.696 = 6630.44

b. El 30% de los que ganan los salarios mas bajos, son aquellos que se encuentran 30% encima

del salario 5000 o lo que es lo mismo vamos a calcular el percentil 30, usamos la formula:

Xp = Xi + (Xs – Xi) * R; Lugar que ocupa el percentil = 24, entonces el salario será: 5575.

c. Cálculo del rango percentil para Xp = 5347.5; Haciendo uso de la Formula:

i

is

ipIX

XX

XX

nP

100 ; P = %183.1411

53255390

53255.5347

80

100

.

Calculo del número de trabajadores 35.11100

80183.14

100

np≈ 11 trabajadores.

d. No se puede calcular porcentajes que están por encima de valores de forma directa, ya que se

contradice la definición de rango percentil, para ello nos situamos en un valor que se encuentre

un diferencial por encima del valor conocido y para ese valor, si calculamos el rango percentil.

Nos situaremos en el valor 6545.5, calculamos el rango percentil y el porcentaje obtenido se lo

restamos del 100% y de esta manera damos repuesta al interrogante.

Cálculo del rango percentil para Xp = 6545.5; Haciendo uso de la Formula:

Page 48: Libro de estadistica

47

i

is

ipIX

XX

XX

nP

100 ; P = %93.7157

65406550

65405.6545

80

100

,

100 % - 71.93 % = 28.07 % → porcentaje por encima

Calculo del número de trabajadores 456.22100

8007.28

100

np≈ 22 trabajadores.

e. Para realizar este calculo, primero lo haremos para el valor superior, luego para el valor

inferior y los porcentajes los restamos y obtenemos el porcentaje que esta entre esos dos valores

Cálculo del rango percentil para Xp = 6825; Haciendo uso de la Formula:

i

is

ipIX

XX

XX

nP

100 ; P = %96.8871

68206850

68206825

80

100

,

Cálculo del rango percentil para Xp = 6315; Haciendo uso de la formula anterior:

P = %69.544363006320

63006315

80

100

,

88.96 % - 54.69 % = 34.27 %

Calculo del número de trabajadores 42.27100

8027.34

100

np≈ 27 trabajadores.

f. Procedemos a calcular el percentil 75, luego calculamos el percentil 25, estos valores los

restamos y los dividimos entre 2, o lo que es lo mismo el Cuartil 3 y el Cuartil 1, estos valores los

restamos y los dividimos entre 2.

Calculamos el lugar que ocupa el percentil Setenta y cinco 60100

8075

100

np y usamos

Xp = Xi + (Xs – Xi) * R → al contar los valores nos damos cuenta que el lugar 60 lo ocupa el

valor = 6600.

Calculamos el lugar que ocupa el percentil Veinticinco 20100

8025

100

np y usamos

Xp = Xi + (Xs – Xi) * R → al contar los valores nos damos cuenta que el lugar 20 lo ocupa el

valor = 5515.

La desviación cuartilitica es 5.5422

55156600

2

13

QQ

Dq

Datos agrupados

Se elabora la tabla de distribución de frecuencias en función al numero de intervalos que se

indica, Ni = 10

Page 49: Libro de estadistica

48

Calculo del rango = Vmayor – Vmenor = 5000 – 7000 = 2000

Ni Li Ls Xm fo FA fo x Xm

1 5000 5200 5100 5 5 25500

2 5200 5400 5300 7 12 37100

3 5400 5600 5500 14 26 77000

4 5600 5800 5700 0 26 0

5 5800 6000 5900 2 28 11800

6 6000 6200 6100 7 35 12200

7 6200 6400 6300 12 47 75600

8 6400 6600 6500 12 59 78000

9 6600 6800 6700 10 69 67000

10 6800 7000 6900 10 79 69000

11 7000 7200 7100 1 80 71000

490800

a. La media de la distribución es: 4908000/80 = 6135. Realizamos el mismo procedimiento

desarrollado para datos directos. Calculando el rango percentil con la formula siguiente:

FAi

Ic

xfoLiXp

nPx

)(100

Buscamos en la tabla, dentro de que límites se encuentra el valor y procedemos a tomar los

demás valores %84.3528200

)60006135(

80

100

El porcentaje conseguido lo sumamos a 40% y calculamos el percentil para ese valor con la

formula siguiente:

Ic*fo

FAi100

pxn

LiXp

Hallamos el lugar que ocupa el percentil 3.60100

8038.75

Este valor lo ubicamos en la tabla de distribución, tal como lo hacíamos con el cálculo de la

mediana para la extracción de los valores.

6626200*10

593.606600

Xp → Salario más alto

Page 50: Libro de estadistica

49

b. Calculamos el percentil 30

Hallamos el lugar que ocupa el percentil 24100

8030

6626200*10

593.606600Xp

c. Procedemos como lo hicimos para datos directos.

Calculando el rango percentil para el salario 5347.5 con la formula de rangos percentiles.

Buscamos en la tabla, dentro de que limites se encuentra el valor y seleccionamos los demás

valores %45.2112200

7)52005.5347(

80

100

x

Calculo del número de trabajadores 16.17100

8045.21

100

np≈ 17 trabajadores.

d. Al igual que en datos directos nos situamos en un valor superior al pedido, el cual será 6545.5

y procedemos teóricamente de la misma manera.

Calculando el rango percentil para el salario 6545.5 con la formula de rangos percentiles.

Buscamos en la tabla, dentro de que limites se encuentra el valor y seleccionamos los demás

valores

%66.8459200

12)64005.6545(

80

100

x→ 100% - 84.66% = 15.34 %

Calculo del número de trabajadores 27.12100

8034.15

100

np≈ 12 trabajadores.

e. Calculando el rango percentil para el salario 6825 con la formula de rangos percentiles.

Buscamos en la tabla, donde dentro de que limites se encuentra el valor y seleccionamos los

demás términos

%25.8079200

10)68006825(

80

100

x

Calculando el rango percentil para el salario 6315 con la formula de rangos percentiles.

Buscamos en la tabla, dentro de que limites se encuentra el valor y seleccionamos los demás

términos

Page 51: Libro de estadistica

50

%375.6747200

12)62006315(

80

100

x

80.25 % - 67.375% = 12.875%

Calculo del número de trabajadores 3.10100

80875.12

100

np≈ 10 trabajadores

f. Calculando el percentil 75 y el percentil 25 damos repuesta a la interrogante

Ic*fo

FAi100

pxn

LiXp

Lugar que ocupa el percentil 75 = 60100

8075

6620200*10

59606600Xp

; Lugar que ocupa el percentil 25 = 20

100

8025

28.5514200*14

12205400Xp

La desviación cuartilitica es 86.5522

28.55146620

2

13

QQ

Dq

Recuerde que el cuartil 3 es igual al Percentil 75 y por consiguiente el cuartil 1 es igual al

percentil 25.

Page 52: Libro de estadistica

51

Medidas de Dispersión

Las medidas de dispersión o de variabilidad nos dan a conocer el grado de

homogeneidad o heterogeneidad de los datos de una distribución. En la generalidad indican

de qué manera se agrupan o concentran los datos alrededor de alguna de las medidas de tendencia

central.

Estas medidas explican algunas características de la serie de la cual proceden. La

variabilidad nos permite conocer la variación o dispersión promedio que presentan los datos con

relación a la media elegida.

Cuanto menor sea esta variabilidad, mucho mas concentrados estarán los datos alrededor

de la media o promedio seleccionado y más representativo será este. Cuan mayor sea la variación

o dispersión menor representatividad tendrá dentro de conjunto de datos. Si todos los datos de

una distribución son iguales no existirá dispersión o lo que es lo mismo decir que la variabilidad

seria igual a cero y de hecho no habrá variabilidad de los mismos con respecto a su media.

Existen diversas Medidas de Dispersión, entre las más utilizadas podemos destacar las

siguientes:

1.- Rango: Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor

más elevado y el valor más bajo. R = Xmayor – Xmenor

2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como

sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número

de veces que se ha repetido cada valor. El sumatoria obtenido se divide por el tamaño de la

muestra.

tosDatosDirecn

XXS

2

2 )( adosDatosAgrup

n

XXfS

mo

2

2)(

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más

concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor

sea la varianza, más dispersos están.

3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.

tosDatosDirecn

XXS

i

2)( adosDatosAgrup

n

XXmfS

o

2)(

Page 53: Libro de estadistica

52

4.- Desviación Media: Se define como la sumatoria de las desviaciones de los datos respecto a la

media aritmética de una distribución.

tosDatosDirecn

XXMD

i adosDatosAgrup

n

XXmfMD

o

5.- Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y la

media. Cv =X

S

Ejemplo:

Los datos siguientes corresponden a la estatura de un grupo de alumnos de la sección “E” del

segundo término de Ingeniería. De la Universidad Nacional Politécnica Experimental de la

Fuerza Armada Nacional.

1.66-1.67-1.67-1.67-1.67-1.72-1.72-1.72-1.72-1.73-1.73-1.74-1.75-1.75-1.76-1.76-1.76-1.87-

1.87-1.87-1.88-1.88-1.88-1.88-1.89-1.89-1.89-1.90-1.90-1.90.

Los datos están previamente Ordenados

Calcular para datos Directos y Agrupados las medidas de Dispersión.

Datos Directos

Variable(X) fo XXi )( XXfo

i

2)( XXi Fo

2)( XXi

1,66 1 -0.13 -0.13 0.0169 0.0169

1,67 4 -0.12 -0.48 0.0144 0.0576

1,72 4 -0.07 -0.28 0.0049 0.0196

1,73 2 -0.06 -0.12 0.0036 0.0072

1,74 1 -0.05 -0.05 0.0025 0.0025

1,75 2 -0.04 -0.08 0.0016 0.0032

1,76 3 -0.03 -0.09 0.0009 0.0027

1,87 3 0.08 0.24 0.0064 0.0192

1,88 4 0.09 0.36 0.0081 0.0324

1,89 3 0.1 0.3 0.01 0.03

1,90 3 0.11 0.33 0.0121 0.0363

0.2276

Previamente calculamos la media para datos directos ( X ) = 1.79

Page 54: Libro de estadistica

53

Rango:

Es la diferencia entre el mayor y el menor valor: 1.90 - 1.66 = 0.24 mts.

Varianza:

Para calcular la varianza es necesario conocer la Media de la muestra, siendo la misma = 1.79.

S2 = 007586.0

30

2276.0

Desviación Estándar o Típica: es la raíz cuadrada de la varianza. 08709.0007586.0 S

Desviación Media respecto a la Media: 02933.030

88.0DM

Datos Agrupados

Vamos a elaborar la Tabla de distribución de frecuencia usando un numero de intervalos (Ni) de

10.

Calculo del recorrido de la distribución: V mayor – V menor = 1.9 – 1.66 = 0.24

Calculo de la Amplitud del Intervalo (Ic): 0.24/10 = 0.024, no redondeamos por ser un valor muy

pequeño.

Ni Li Ls Xm fo FA foxXm )( XXm

2)( XXm fo2)( XXm

1 1.66 1.684 1.672 5 5 8.36 -0.12 0.014 0.072

2 1.684 1.708 1.696 0 5 0 -0.96 0.009216 0

3 1.708 1.732 1.72 6 11 10.32 -0.072 0.005184 0.031104

4 1.732 1.756 1.744 3 14 5.232 -0.048 0.002304 0.006912

5 1.756 1.780 1.768 3 17 5.304 -0.024 0.0000576 0.001728

6 1.780 1.804 1.792 0 17 0 0 0 0

7 1.804 1.828 1.816 0 17 0 0.024 0.000576 0

8 1.828 1.852 1.84 0 17 0 0.048 0.002304 0

9 1.852 1.876 1.864 3 20 5.592 0.072 0.005184 0.015552

10 1.876 1.900 1.888 7 27 13.216 0.096 0.009216 0.064512

11 1.900 1.924 1.9125 3 30 5.736 0.12 0.0144 0.0432

30 53.76 0.235008

La media de la distribución es: 1.792

Desviación Estándar o Típica: 08850.030

235008.0S

Page 55: Libro de estadistica

54

Desviación Media respecto a la Media:

Varianza: 0078336.030

235008.02 S

Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y la

media de la muestra. .

Cv = 04938.0792.1

08850.0

X

S

El interés del coeficiente de variación es que al ser un porcentaje permite comparar el

nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene

expresada en las mismas unidas que los datos de la serie.

Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los

alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las

desviaciones típicas (una viene expresada en cm. y la otra en Kg.). En cambio, sus coeficientes de

variación son ambos porcentajes, por lo que sí se pueden comparar.

Page 56: Libro de estadistica

55

Medidas de Forma

Las Medidas de Forma permiten conocer que forma tiene la curva que representa la serie

de datos de la muestra. En concreto, podemos estudiar las siguientes características de la curva:

a) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la

misma (Centro de Simetría) los segmentos de curva que quedan a derecha e izquierda son

similares.

b) Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de

los valores medios de la muestra.

a) Asimetría

Hemos comentado que el concepto de asimetría se refiere a si la curva que forman los

valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media

aritmética)

Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher,

que viene definido por la relación entre momentos:

23

2

3

3 2

2

3

)()( m

m

m

mAs

Recordando la formula de los momentos tenemos:

Datos directos Datos agrupados

n

XXm

i

i

)(

n

XXfm

i

mo

i

)(

Page 57: Libro de estadistica

56

Los resultados pueden ser los siguientes:

As= 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la

izquierda de la media)

As > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la

media que a su izquierda)

As < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de

la media que a su derecha)

Ejemplo: Vamos a calcular el Coeficiente de Asimetría de Fisher de la serie de datos referidos a

la estatura de un grupo de alumnos Recordemos que la media de esta muestra es 1,253

b) Curtosis

El Coeficiente de Curtosis analiza el grado de concentración que presentan los valores alrededor

de la zona central de la distribución.

Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores

centrales de la variable (el mismo que presenta una distribución normal).

Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores

centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores

centrales de la variable.

El Coeficiente de Curtosis viene definido por la siguiente fórmula:2

2

4

4

4

)(m

m

S

mCu

Page 58: Libro de estadistica

57

Los resultados pueden ser los siguientes:

Cu = 0 (distribución mesocúrtica).

Cu > 0 (distribución leptocúrtica).

Cu < 0 (distribución platicúrtica).

Ejemplo: Vamos a calcular el Coeficiente de Asimetría de Fisher y el Coeficiente de Curtosis

de la serie de datos referidos a la estatura del grupo de alumnos del problema de dispersión:

(X)

fo mi XX 2)( XX i 2)( XXfo i

3)( mi XX fo3)( mi XX

4)( mi XX fo4)( mi XX

1,66 1 -0.12 0.0144 0.072 -0.001728 -0.00864 0.0002073 0.0010368

1,67 4 -0.096 0.009216 0 -0.0008847 0 0.00008493 0

1,72 4 -0.072 0.005184 0.031104 -0.0003732 -0.00223949 0.00002687 0.00016124

1,73 2 -0.048 0.002304 0.006912 -0.0001106 -0.00033178 0.0000053 0.000015925

1,74 1 -0.024 0.000576 0.001728 -0.00001382 -0.00004147 0.00000033 0.000000995

1,75 2 0 0 0 0 0 0 0

1,76 3 0.024 0.000576 0 0.00001382 0 0.00000033 0

1,87 3 0.048 0.002304 0 0.00011059 0 0.0000053 0

1,88 4 0.072 0.005184 0.015552 0.0003732 0.0011197 0.00002687 0.00008062

1,89 3 0.096 0.009216 0.064512 0.0008847 0.0061931 0.00008493 0.0005945

1,90 3 0.12 0.0144 0.0432 0.001728 0.005184 0.0002073 0.00062208

0.235008 0,00124416 0.0000837

Por lo tanto el Coeficiente de Fisher de Simetría de esta muestra es 0.00105143, lo que quiere

decir que presenta una distribución asimétrica positiva (se concentran más valores a la derecha de

la media que a su izquierda).

00105143.00394433.0

000041472.0

)0078336.0(

000041472.0

)()( 3 223

2

3

3 2

2

3 m

m

m

mAs

Por lo tanto, el Coeficiente de Curtosis de esta muestra es 0.04546544, lo que quiere decir que

se trata de una distribución leptocúrtica, es decir, con una elevada concentración alrededor de los

valores centrales de la distribución.

04546544.00000613652.0

00000279.0

)( 2

2

4

4

4 m

m

S

mCu

Page 59: Libro de estadistica

58

Ejercicios Propuestos de Medidas Estadísticas

1. Las edades de los estudiantes de un curso de informática son:

17 - 17 - 18 - 19 - 18 – 20 - 20 - 17 - 18 - 18 - 19 – 19 - 21 - 20 - 21 - 19 - 18 - 18

19 - 21 - 20 - 18 - 17 – 17 - 21 - 20 - 20 - 19 - 20 - 18

a) Elabora una tabla de frecuencias y representa los datos con un diagrama adecuado.

b) Calcula la media y la desviación típica.

2. A un grupo de 30 personas se les ha tomado el número de pulsaciones por minuto (ritmo

cardíaco) obteniéndose los siguientes resultados:

87 - 85 - 61 - 51 - 64 - 75 - 80 - 70 - 69 – 82 - 80 - 79 - 82 - 74 - 90 - 76 - 72 - 73 – 63 65 - 67 -

71 - 88 - 76 - 68 - 73 - 70 - 76 - 71 - 86

a) Representa gráficamente esta distribución agrupando los datos en 6 intervalos.

b) Calcula la media y la desviación típica.

3. En una maternidad se han tomado los pesos (en kilogramos) de 50 recién nacidos:

2,8 - 3,2 - 3,8 - 2,5 - 2,7 - 3,7 - 1,9 - 2,6 - 3,5 - 2,3 - 3,0 - 2,6 - 1,8 - 3,3 - 2,9 - 2,1 - 3,4 2,8 - 3,1 -

3,9 - 2,9 - 3,5 - 3,0 - 3,1 - 2,2 - 3,4 - 2,5 - 1,9 - 3,0 - 2,9 - 2,4 - 3,4 - 2,0 - 2,6 3,1 - 2,3 - 3,5 - 2,9 -

3,0 - 2,7 - 2,9 - 2,8 - 2,7 - 3,1 - 3,0 - 3,1 - 2,8 - 2,6 - 2,9 - 3,3

a) Construya una tabla con los datos agrupados en 6 intervalos de amplitud 0,4 kg.

b) Representa gráficamente esta distribución.

c) Calcula la media y la desviación típica.

4. La altura, en centímetros, de un grupo de alumnos y alumnas de una misma clase es:

150, 169, 171, 172, 172, 175, 181, 182, 183, 177, 179, 176, 184, 158

Calcula razonadamente la mediana y los cuartiles.

5. Hallar la mediana, los cuartiles y el percentil 60 en cada una de las siguientes distribuciones,

correspondientes a las notas obtenidas en un test que han hecho dos grupos de estudiantes:

A: 25 – 22 – 27 – 30 – 23 – 22 – 31 – 18 - 24 – 25 – 32 – 35 – 20 – 28 – 30

B: 27 – 32 – 19 – 22 – 25 – 30 – 21 - 29 – 23 – 31 – 21 – 20 – 18 – 27

6. Los gastos mensuales de una empresa A tienen una media de 100 000 Bs. y una desviación

típica de 12500 Bs. En otra empresa B la media es 15000 Bs. y la desviación típica 2500 Bs.

Calcula el coeficiente de variación y di cuál de las dos tiene mayor variación relativa.

Page 60: Libro de estadistica

59

7. Calcular la media, la varianza, la desviación típica y el coeficiente de variación de Pearson tras

encuestar a 25 familias sobre el número de hijos que tenían, se obtuvieron los siguientes datos:

Nº de hijos (Xi) 0 1 2 3 4

Nº de familias (ni) 5 6 8 4 2

8. Un fabricante de neumáticos ha recabado, de los diferentes concesionarios, información sobre

la cantidad de miles de kilómetros recorridos por un modelo concreto de esos neumáticos hasta

que se ha producido un pinchazo o un reventón del neumático. Los concesionarios la han

proporcionado los siguientes datos:

61.979 - 4.3068 - 41.539 - 62.215 - 51.269 - 82.919 - 34.182 - 37.654 - 51.179 - 74.582 58.708 -

48.035 - 67.124 - 41.830 - 61.030 - 58.267 - 74.239 - 60.727 - 56.155 - 86.070 90.565 - 53.751 -

76.580 - 68.629 - 48.240 - 57.884 - 55.257 - 84.656 - 48.662 - 10.504 60.951 - 38.420 - 79.426 -

67.662 - 53.324 - 49.011 - 29.480 - 41.128 - 30.252 - 33.412 - 47.012 - 71.360 - 78.635 - 41.715 -

72.635 - 41.463 - 48.996 - 48.172 - 55.643 - 55.912 46.681 - 66.519 - 59.168 - 66.313 - 35.884 -

28.625 - 84.588 - 40.709 - 50.238 - 61.390 85.720 - 45.313 - 46.724 - 61.752 - 63.692 - 70.003 -

65.996 - 55.989 - 49.677 - 46.502 67.467 - 64.398 - 44.411 - 41.886 - 34.754 - 59.888 - 59.449 -

67.632 - 89.116 - 69.483 - 48.698 - 65.854 - 75.850 - 36.949 - 75.548 - 69.010 - 61.477 - 65.585 -

52.452 - 50.432 37.748 - 51.831 - 73.808 - 61.065 - 35.807 - 57.277 - 80.502 - 35.342 - 44.719 -

37.402

Se pide:

a- Construir una taba de frecuencias para esos datos tomando como número de intervalos el que

proporciona la fórmula de Sturges. Interpretas la tabla.

b- Construir las tablas de frecuencias por el método Empírico.

c- Dibujar el histograma y el polígono de frecuencias.

d- Calcular las principales medidas de tendencia central e interpretarlas.

e- Obtener las medidas de dispersión más importantes e interpretarlas.

f- Analizar la asimetría y el apuntamiento de la distribución de frecuencias resultante.

g- Si el fabricante quiere proponer un kilometraje para realizar el cambio de neumáticos, ¿qué

valor propondría para que solo 3 de cada 10 coches hayan tenido un pinchazo o reventón antes de

ese kilometraje?

Page 61: Libro de estadistica

60

Introducción a la Probabilidad

Estadística: Ciencia del estado. Descripción y recogida de grandes conjuntos de datos y su

presentación en tablas y gráficos.

Actualmente es el resultado de la unión de:

- Cálculo de Probabilidades (siglo XVII)

- Estadística

Que evolucionan conjuntamente desde el siglo XIX.

Probabilidad: da una medida de la incertidumbre que puede ser debida a la aleatoriedad o al

desconocimiento del estado del sistema.

Estadística Teórica: Desarrolla modelos Matemáticos.

Estadística Metodológica o Práctica.

Estadística Descriptiva: Resumen y descripción de datos.

Estadística Inferencial: Toma decisiones a partir de los datos tomados en el contexto

general del que provienen.

Fenómeno Natural: Es cualquier cosa que ocurre en la naturaleza.

Existen 2 tipos de fenómenos: Deterministico y Probabilistico

- Fenómeno Deterministico o no Aleatorio: Bajo las mismas condiciones iniciales, el resultado

es el mismo. Leyes físicas y químicas clásicas.

- Fenómeno Aleatorio: Dadas unas condiciones iniciales el resultado no es el mismo.

Nº de partículas emitidas por una fuente radioactiva, Tiempo de vida de una lámpara, Resultado

del lanzamiento de una moneda.

Un experimento es un proceso mediante el cual se obtiene un resultado.

Aleatorio

ticoDeterminisoExperiment

En la Estadística se estudian los experimentos aleatorios, en los cuales, no se puede

anticipar el resultado.

Experimento Deterministico o no Aleatorio: Observación de un fenómeno No aleatorio.

Experimento Aleatorio (E): Observación de un fenómeno aleatorio. Son rasgos esenciales:

Page 62: Libro de estadistica

61

Los posibles resultados son conocidos antes de su realización (Espacio Muestral), No se

puede predecir con exactitud el resultado del experimento, Se puede repetir indefinidamente en

las mismas condiciones. Ejemplo el lanzar una moneda al aire.

Características de un Experimento Aleatorio

- Que pueda repetirse n veces.

- Conduce a diferentes resultados, pero se pueden conocer estos.

- Posee regularidad Estadística(de tanto que se repite tiende a un mismo resultado)

Espacio Muestral de un Experimento Aleatorio (S): El conjunto de todos los posibles

resultados de un experimento aleatorio.

E = Lanzar una moneda 2 veces

S = {(c, s) (s, c) (s, s) (c, c)}

Tipos de Espacios Muéstrales, de acuerdo al número de elementos, el espacio muestral se

clasifica en:

Espacio Muestral finito: El número de resultados posibles es un número entero determinado

Espacio Muestral infinito: El número de resultados posibles es un número entero no

determinado, y el mismo puede ser contable (numerable), o no contable (no numerable).

Infinito Contable o Numerable: el número de resultados posibles no puede ser

determinado pero puede ser numerado.

Infinito no Contable o Numerable: el número de resultados posibles no puede ser

determinado ni numerado.

Ejemplos:

1. E: Lanzar un dado 2 veces

S: {(1,1)…….. (6,6)}; S es Finito.

2. E: Observar los Alumnos del Núcleo

S: {1, 2, 3, 4………n} ; S es Finito.

3. E: Observar los Vehículos que pasan frente a la Universidad

S: {1, 2, 3, 4,………….n……..} ; S es Infinito Contable.

4. E: Observar la duración de un bombillo.

S: {t / t≥0} t es la duración del bombillo ; S es Infinito no contable.

Page 63: Libro de estadistica

62

Suceso o Evento: Es una colección de posibles resultados.

Los sucesos aleatorios son subconjuntos del espacio muestral y se pueden utilizar entre ellos las

operaciones habituales entre conjuntos. Se denota con una letra mayúscula a partir de la A; A S.

Ejemplos:

1.- El espacio muestral asociado al experimento: lanzar una moneda es:

S = {c, x}

A = {Que aparezca cara.}

A = {c}

2.- El espacio muestral asociado al lanzamiento de dos monedas es:

S = {cc, cx, xc, xx}

A = {Que aparezca cara}

A = {(c,c) (c,x) (x,c)}

C

X

C

X

C

X

CC

CX

XC

XX

3.-Espacio muestral asociado al experimento: Lanzar un dado.

S = {1, 2, 3, 4, 5, 6}

A = {Que aparezca Par}

A = {2, 4, 6}

4.- Espacio muestral asociado a al experimento. : Lanzar dos dados:

S = { (1,1,),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6)

(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,5),(4,6)

(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}

A = {Que aparezca Uno}

A = {1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1 (3,1) (4,1) (5,1) (6,1)}

Page 64: Libro de estadistica

63

Tipos de Eventos.

Compuesto

SimpleEVENTO

-Eventos simples:

Es un subconjunto que contiene un solo espacio muestral.

-Eventos compuestos:

Es una combinación de eventos simples.

Relación Entre Eventos.

Eventos Solapados

AB, son Eventos solapados, si tienen elementos comunes, estos elementos comunes a AB,

forman un subconjunto llamado intersección (A B) de AB.

Eventos Mutuamente Excluyentes

AB, son Eventos excluyentes A B = (la ocurrencia de uno impide la ocurrencia del

otro, no pueden darse o no pueden ocurrir simultáneamente) P(A B) = P (A) + P (B).

Eventos Dependientes: Dos o mas eventos son dependientes cuando el conocimiento de la

verificación de uno de ellos altera la probabilidad de verificación del o de los otros. Si los eventos

AB, son dependientes A, si la Probabilidad de que “B” suceda, esta influenciada por A

P (B) = P (B/A) P (AB) = P (A) x P (B/A).

Eventos Independientes: un evento B es independiente de un evento A, si la Probabilidad de que

“B” suceda, no esta influenciada por A P (B/A) = P (B) P(AB) = P (A) x P (B)

Eventos Complementarios: AB, son Eventos complementarios, si el segundo es un

subconjunto que contiene todos los elementos que no están en el primero. Los eventos

complementarios son a su vez mutuamente excluyentes: AB = S y A B = .

Operaciones con Eventos.

1. Unión de sucesos: AB: Sean A y B eventos, AB es otro evento, el cual ocurre cuando A

ocurre, ocurre B o cuando ocurren ambos.

Dados dos sucesos A y B de un mismo experimento aleatorio, llamaremos suceso unión de

A y B al suceso que se realiza cuando se realiza A o B.

Por tanto EAA

Page 65: Libro de estadistica

64

Ejemplo

Sea el Experimento "Lanzar un dado" S = {1, 2, 3, 4, 5,6}

A ="Salir un número par" = {2, 4,6,}; B ="Salir un número primo = {1, 2, 3,5}

A B= {1, 2, 3, 4, 5,6}

2. Intersección de sucesos. AB: Sean A y B eventos, AB es otro evento, cuando ocurre A y

B simultáneamente.

Llamaremos suceso intersección de A y B al suceso que se realiza si se realizan A y B

(En el ejemplo anterior. BA = {2})

Si BA = , entonces se dice que A y B son incompatibles.

Si BA , entonces se dice que A y B son compatibles.

3.- A: Se lee complemento de A y es el evento que ocurre cuando no ocurre A.

n

4. - A1 A2 A3……….A = Ai

i = 1

n

5. - A1A2A3……….A = Ai

i = 1

6.- un evento que no ocurre.

7.- S Espacio Muestral.

8.- A S = S.

9.- A S = A.

10.- A =

11.- A = A

Ejemplos

1. Escribimos cada una de las palabras JUEGO en una ficha y las ponemos en una bolsa.

Extraemos una letra al azar.

Page 66: Libro de estadistica

65

a) escriba los sucesos elementales de este experimento aleatorio.¿ tienen todos la misma

probabilidad?

b) Escriba el suceso obtener una vocal.

Solución

a) Los sucesos elementales son: (J), (U), (E), (G), (O)

Todos tienen la misma probabilidad ya que las letras aparecen cada una, “una sola vez”.

b) A = Obtener vocal.

A = {U, E, O}

2. En un sorteo de lotería observamos la cifra en que termina el premio

a) ¿Cual es el espacio Muestral?

b) Escriba los sucesos A = Menor que 5 ; B = Par

c) Hallar los sucesos A B ; A B ; A’ ; B’ ; A’ B’

Solución

a) E espacio muestral es S: 9,8,7,6,5,4,3,2,1,0

b) A: 4,3,2,1,0 B: 8,6,4,2,0

c) A B = 8,6,4,3,2,1,0 A B = 4,2,0 A’ = 9,8,7,6,5

B’= 9,7,5,3,1 A’ B’ = 9,7,5

3. Lanzamos tres veces una moneda y anotamos si sale cara o sello.

a) Escribir el espacio muestral.

b) Escribir el suceso A = Salió cara la primera vez.

c) Cual es el suceso contrario de A, Escriba los puntos muéstrales.

d) Escriba el suceso B = obtener el mismo valor tres veces.

e) Escribir los sucesos B’, .BAyBA

Solución

a) sss,ssc,scs,scc,csscsc,,ccs,cccS

b) csscsc,,ccs,cccA

c) ssssscscssccsellosaliovezprimeralaA ,,,'

d) ssscccB ,

e) ssc,scs,scc,csscsc,csc,,ccsB

Page 67: Libro de estadistica

66

sss,csscsc,,ccs,cccBA

.cccBA

4. En una caja hay una bola blanca y una bola negra, en otra caja hay una bola negra, una bola

blanca y una bola roja: se extrae una bola de cada una de las cajas y se anota su color:

a) Cual es el espacio muestral.

b) Escriba los sucesos: A = la segunda bola es roja, B = alguna de las bolas es blanca.

c) Escriba los sucesos: A’, B’, .BAyBA

d) Cual es el suceso contrario de nr,br,bnC

Solución:

a) S = {(b, n) (b, b) (b, r) (n, n) (n, b) (n, r)}.

b) A = {(b, r) (n, r)}. b = {(b,n)(b,b)(b,r)(n,b)}

c) A’ = {(b, b) (bn) (n, b) (n, n)}; b’ = {(n, n) (n, r)}.

.BA = {(b, r) (n, r) (b, b) (b, n) (n, b)}

A∩B = {(b, r)}.

d) C’ = {(b, b) (n, b) (n, n)}

Problemas Propuestos de Experimentos y Espacios Muéstrales

1. Determine el espacio muestral del siguiente Experimento, lanzar un dado dos veces, estudiar el

Evento: que aparezca el número uno.

2. Determine el espacio muestral del siguiente experimento, lanzar una moneda tres veces,

estudiar los eventos: que aparezca un sello, que aparezca al menos una cara, que aparezca cara.

3. Determine el espacio muestral del siguiente experimento, se lanzan juntos una moneda y un

dado una sola vez.

4. Considérese el experimento lanzar dos dados una sola vez y observar la suma de sus caras.

Se pide:

a.-El espacio muestral.

Page 68: Libro de estadistica

67

b.-Los eventos:

i: se observa 2

ii: se observa 7

iii: se observa una suma menor a 7

iv: se observan ambos A y C

c.-Que relación existe entre los eventos.

4. Los artículos provenientes de una línea de producción se clasifican como defectuosos (D), o no

defectuosos(N). Se observan los artículos y se anota su condición. Este proceso se continúa hasta

que se produzca dos (2) artículos defectuosos consecutivos o se verifiquen cuatro (04) artículos,

cualesquiera que ocurran primero. Describir un espacio muestral para este experimento.

Determinar el experimento.

5. Considérese cuatro (4) objetos, con a, b, c, d, supóngase que el orden que se anotan esos

objetos representa el resultado de un experimento, sea A el evento “a” esta en el primer lugar y B

el evento “b” esta en el segundo lugar. Determinar todos los elementos del espacio muestral y

sus tipos.

6. Un lote formado por 15 unidades de las cuales se sabe que contiene tres unidades defectuosas,

es inspeccionado por el consumidor tomando una a una hasta tres unidades. El lote se acepta al

aparecer una unidad buena.

7. Sea el siguiente experimento: Lanzamos un dado y una Moneda.

a) Describir el espacio muestral

b) Describir los sucesos A y B

A = “Sacar uno o dos en el dado”

B = “sacar + en la moneda”

c) Hallar AUB, A∩B, AUD'

8. Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas al azar, si son

partidarias o no de consumir un determinado producto.

a) Escribe el espacio muestral asociado a dicho experimento utilizando la letra “s” para las

respuestas afirmativas y la “n” para las negativas.

b) ¿Qué elementos del espacio muestral anterior constituyen el suceso “al menos dos de las

Page 69: Libro de estadistica

68

personas son partidarias de consumir el producto”?

c) Describe el suceso contrario de “más de una persona es partidaria de consumir el producto”.

9. En familias de tres hijos, se estudia la distribución de sus sexos.

a) ¿Cuántos elementos tiene el espacio muestral E?

b) Describe los siguientes sucesos: A = “La menor es mujer”, B = “El mayor es varón”.

c) ¿En qué consiste A UB?

10. Describir el espacio muestral correspondiente a las siguientes experiencias aleatorias. Si es

finito y tiene pocos elementos, enumérelos todos, y si tiene muchos, descríbelo y diga cual es el

número total.

a) Extraemos una carta de una baraja española y anotamos el número.

b) Extraemos una carta de una baraja española y anotamos la figura.

c) Extraemos dos cartas de una baraja española y anotamos la figura de cada una.

d) Lanzamos seis monedas distintas y anotamos el resultado.

e) Lanzamos seis monedas distintas y anotamos el número de caras.

11. Si A y B son dos sucesos de un experimento aleatorio y P [A] = 0:

a) ¿Qué podemos decir de P [A ∩ B]?

b) ¿Y de P [A U B]?

c) Responde a las mismas preguntas si P [A] = 1.

Page 70: Libro de estadistica

69

Probabilidad

El Cálculo de probabilidades tiene por objeto la construcción y estudio de modelos

estadísticos.

La probabilidad es una medida de la posibilidad o certidumbre de la ocurrencia de un suceso

Definición de Probabilidad como Frecuencia

Supongamos una población homogénea y finita con N elementos, de los que k presentan

la característica A.

P(A)=k/N o Si la población no es finita, repetimos el experimento una “cantidad grande” de

veces.

Frecuencia Relativa: fA = mA/m

mA = nº de veces que apareció la característica A

m = nº de veces que se realizó el experimento.

La fA tiende a estabilizarse según crece m. Esta definición presenta problemas:

- ¿Cuántas veces ha de repetirse el experimento?

- La información es limitada

- El sistema observado puede cambiar en el tiempo de observación.

Por estas razones la probabilidad se introdujo axiomáticamente utilizando las propiedades de la

frecuencia relativa. Este enfoque ayuda a simplificar los modelos teóricos, pero no ofrece una

guía para calcular la probabilidad.

Idea Intuitiva de Probabilidad.

Supongamos que lanzamos una moneda y anotamos las veces que sale cara. Después de

10, 20,30,......,200 lanzamientos obtenemos los resultados:

N de lanzamientos 10 20 30 40 50 60 70 80.................200

N de caras Obtenidas 6 11 16 20 27 31 37 43.................101

frecuencia. relativa 0,6 0,55 0,53 0,5 0,54 0,51 0,52 0,53..............0,50

Page 71: Libro de estadistica

70

Si repitiéramos el experimento obtendríamos resultados muy parecidos.

Podemos sacar en conclusión que las frecuencias relativas del suceso cara tienden a

estabilizarse hacia el valor 0,5.

Este número al que la frecuencia relativa se acerca más cuanto mayor es el número de

pruebas realizadas, lo llamaremos probabilidad del suceso. La probabilidad de un suceso A, se

representará p (A).

Por tanto se puede interpretar la probabilidad de un suceso como límite de frecuencias

relativas.

Regla de LAPLACE.

"La probabilidad de un suceso A es el cociente entre el número de casos favorables y el

número de casos posibles."

ss posiblenº de caso

favorabless nº de casop(A)

Hay que tener en cuenta que los sucesos elementales tienen que ser igualmente probables

(equiprobables).

Ejemplos:

1. Si realizamos el siguiente experimento “Lanzar un Dado”

Calcular la probabilidad de los eventos:

a) A = {número par} = {2, 4, 6} p (A) = 3/6 = 1/2

b) B = {Obtener primo} = {2, 3, 5} p (B) = 3/6 = 1/2

c) C = {Obtener múltiplos de 3} = {3, 6} p (C) = 2/6 = 1/3

d) D = {Obtener múltiplo de 5} = {5} p (D) = 1/6

2) Realizar el experimento siguiente y Calcular la probabilidad de los eventos:

“Lanzar dos monedas” S = {cc, cs, ss, sc}

a) A = {Obtener dos caras} p(A) =1/4

b) B = {Obtener dos Sellos} p (B) = 1/4

c) C = {Obtener una cara y un sello} p(C) = 2/4

d) D = {Obtener al menos un sello} p (D) = 3/4

Page 72: Libro de estadistica

71

3) Sea el siguiente Experimento

E = {"Extracción de una carta de una baraja española"}

Calcular la probabilidad de los eventos:

a) A = {Obtener un oro} p(A) = 10/40 = 1/4

b) B = {Obtener un as} p (B) = 4/40 = 1/10

c) C = {Obtener una sota de espadas} p(C) = 1/40

d) D = {Obtener un as o una sota} p (D) = 8/40 = 1/5

e) E = {Obtener bastos o espadas} p(E) = 20/40 = 1/2

f) F = {Obtener una figura} p (F) = 12/40 = 3/10

Definición axiomática de probabilidad

Se llama probabilidad a una ley que asocia a cada suceso A un número real entre 0 y 1,

que llamaremos probabilidad de A y representaremos p(A). La probabilidad debe cumplir los

siguientes axiomas:

Bp+Ap=BAp =B ASi -3.

1=Ep -2.

A 0Ap -1.

Propiedades:

BApBpApBAp v)

A 1Ap iv)

BpAp B ASi iii)

0p ii)

AAp1Ap i)

Ejemplos:

1. Sea el siguiente experimento:

E = "Extraer una carta de una baraja"

Y los sucesos siguientes:

Page 73: Libro de estadistica

72

A = "Obtener un oro" , B = "Obtener un rey"

C = "Obtener un as de espadas" , D = "Obtener figuras"

i) A y B son compatibles, pues BA = "Obtener rey de oros"

40

13

40

1

40

4

40

10)()()()( BApBpApBAp

ii) A y C son incompatibles, pues no se puede obtener un oro y el as de espadas a la vez.

40

11

40

1

40

10 CpApCAp

iii) AB P (B) = 4/40 = 1/10 < p (A) = 12/40 = 3/10

iv) DA ="obtener figura de oros"

40

19

40

3

40

12

40

10)()()()( DApDpApDAp

2. Sea el experimento siguiente:

Lanzamos dos monedas y anotamos el número de caras que obtenemos. El espacio

muestral es 2,1,0S .

a) Tienen los tres sucesos elementales la misma probabilidad.

b) Calcular la probabilidad de: 0 caras, 1 cara, 2 caras, compruebe que su suma es igual a

uno.

c) Cual es el suceso contrario de 0 caras.

d) Cual es la probabilidad del suceso alguna cara.

Solución

a) No el suceso una cara tiene mas probabilidad que los sucesos o caras y dos caras.

b) 4

1)0(0 PCarasP ;

2

1

4

2)1(1 PCarasP ;

4

1)2(2 PCarasP

14

1

2

1

4

1)2()1()0( PPP

c) S = 0 Caras; S’ = Al menos una Cara.

4

3

4

11)CaraNinguna(P1CaraunamenosAlP

Page 74: Libro de estadistica

73

METODOS DE ENUMERACION

Combinatoria

Se llama factorial de un número natural x y se representa por x! Al producto de x factores

consecutivos y decrecientes a partir de x hasta el 1:

Ejemplos: .241.2.3.4!461.2.3!321.2!21!11!0 etc

VARIACIONES:

Se llaman Variaciones ordinarias de n elementos tomados de m en m (m < n) a los grupos

de m elementos que se pueden formar con los n elementos dados considerándose como distintos

dos de ellos cuando difieran en algún elemento o en el orden de colocación de los mismos.

El número de variaciones ordinarias se calcula así:

)!mn(

!nVm

n

Ejemplo: ?Cuántas palabras de 3 letras se pueden formar con las cinco letras vocales (tengan o

no sentido)? Como influye el orden y n = 5; m = 3, se tiene:

601.2

1.2.3.4.5

!2

!5

)!35(

!5V3

5

Se Usa cando se quiere calcular cuantos grupos de m elementos se poden formar con m

elementos (m <n), teniendo en cuenta que cada grupo se diferencia de otro por tener un elemento

distinto o bien por el orden de colocación de los mismos.

Ejemplo: De una bolsa que contienen 12 bolas numeradas de 1 al 12 se extraen 4. Si tenemos en

cuenta que las bolas no se devuelven a la bolsa, Cuantos números podríamos llegar a formar?

Solución: V12

4 12 121 ........................... 12-4+1 121110911.880

Se llaman variaciones con repetición de n elementos tomados de m en m al número de

grupos que se pueden formar con los n elementos (pudiendo repetirse), contando cada grupo con

m elementos y considerándose como distintos dos grupos cuando difieran en algún elemento o en

el orden de colocación de los mismos. Su número se calcula así:

Page 75: Libro de estadistica

74 mm

n nRV

Ejemplo: Si en anterior ejemplo de las palabras formadas por las cinco vocales pudieran repetirse

letras ¿Cuántas habría?

125533

5 RV

PERMUTACIONES:

A las variaciones ordinarias de n elementos tomados n a n (n = m) se las llama

permutaciones de n elementos y su número es:

!nPn

Las permutaciones permiten calcular de cuantas formas distintas se pueden ordenar m elementos.

Ejemplo:¿ De cuantas formas distintas pueden sentarse 7 personas en un banco?.

Solución: 50401.2.3.4.5.6.7!77 P

Ejemplo: ¿Cuántas palabras de 5 letras pueden formarse con las 5 letras vocales?

1201.2.3.4.5!57 P

COMBINACIONES:

Combinaciones de n elementos tomados de m en m:

)!(!

!

mnm

n

m

nCm

n

Como en el caso de las variaciones también calcula el número de grupos de m elementos

que se pueden formar con los n elementos dados considerándose como distintos dos de ellos

cuando difieran en algún elemento pero no en el orden de colocación de los mismos. Su número

es:

Ejemplo: ¿Cual es el número de apuestas diferentes que se pueden hacer en una lotería que tiene

49 números, si el numero ganador tiene 6 cifras?

816.983.13!43.1.2.3.4.5.6

43.44.45.46.47.48.48

)!649(.!6

!49

6

49

)!(!

! 6

49

C

mnm

n

m

nCm

n

Page 76: Libro de estadistica

75

Ejemplo: Si en una clase de 40 alumnos queremos formar grupos de 5 sin que importe el orden en

que se elige a los componentes ¿Cuántos grupos saldrían?

658008!35.1.2.3.4.5.

!35.36.37.3938.40

)!540(.!5

!40

5

40

)!(!

! 5

40

C

mnm

n

m

nCm

n

En la mayoría de problemas de combinatoria, la dificultad estriba es saber si hay que

aplicar las fórmulas de variaciones, permutaciones o combinaciones. La siguiente tabla nos

ayudará a decidir:

Principio de Multiplicación: Si se tiene un evento A y ese evento puede ocurrir de m maneras

diferentes y un elemento B que puede ocurrir de n maneras diferentes, la Intercepción de esos

eventos ocurrirá de m x n maneras diferentes.

Ejercicios resueltos de combinatoria

1) ¿De cuantas maneras pueden sentarse 10 personas en un banco si hay 4 sitios disponibles?

Solución

Determinamos n y m

¿Es n = m?

Sí No

!nPn ¿Influye el

orden?

No Sí

¿Pueden

repetirse?

)!(!

!

mnm

n

m

nCm

n

Sí No

mm

n nRV

)!(

!

mn

nV m

n

Page 77: Libro de estadistica

76

Nótese que importa el orden en que se sienten las personas, ya que los cuatro sitios son

diferentes, y que una persona no puede ocupar más de un sitio a la vez. Por lo tanto, hay V10; 4 =

10!/6! = 10 . 9 . 8 . 7 = 5040 maneras.

2) En una clase de 10 alumnos van a distribuirse 3 premios. Averiguar de cuantos modos puede

hacerse si:

a. los premios son diferentes;

b. los premios son iguales.

Solución

Hay dos supuestos posibles:

Si una misma persona no puede recibir más de un premio:

a. hay V10;3 = 10 . 9 . 8 = 720 maneras de distribuir los premios si estos son diferentes;

b. en el caso de que los premios sean iguales, pueden distribuirse de C10;3 = (10 . 9 . 8)/6 = 120

maneras.

Si una misma persona puede recibir más de un premio:

a. Se pueden distribuir los premios, si estos son diferentes, de V R10;3 =103 = 1000 maneras;

b. hay CR10;3 = 220 maneras de distribuir los premios si estos son iguales.

3) Hay que colocar a 5 hombres y 4 mujeres en una fila de modo que las mujeres ocupen los

lugares pares. ¿De cuantas maneras puede hacerse?

Solución

Ya que la fila es de 9 individuos en total, hay 4 posiciones pares (que deben ser ocupadas

por las 4 mujeres) y 5 posiciones impares (para los 5 hombres). Por lo tanto, pueden colocarse de

P4 . P5 = 4! . 5! = 2880 maneras.

4) ¿Cuantos números de 4 dígitos se pueden formar con las cifras 0,1,. . . ,9

a. Permitiendo repeticiones;

b. Sin repeticiones;

c. Si el ultimo dıgito ha de ser 0 y no se permiten repeticiones?

Solución

Asumamos que para que un número sea de 4 dígitos su primer dıgito debe ser distinto de

Page 78: Libro de estadistica

77

cero.

a. Puesto que debe formarse un número de 4 dígitos, el primero de estos no puede ser cero. Por lo

tanto, hay nueve posibilidades para el primer dıgito y diez para cada uno de los tres dígitos

restantes, obteniéndose un total de 9 . 103 = 9000 números posibles.

b. Al igual que en el apartado anterior, el primer dıgito no puede ser cero. Como además no se

permiten repeticiones, hay nueve posibilidades para el segundo dıgito: el cero y las ocho no

escogidas para el primer dıgito. Por tanto, se pueden formar 92 . 8 . 7 = 4536 números.

c. Fijamos el último dıgito y, como no puede haber repeticiones, se obtiene un total de 9 . 8 . 7 . 1

= 504 números.

5) En un grupo de 10 amigos, ¿cuantas distribuciones de sus fechas de cumpleaños pueden darse

al año?

Solución

Considerando que el año tiene 365 días y que puede darse el caso de que varias personas cumplan

en la misma fecha, el numero de maneras distintas es V R365;10 = 36510

6) Cuatro libros de matemáticas, seis de física y dos de química han de ser colocados en una

estantería ¿Cuantas colocaciones distintas admiten si:

a. Los libros de cada materia han de estar juntos;

b. Solo los de matemáticas tienen que estar juntos?

Solución

Supongamos que los libros de cada materia también son diferentes (de distintos autores).

a. Consideramos cada conjunto de libros de una misma materia como una unidad. Entonces, hay

3! = 6 ordenaciones posibles de las materias. Además hay que considerar también las 4! = 24

permutaciones de los libros de matemáticas, así como las 6! = 720 y las 2! = 2 de los de física y

química, respectivamente. Se concluye así que hay 3!.4!.6!.2! = 207360 colocaciones distintas.

b. Consideremos los cuatro libros de matemáticas como una unidad.

Se tendría entonces una unidad correspondiente a matemáticas, 6 unidades diferentes de física y

dos unidades diferentes de química. Por lo tanto, existen 9! = 362880 maneras de ordenar estas 9

unidades, y por cada una de ellas hay 4! Ordenaciones posibles de los 4 libros de matemáticas,

por lo que en total hay 9! . 4! = 8709120 formas de colocar los libros.

Page 79: Libro de estadistica

78

Supongamos que los libros de cada materia son idénticos.

a. Consideremos cada conjunto de libros de una misma materia como una unidad. Nótese que

entonces se tendría un total de 3 unidades, que pueden ordenarse de 3! = 6 formas distintas.

b. En este caso tendremos una única unidad de matemáticas, además de 6 de física y 2 de

química, que consideraremos diferentes para este cálculo inicial. Se tiene entonces un total de 9!

= 362880 ordenaciones posibles y, puesto que los libros de cada materia son indistinguibles,

nótese que deben tenerse en cuenta las 6! . 2! = 1440 formas de colocar los libros de física y

matemáticas. Por lo tanto, hay un total de 9!/ (6! . 2!) = 252 ordenaciones.

7) Un alumno tiene que elegir 7 de las 10 preguntas de un examen. ¿De cuantas maneras puede

elegirlas? ¿Y si las 4 primeras son obligatorias?

Solución

El orden en que elija las preguntas, que además no podrán repetirse, es irrelevante. Así, puede

elegir las preguntas de C10;7 = (10.9.8) / (3 . 2) = 120 maneras.

Por otra parte, si las 4 primeras son obligatorias, debe escoger 3 preguntas entre las 6 restantes

para completar las 7 necesarias, resultando un total de C6;3 = (6 . 5 . 4) / (3 . 2) = 20 maneras.

Problemas Propuestos de Cálculo de Probabilidades

1. Hallar la probabilidad de sacar una suma de 8 puntos al lanzar dos dados.

2. Hallar la probabilidad de sacar por suma o bien 4, o bien 11 al lanzar dos dados.

3. Se escriben a azar las cinco vocales. ¿Cuál es la probabilidad de que la “e” aparezca

la primera y la “o” la última.

4. ¿Cuál es la probabilidad de sacar dos bolas negras de una urna que contiene 15 bolas

blancas y 12 negras, sin reintegrar la bola extraída?

5. Una caja contiene 12 bolas blancas y 8 negras. Si se sacan dos bolas al azar. ¿Cuál es

la probabilidad de que sean del mismo color?

6. Una caja contiene 12 bolas blancas y 8 negras. ¿Cuál es la probabilidad de sacar dos

bolas negras reintegrando la bola extraída?

7. De una baraja española de 40 cartas ¿Cuál es la probabilidad de sacar un caballo

seguido de un tres, reintegrando la primera carta? ¿Y sin reintegrarla?

8. Si la probabilidad de que ocurra un suceso es 1/3. ¿Cuál es la probabilidad de que se

realice efectuando 4 pruebas.

Page 80: Libro de estadistica

79

9. Se sacan dos cartas de una baraja de 40 ¿Cuál es la probabilidad de que sean un

caballo y un tres, reintegrando? ¿Y sin reintegrar?

10. Una caja contiene 8 bolas blancas, 5 negras y 2 rojas. Se extraen tres bolas al azar y se

desea saber:

a) La probabilidad de que las tres bolas sean blancas.

b) La probabilidad de que dos sean blancas y una negra.

11. Se extraen 3 cartas de una baraja de 40:

a) ¿Cuál es la probabilidad de que sean tres sotas.

b) ¿Y de que sean un as, un dos y un tres?

c) ¿Y de que salga un rey, seguido de un cinco y éste de un siete?

12. Una caja contiene dos bolas blancas y tres negras. Otra contiene seis blancas y cuatro

negras. si extraemos una bola de cada caja. ¿Cuál es la probabilidad de que sean las

dos negras?

13. Al lanzar dos veces un dado ¿Cuál es la probabilidad de que la suma de puntos sea

divisible por tres?

14. Con las cifras 1, 2, 3, 4 y 5 se escriben todos los números posibles de tres cifras, sin

repetir cifras en cada número. si se señala un número al azar:

a) ¿Cuál es la probabilidad de que sea múltiplo de 4?

b) ¿Y de que sea múltiplo de 3?

15. Una caja contiene 8 bolas rojas, 4 azules y 6 verdes. Se extraen 3 bolas al azar y se

desea saber:

a) La probabilidad de que las tres sean rojas.

b) La probabilidad de que dos sean rojas y una verde.

c) La probabilidad de que dos sean azules y la otra de otro color.

d) La probabilidad de que todas sean de distinto color.

e) La probabilidad de que todas sean del mismo color.

16. Se lanza un dado 6 veces. ¿Cuál es la probabilidad de que salga algún 1 en los 6

lanzamientos?

17. Una caja contiene 2 bolas blancas, 3 negras y 4 rojas. Otra contiene 3 blancas, 5

negras y 4 rojas. Se toma una bola al azar de cada caja. ¿Qué probabilidad hay de que

sean del mismo color?

Page 81: Libro de estadistica

80

18. En una bolsa hay 50 bolas, aparentemente iguales, numeradas del 1 al 50. ¿Qué

probabilidad hay de sacar, una a una, las 50 bolas en el orden natural?

19. La probabilidad de acertar en un blanco de un disparo se estima en 0,2. La

probabilidad de acertar en dos disparos será P1= 0,04; P2= 0,36; P3= 0,12. Determinar

qué respuesta el la correcta.

20. ¿Cuál es la probabilidad de torpedear un barco, si sólo se pueden lanzar tres torpedos

y la probabilidad de impacto de cada uno se estima en un 30 %?.

21. Se considera el experimento aleatorio “lanzar dos veces un dado”. ¿Cuál es la

probabilidad de obtener número par en el segundo lanzamiento condicionado a

obtener impar en el primero? ¿Son dependientes o independientes estos sucesos? ¿Por

qué?

Page 82: Libro de estadistica

81

PROBABILIDAD CONDICIONAL

Cada suceso aleatorio está asociado con un espacio muestral, su probabilidad depende de

la información de que dispongamos.

Si sabemos que ha ocurrido un suceso B, esta información modifica la probabilidad de los demás

sucesos

Vamos a estudiar como queda modificada la probabilidad de un suceso cuando

disponemos de información adicional de que ha ocurrido otro.

Ejemplo.

"Lanzar dos monedas", cuyo espacio muestral es:

S = {cc, ss, cs, sc} ; La probabilidad de {cc} es 1/4.

Supongamos que salió una cara, entonces la p (cc)=1/2 puesto que el nuevo espacio

muestral queda reducido a S = {cc, cs}.

Cuando el experimento se considera resultado de varios experimentos (como en el caso

anterior), se habla de experimentos compuestos.

Se llama probabilidad condicionada del suceso B respecto del suceso A, y lo denotaremos

por p (B/A), a la probabilidad de que ocurra B, habiendo ocurrido A. Se calcula según la fórmula:

0)()(

)(

Apsi

Ap

BAp

ABp

Se llama probabilidad condicionada del suceso A respecto del suceso B, y lo denotaremos

por p (A/B), a la probabilidad de que ocurra A, habiendo ocurrido B. Se calcula según la fórmula:

0)()(

)(

Bpsi

Bp

BAp

BAp

Usando la formula de la probabilidad condicionada, obtenemos:

Producto del Regla p(B/A)p(A)=p(A/B)p(B)=B)p(Ap(A/B)BpBAp

p(B/A)ApBAp

Si A y B son Eventos Independientes → P(A/B) = P(A) y P (B/A) = P (B) entonces:

P (A∩B) = P(A) x P (B)

Page 83: Libro de estadistica

82

Ejemplo.

"Lanzar un dado al aire". Calcula la probabilidad de obtener un múltiplo de 3, sabiendo

que ha salido puntuación par.

Sea A = "Salir n° par" = {2, 4,6} P (A) = 3/6 = 1/2

B = "Salir múltiplo de 3" = {3,6} P (B) = 2/6 = 1/3

3

1

6

2

21

61

)A(p

)BA(p

ABp

Pues BA = "Salir un N° par múltiplo de 3" = {6}

Sucesos Independientes

Diremos que dos sucesos son independientes si la realización de uno no modifica la

probabilidad de realización del otro. Por tanto A y B son independientes si:

P (A/B) = P (A)

P (B/A) = P (B)

Y entonces, por la regla del producto: P ( BA ) = P(A) P (B)

En caso contrario se dirá que los Sucesos son Dependientes.

Tablas de contingencia y diagramas de árbol

En los problemas de probabilidad y en especial en los de probabilidad condicionada,

resulta interesante y práctico organizar la información en una tabla de contingencia o en un

diagrama de árbol.

Las tablas de contingencia y los diagramas de árbol están íntimamente relacionados, dado

uno de ellos podemos construir el otro. Unas veces, los datos del problema permiten construir

fácilmente uno de ellos y a partir de él podemos construir el otro, que nos ayudará en la

resolución del problema.

Conversión de una tabla en diagrama de árbol

Las tablas de contingencia están referidas a dos características que presentan cada una dos

o más sucesos.

A A TOTAL

B P( A B ) P( A B ) P( B )

B P( A B ) P( BA ) P( B )

TOTAL P( A ) P( A ) 1

Page 84: Libro de estadistica

83

En el caso de los sucesos A, A - B y B , expresados en frecuencias absolutas, relativas o

probabilidades la tabla, adopta la forma adjunta.

Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los

sucesos A y A se les ha asociado los sucesos B y B .

Sobre las ramas del diagrama de árbol se han anotado las probabilidades condicionadas

correspondientes, deducidas de las relaciones análogas a:

)A(P

)AB(P

ABP

Conversión de un diagrama en tabla de contingencia

De manera recíproca, dado el diagrama de árbol podemos construir la tabla de

contingencia equivalente si más que utilizar la expresión.

)A(PA

BP)AB(P

Para calcular las probabilidades de las intersecciones de sucesos que forman la tabla.

Ejemplo:

Un taller sabe que por término medio acuden: por la mañana 3 automóviles con problemas

eléctricos, 8 con problemas mecánicos y 3 con problemas de latonería, y por la tarde 2 con

problemas eléctricos, 3 con problemas mecánicos y 1 con problemas de latonería.

a. Calcula el porcentaje de los que acuden por la tarde.

b. Calcula el porcentaje de los que acuden por problemas mecánicos.

c. Calcula la probabilidad de que un automóvil con problemas eléctricos acuda por la

mañana

Page 85: Libro de estadistica

84

Solución:

En las tablas de contingencia, con las frecuencias absolutas y los porcentajes,

respectivamente, pueden verse recogidos los datos del enunciado.

Las respuestas a las interrogantes planteadas basta leerlas en las tabla. Así:

a. El 30% de los automóviles acude al taller por la tarde.

b. El porcentaje de vehículos ingresados con problemas mecánicos es el 55%.

c. La probabilidad buscada es: P (acuda por la mañana/tiene problemas eléctricos) = 3/5 =

0.6

Ejemplos.

1. Consideremos el experimento de "lanzar un dado al aire". Calculemos, por ejemplo, la

probabilidad de obtener un 3 sabiendo que ha salido un número impar:

Definimos los sucesos A = "sacar 3" y B = {1, 3, 5}; entonces, P(A/B) = 1/3 puesto que si

sabemos que ha salido un número impar, los casos posibles ahora son 3 y los casos favorables al

suceso A sólo 1.

2. Se lanzan dos dados:

a. ¿Cuál es la probabilidad de obtener una suma de puntos igual a 7?

b. Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los dados

haya salido un tres?

Solución:

Sean los sucesos A ="la suma de los puntos es 7" y B ="en alguno de los dados ha salido un tres".

a. Los casos posibles al lanzar dos dados son 36 y los casos favorables al suceso A son los seis

siguientes: (1,6); (2,5); (3,4); (4,3); (5,2) y (6,1). Por tanto, P( A ) = 6/36 = 1/6

ELÉCTRICOS MECÁNICOS LATONERÍA TOTAL

MAÑANA 3 8 3 14

TARDE 2 3 1 6

TOTAL 5 11 4 20

ELÉCTRICOS MECÁNICOS LATONERÍA TOTAL

MAÑANA 0.15 0.40 0.15 0.70

TARDE 0.10 0.15 0.05 0.30

TOTAL 0.25 0.55 0.20 1.00

Page 86: Libro de estadistica

85

b. En este caso, el suceso B/A es salir en algún dado 3, si la suma ha sido 7.

Observamos que esta situación ocurre en las parejas (3,4) y (4,3). Por tanto, P(B/A) = 2/6 = 1/3

3. Se lanza al aire dos dados normales, si la suma de los números que aparecen es de por lo

menos siete, a. determine la probabilidad de que en el segundo dado aparezca el número cuatro,

b. Determine la probabilidad de que ambos números sean pares, c. Determine la probabilidad de

que en el primer dado aparezca el numero dos.

Solución.

El espacio muestral es el mismo que cuando se lanza un dado dos veces y se muestra a

continuación;

S = (1,1) (2,1) (3,1) (4,1) (5,1) (6,1) (1,2) (2,2) (3,2) (4,2) (5,2) (6,2) (1,3) (2,3) (3,3) (4,3) (5,3)

(6,3) (1,4) (2,4) (3,4) (4,4) (5,4) (6,4) (1,5) (2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6) (3,6) (4,6) (5,6)

(6,6)

a. Para calcular una probabilidad condicional es necesario definir los eventos A y B, siendo

estos:

A = Evento de que en el segundo dado aparezca el número cuatro,

B = Evento de que la suma de los números que aparecen sea de por lo menos siete, (que es que es

el evento que está condicionando)

B = 21 elementos, los que suman siete o más

B = (6,1) (5,2) (6,2) (4,3) (5,3) (6,3) (3,4) (4,4) (5,4) (6,4) (2,5) (3,5) (4,5) (5,5) (6,5)

(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

A = 6 elementos, los que en el segundo dado aparece el cuatro

A = (1,4) (2,4) (3,4) (4,4) (5,4) (6,4)

Luego, AB = (3,4) (4,4) (5,4) (6,4), AB= 4 elementos

Por tanto; P(A/B) = PAB/ PB= 4/21 = 0.19048

b. B = Evento de que la suma de los números que aparecen sea de por lo menos siete

B = Conocemos de la parte a que el Evento consta de 21 elementos

A = Evento de que ambos números sean pares

A = (2,2) (4,2) (6,2) (2,4) (4,4) (6,4) (2,6) (4,6) (6,6)

AB = (6,2) (4,4) (6,4) (2,6) (4,6) (6,6)

AB= 6 elementos

p(A/B) = PAB/ PB = 6/ 21 = 0.28571

Page 87: Libro de estadistica

86

c. B = Evento de que la suma de los números que aparecen sea de por lo menos siete

B = (6,1) (5,2) (6,2) (4,3) (5,3) (6,3) (3,4) (4,4) (5,4) (6,4) (2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6)

(3,6) (4,6) (5,6) (6,6)

A = Evento de que en el primer dado aparezca el número dos

A = (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

AB = (2,5),(2,6, AB= 2 elementos

P(A/B) = PAB/PB = 2/21 = 0.04762 OJO

4. Se seleccionan al azar dos números de entre los números del 1 al 9, si la suma de los números

que aparecen es par, a. Determine la probabilidad de que ambos números sean pares, b.

Determine la probabilidad de que ambos números sean impares.

Solución:

S = (1,2) (1,3) (2,3) (1,4) (2,4) (3,4) (1,5) (2,5) (3,5) (4,5) (1,6) (2,6) (3,6) (4,6) (5,6) (1,7) (2,7)

(3,7) (4,7) (5,7) (6,7)(1,8) (2,8) (3,8) (4,8) (5,8) (6,8) (7,8)(1,9) (2,9) (3,9) (4,9) (5,9) (6,9)

(7,9) (8,9)

a. E = Evento de que la suma de los números que se seleccionan sea par

E = (1,3) (2,4) (1,5) (3,5) (2,6) (4,6)(1,3) (3,7) (5,7)(2,8) (4,8) (6,8)

(1,9) (3,9) (5,9) (7,9)

E = 16 elementos

A = Evento de que ambos números sean pares

A = (2,4) (2,6) (4,6) (2,8) (4,8) (6,8)

A = 6 elementos

AE = (2,4) (2,6) (4,6) (2,8) (4,8) (6,8)

AE = 6 elementos, p(A/E) = PAE/ PE= 6/16 = 0.375

b. E = Evento de que la suma de los números seleccionados es par

E = (1,3) (2,4) (1,5) (3,5)(2,6) (4,6)(1,3) (3,7) (5,7)(2,8) (4,8) (6,8)(1,9) (3,9) (5,9) (7,9)

A = Evento de que ambos números sean impares

A = (1,3) (1,5) (3,5)(1,7) (3,7) (5,7)(1,9) (3,9) (5,9) (7,9)

A = 10 elementos

AE = (1,3) (1,5) (3,5) (1,7) (3,7) (5,7)(1,9) (3,9) (5,9) (7,9)

AE= 10 elementos; p(A/E)= PAE/ PE= 10/16 = 0.625

Page 88: Libro de estadistica

87

5. Una pareja de recién casados ha decidido formar una familia de solo tres hijos, a. ¿Cual es la

probabilidad de que tenga puros hijos varones?, b. ¿cuál es la probabilidad de que tenga como

máximo un hijo varón, c. ¿cuál es la probabilidad de que su segundo hijo sea varón, d. Si esta

familia tiene por lo menos una hija, ¿cuál es la probabilidad de que el segundo hijo sea varón?, e.

Si esta familia tiene como máximo un hijo varón, ¿cuál es la probabilidad de que tenga puras

hijas?

Solución:

Lo primero que hay que obtener para resolver este problema es el espacio muestral, para

lo cual nos podemos ayudar con un diagrama de árbol en donde representemos uno tras otro el

nacimiento de cada uno de sus hijos, en donde solo consideraremos partos de un solo bebé, no

múltiples y se considera que existe la misma probabilidad de que nazca un varón o una niña.

El espacio muestral obtenido es:

H = Niño

M = Niña

S = HHH, HHM, HMH, MHH, HMM, MHM, MMH, MMM

a. A = Evento de que la familia tenga puros hijos varones

A = HHH

P(A) = 1/8 = 0.125

b. B = Evento de que la familia tenga como máximo un hijo varón

B = ningún hijo varón o un hijo varón= MMM, HMM, MHM, MMH

P(B) = 4/8 = 1/2 =0.5

c. C = Evento de que el segundo hijo de la familia sea varón

C = HHH, HHM, MHH, MHM

P(C) = 4/8 =1/2 = 0.5

d. Como en este caso se trata de calcular una probabilidad de tipo condicional, se requiere definir

dos eventos, el evento E que es el que condiciona y el evento A;

E = Evento de que la familia tenga por lo menos una hija

E = tenga una o más hijas

E = HHM, HMH, MHH, HMM, MHM, MMH, MMM= 7 elementos

A = Evento de que el segundo hijo sea varón

A = HHH, HHM, MHH, MHM

AE = HHM, MHH, MHM = 3 elementos

Luego:

Page 89: Libro de estadistica

88

P(A/E) = PAE/PE= 3/7 = 0.42857

e. E = Evento de que la familia tenga como máximo un hijo varón

A = Evento de que la familia tenga puras hijas

E = MMM, MHM, MMH, HMM= 4 elementos

A = MMM

AE = MMM = 1 elemento

P(A/E) = AE/E= 1/4 = 0.25

6. Según las estadísticas, la probabilidad de que un auto que llega a cierta gasolinera cargue

gasolina es de 0.79, mientras que la probabilidad de que ponga aceite al motor es de 0.11 y la

probabilidad de que ponga gasolina y aceite al motor es de 0.06, a. Sí un auto carga gasolina,

¿cuál es la probabilidad de que ponga aceite?, b. Sí un auto pone aceite al motor, ¿cuál es la

probabilidad de que ponga gasolina?

Solución:

a. E = Evento de que un auto cargue gasolina

P(E) = 0.79

A = Evento de que un auto ponga aceite al motor

P(A) = 0.11

AE = Evento de que un auto ponga gasolina y aceite

P(AE) = 0.06

P(A/E) = P(AE)/P(E) = 0.06/ 0.79 = 0.07594

b. E = Evento de que un auto ponga aceite al motor

P(E) = 0.11

A = Evento de que un auto ponga gasolina

P(A) = 0.79

AE = Evento de que un auto ponga aceite al motor y ponga gasolina

P(AE) = 0.06

P(A/E) = P(AE)/ P(E) = 0.06/0.11 = 0.5454

Page 90: Libro de estadistica

89

Partición de un Espacio Muestral S

Para que los eventos A1, A2, A3,….An, Sean una partición deben cumplir con:

a) A1, A2, A3,……An...Ai ≠ 0.

b) A1∩ A2∩ A3∩……∩An = Ф.

c) A1 A2 A3……An S.

-Formula o Teorema de las probabilidades Totales:

n

1i

i

n32

n32

)BA(P)B(P

)BA(P.............)BA(P)BA(P)B

)BA(.............)BA()BA()B

1

1

(A PP(B)

(A B

.

)A/B(p)A(p..................)A/B(p)A(p)A/B(p)A(p)B(p nn2211

Ejemplos

1. En un curso de Matemáticas el 30% son Varones, el 45% de los varones y el 20% de las

hembras son de Carabobo.

a) ¿Cual es la probabilidad de que un estudiante seleccionado al azar sea de Carabobo?

Solución:

Sea: los eventos siguientes:

A1 = {El estudiante seleccionado es Varón}

A2 = {El estudiante seleccionado es hembra}

B = {El estudiante seleccionado es de Carabobo}

P (A1) = 0, 3 P (A2) = 0.7 P (B/A1) = 0, 45 P (B/A2) = 0, 2

P (B) = P (B/A1) P (A1) + P (B/A2) P (A2) = 0, 45.0, 3 + 0, 2.0, 7 = 0,275

Page 91: Libro de estadistica

90

2 Dos candidatos a la presidencia de de un club social, compiten por el control del club, la

probabilidad de ganar estos candidatos es 0,7 y 0,3 respectivamente, si el primer candidato gana,

la probabilidad de introducir cambios en los estatutos es de0, 8, si gana el segundo candidato esta

probabilidad es de 0,4¿determine la probabilidad de que se introduzca cambios en los estatutos?

Solución:

Sea: los eventos siguientes:

A1 = {El Primer candidato gana las elecciones}

A2 = {El segundo candidato gana las elecciones}

B = {Se introducen cambios en los estatutos}

P (A1) = 0, 7 P (A2) = 0.3 P (B/A1) = 0, 8 P (B/A2) = 0, 4

P (B) = P (B/A1) P (A1) + P (B/A2) P (A2) = 0, 8 x 0, 7 + 0, 4 x 0, 3 = 0, 68

3. En cierta fabrica un articulo es producido por tres maquinas, una semiautomática y dos

manuales, se sabe que la automática produce el doble de artículos que las otras dos, y que estas

producen la misma cantidad de artículos (en un periodo de producción dado). Además se sabe

que el 3% de los artículos producidos por la maquina semiautomática es defectuoso y el 4% de lo

producido por las otras 2 maquinas también lo son.

Si se selecciona al azar un artículo producido en la fábrica calcular:

a) la probabilidad de que el artículo seleccionado sea defectuoso.

Solución.

A1= {El articulo seleccionado es producido en la maquina semiautomática}

A2= {El articulo seleccionado es producido en la 1ra maquina manual}

A3= {El articulo seleccionado es producido en la 2da maquina manual}

B = {El articulo es defectuoso}

P(A1) = 2[P(A2) + P(A3)] ; P(A2) = P(A3) → P(A1) + P(A2) + P(A3) = 1

2[P(A2) + P(A3)] + P(A2) + P(A3) = 1 → 6P(A3) = 1 → P(A3) = 1/6

P(A2) = 1/6 ; P(A1) = 4/6 ; P(B/A1) = 0,03 ; P(B/A2) = 0,04 ; P(B/A3) = 0,04

P(B) = 0,03 x 0,66 + 0,04 x 0,16 + 0,04 x 0,16 = 0,0326

- Fórmula o Teorema de Bayes

P (Aj/B) = P (Aj) P (B/Aj) / P (B)

P (Aj/B) = P (Aj) P (B/Aj) / Σ P (Ai) P (B/Ai)

P (Ai) probabilidades a priori

P (Aj/B) probabilidades a posteriori

Page 92: Libro de estadistica

91

Las dos últimas fórmulas son especialmente útiles cuando se dan las circunstancias

- El experimento aleatorio se produce en dos etapas.

- Es sencillo encontrar una partición en el espacio muestral correspondiente a los resultados del

primer experimento.

- Son conocidas o se calculan fácilmente P (Ai)

- Son conocidas o se calculan fácilmente P (B/Ai)

Ejemplos:

1. En el ejemplo anterior # 1 de probabilidad Total

Si el estudiante seleccionado es de Carabobo ¿Cuál es la Probabilidad de que sea hembra?

P (A2/B) = 509,00326,0

7,027,0

)B(P

)A(P)A/B(P 22

2. En el ejemplo # 3 de probabilidad total

Si el articulo seleccionado es defectuoso, cual es la probabilidad de que haya sido producido por

la maquina semiautomática

P (A3/B) = 02327,0275,0

16,004,0

)B(P

)A(P)A/B(P 33

Problemas Propuestos de Probabilidad Condicional y Probabilidad Total

1.La probabilidad de que un auto de carreras cargue gasolina en cierto circuito en la primera

media hora de recorrido es de 0.58, la probabilidad de que cambie de neumáticos en esa primera

media hora de recorrido es de 0.16, la probabilidad de que cargue gasolina y cambie de

neumáticos en la primera media hora de recorrido es de 0.05, a. ¿Cuál es la probabilidad de que

cargue gasolina o cambie de neumáticos en la primera media hora de recorrido?, b. ¿cuál es la

probabilidad de que no cargue combustible y de neumáticos en la primera media hora de

recorrido, c. Si el auto cambia de neumáticos en la primera media hora de recorrido, ¿cuál es la

probabilidad de que cargue combustible también?, d. Si el auto carga combustible en la primera

media hora de recorrido, ¿cuál es la probabilidad de que cambie de neumáticos también?

2. Se tiene tres cajas de igual aspecto. En la primera hay 3 bolas blancas y 4 negras; en la segunda

hay 5 negras y en la tercera hay 2 blancas y 3 negras. Se desea saber:

Page 93: Libro de estadistica

92

a) Si se extrae una bola de una caja, elegida al azar, cuál es la probabilidad de que la bola

extraída sea negra.

b) Se ha extraído una bola negra de una de las cajas. ¿Cuál es la probabilidad de que haya sido

extraída de la 2ª caja?

3. En una población animal hay epidemia. El 10 % de los machos y el 18 % de las hembras están

enfermos. Se sabe además que hay doble número de hembras que de machos y se pide:

a) Elegido al azar un individuo de esa población ¿Cuál es la probabilidad de que esté

enfermo?

b) Un individuo de esa población se sabe que está enfermo ¿Qué probabilidad hay de que el

citado individuo sea macho?

4. Se consideran dos cajas con bolas. La caja 1 contiene 3 bolas rojas y 2 azules, la caja 2

contiene 2 bolas rojas y 8 azules. Se lanza una moneda, si se obtiene cara se saca una bola de la

caja 1, y si se obtiene cruz se saca una bola de la caja 2.

(a) Hallar la probabilidad que la bola extraída sea roja.

(b) Si se sabe que la bola extraída es roja, ¿Cuál es la probabilidad que provenga de la caja 1?

5. De una caja que contiene 3 bolas rojas y 2 azules se extrae una bola al azar y se la coloca en

una segunda caja que contiene 4 bolas azules y 2 rojas. A continuación se extrae una bola al azar

de la segunda caja.

(a) ¿Cuál es la probabilidad de que se extraiga la misma bola que se extrajo de la primera caja?

(b) ¿Cuál es la probabilidad de que la bola extraída de la segunda caja sea roja?

(c) Si la bola extraída de la segunda caja es roja, ¿cuál es la probabilidad de que sea la misma

bola que se extrajo de la primera caja?

6. Tenemos una caja con 10 tornillos, de estos 8 son buenos y 2 son defectuosos. Se extraen dos

tornillos de la caja. Se pide:

(a) Calcular la probabilidad de que la segunda extracción sea un tornillo bueno, sabiendo que la

primera extracción ha sido un tornillo bueno.(sin reemplazo).

(b) Calcular la probabilidad de que la segunda extracción sea un tornillo bueno, sabiendo que la

primera extracción ha sido un tornillo bueno (con reemplazo).

7. Tres máquinas denominadas A, B y C, producen un 43%, 26% y 31% de la producción total de

Page 94: Libro de estadistica

93

una empresa respectivamente, se ha detectado que un 8%, 2% y 1.6% del producto

manufacturado por estas máquinas es defectuoso, a. Se selecciona un producto al azar y se

encuentra que es defectuoso, ¿cuál es la probabilidad de que el producto haya sido fabricado en

la máquina B?, b. Si el producto seleccionado resulta que no es defectuoso, ¿cuál es la

probabilidad de que haya sido fabricado en la máquina C?

8. Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera de tres hoteles

de la ciudad; Palacio del Puerto, El Palito o Fiesta Mar, en una proporción de 18.5%, 32% y

49.5% respectivamente, de los cuales se ha tenido información de que se les ha dado un mal

servicio en un 2.8%, 1% y 4% respectivamente, a. Si se selecciona a un visitante al azar ¿cuál es

la probabilidad de que no se le haya dado un mal servicio?,b. Si se selecciona a un visitante al

azar y se encuentra que el no se quejó del servicio prestado, ¿cuál es la probabilidad de que se

haya hospedado en el Palacio del Puerto?, c. Si el visitante seleccionado se quejó del servicio

prestado, ¿cuál es la probabilidad de que se haya hospedado en e hotel Fiesta Mar?

9. La probabilidad de que un artículo provenga de una fábrica A1 es 0,7, y la probabilidad de que

provenga de otra A2 es 0,3. Se sabe que la fábrica A1 produce un 4 por mil de artículos

defectuosos y la A2 un 8 por mil.

a) Se observa un artículo y se ve que está defectuoso. ¿Cuál es la probabilidad de que provenga

de la fábrica A2?

b) Se pide un artículo a una de las dos fábricas, elegida al azar. ¿Cuál es la probabilidad de que

esté defectuoso?

c) Se piden 5 artículos a la fábrica A1 ¿Cuál es la probabilidad de que haya alguno defectuoso?

10. En una fábrica de televisores las máquinas I, II y III producen respectivamente el 28%, el

32% y el 40% del total. En la producción de cada máquina el 3%, 4% y el 5% son televisores

defectuosos. Se toma al azar un televisor de la producción total y se le encuentra defectuoso

¿Cuales son las probabilidades que haya sido producido por:

(a) La máquina I, (b) la máquina II, (c) la máquina III

11. En un país hay cuatro partidos políticos que se dividen la opinión pública. Se sabe que:

El 35% de la población adhiere al partido I

El 31% adhiere al partido II

El 28% adhiere al partido III

Page 95: Libro de estadistica

94

El 6% adhiere al partido IV.

Entre los adherentes al partido I, un 36% corresponde a personas con ingresos inferiores a dos

salarios mínimos Entre los adherentes al partido II, esa proporción es del 52% Para el partido III,

es un 42% Para el partido IV, 11%. Si se elige una persona al azar y resulta tener ingresos

inferiores a dos salarios mínimos. Calcular la probabilidad de que sea un adherente al partido I; al

partido II; al partido III y al partido IV.

12. Supongamos que en un país un 40% de los ciudadanos habilitados para votar es adherente al

partido A, un 35% al partido B y un 25% al partido C. Se realiza de manera simultánea una

elección interna en los tres partidos, pero como no se requiere acreditar la adhesión a cada

partido, el voto "extrapartidario" es posible: un votante de un partido puede, si quiere, participar

en la interna de otro partido. Supongamos que Ud. sabe que:

Entre los adherentes de A, un 10% votó en la elección interna de otro partido

Entre los adherentes de B, un 15% votó en la interna de A

Entre los adherentes de C, un 5% votó en la interna de A

(a) ¿Cuál fue el porcentaje de votos obtenidos por el partido A en las internas?

(b) Si se elige al azar una persona dentro de todas las que en las votaron a A

i. ¿cuál es la probabilidad que sea un adherente de B?

ii. ¿cuál es la probabilidad que sea un adherente de C?

13. Un libro tiene 3 capítulos. El 85% de las páginas del 1er

capítulo no tiene ningún error. El

90% del segundo y el 95% del tercero tampoco tienen ningún error. El primer capítulo tiene 125

páginas, el 2º 150 y el 3º 175.

(a) ¿Cuál es la probabilidad de que al elegir una página al azar no tenga ningún error?

(b) ¿Supongamos que elegimos una página al azar y observamos que no tiene ningún error ¿cuál

es la probabilidad de que sea del capítulo 2º?

Page 96: Libro de estadistica

95

Variable Aleatoria

Definición de Variable Aleatoria (V.A.): Se dice que hemos definido una variable

aleatoria para un experimento aleatorio cuando hemos asociado un valor numérico a cada

resultado del experimento.

Sea E el espacio muestral asociado a un experimento. Se llama variable aleatoria a toda

aplicación del espacio muestral E en el conjunto de los números reales (es decir, asocia a cada

elemento de E un número real).

Se utilizan letras mayúsculas X, Y,... para designar variables aleatorias, y las respectivas

minúsculas (x, y,...) para designar valores concretos de las mismas.

Si un experimento con espacio muestral E, tiene asociada la variable aleatoria X, es

natural que se planteen preguntas como: ¿Cuál es la probabilidad de que X tome un determinado

valor?, esto nos lleva a establecer, por convenio, la siguiente notación:

(X = x); representa el suceso "la variable aleatoria X toma el valor x"

P (X = x); representa "la probabilidad de dicho suceso".

(X < x); representa el suceso "la variable aleatoria X toma un valor menor a x"

P (X < x); representa "la probabilidad de que la v.a. X tome un valor menor a x".

(X x); representa el suceso "la variable aleatoria X toma un valor menor o igual a x"

P (X x); representa "la probabilidad de que la v.a. X tome un valor menor o igual a x".

Ejemplos

1. Sea X, la variable aleatoria que representa el numero de puntos obtenidos al lanzar un dado dos

veces.

E = Lanzar un dado dos veces ; X = El numero de puntos obtenidos al lanzar un dado dos

veces.

S = {(1,1)(2,1)(3,1)(4,1).......(1,2)(2,1)......(1,3)(2,3).....(1,4)(2,4)....(1,5).......(6,6)}

(1,1) 2 ; (1,2) 3 ; (6,6) 12 Número de puntos obtenidos

2. Sea el experimento lanzar una moneda 3 veces, sea X: la variable que representa el número de

caras obtenidas en el experimento.

E = lanzar una moneda 3 veces. ; X = Numero de caras obtenidas al lanzar una moneda 3 veces.

(c,c,c) 3 ; (c,c,s) 2 ; (c,s,s) 1 ; (s,s,s) 0 Número de caras obtenidas

Rango de una Variable Aleatoria (Rx).

Es el conjunto de números reales que puede tomar la Variable, en el caso de los ejemplos

anteriores, Tenemos:

Rx de 1 = {2, 3, 4,5,..........12} Rx de 2 = {0, 1, 2,3}

Page 97: Libro de estadistica

96

Clasificación de las variables aleatorias

Según la amplitud del campo de variación de la función podemos distinguir: variables

aleatorias discretas y variables aleatorias continuas. De la misma forma que en estadística

descriptiva, una variable aleatoria es discreta si toma valores en un conjunto finito o infinito

numerable. Y una variable aleatoria es continua si puede tomar valores en un conjunto infinito no

numerable. Como ejemplo típico de variable aleatoria discreta tenemos la distribución binomial,

y como ejemplo típico de variable aleatoria continua vamos a ver ahora la distribución normal.

Ejemplos

1. Consideremos el experimento aleatorio que consiste en lanzar tres monedas, supongamos que a

cada elemento de su Espacio Muestral S = {ccc, ccs, csc, scc, css, scs, ssc, sss} le asignamos un

número real, el correspondiente al número de caras (discreta).

Esta correspondencia que acabamos de construir es una función del espacio muestral S en el

conjunto de los números reales R. A esta función la llamaremos Variable Aleatoria y la

denotaremos por X.

Supongamos el experimento aleatorio que consiste en lanzar dos dados, podemos asignar

a cada resultado la suma de los puntos aparecidos en cada dado (discreta).

Consideremos el experimento que consiste en elegir al azar 500 personas y medir su

estatura. La ley que asocia a cada persona con su talla es una variable aleatoria (continua).

Consideremos el experimento que consiste en elegir al azar 100 Tomates de una

plantación y pesarlas. La ley que asocia a cada tomate su peso es una variable aleatoria

(continua).

VARIABLES ALEATORIAS DISCRETAS

Si una variable aleatoria sólo toma valores enteros, es decir, un número finito de valores o

infinito numerable diremos que es discreta.

Page 98: Libro de estadistica

97

Función de Probabilidad f(x)

Consideremos una V.A. discreta X, que toma los valores x1, x2,..., xn. Supongamos que

conocemos la probabilidad de que la variable X tome dichos valores, es decir, se conoce que:

P(X = x1) = P1, P(X = x2) = P2, P(X = x3) = P3,..., P(X = x1) = Pn, en general P(X = xi) = Pi

La función de probabilidad f(x) de la v.a. X es la función que asigna a cada valor xi de la

variable (rango de la variable) su correspondiente probabilidad Pi.

1.)()(

,....,2,1,0.:

1

n

ii

i

PIIxXPxfx

niPIRRf

La representación gráfica más usual de la función de probabilidad es un diagrama de

barras no acumulativo.

Función de Distribución F(x)

En muchas ocasiones no nos interesa tanto conocer la probabilidad de que la v.a. X tome

exactamente un determinado valor xi, cuanto la probabilidad de que tome valores menores o

iguales que un cierto valor xi. En tales casos es necesario acumular los distintos valores de la

función de probabilidad hasta el valor deseado. Se trata de una nueva aplicación llamada función

de distribución.

Sea X una variable aleatoria discreta, cuyos valores se suponen ordenados de menor a

mayor. Se llama función de distribución de la variable X, y se simboliza por F(x), a la función

)()(

:

xXPxFx

RRF

Es decir, asocia a cada valor de la v.a. discreta la probabilidad acumulada hasta ese valor

(la Probabilidad de que la v.a. tome valores menores o iguales a xi).

Page 99: Libro de estadistica

98

Propiedades:

F(x) es una probabilidad: 0 ≤ F(x) ≤1

F(x) = 0 para todo X < xi

F(x) =1 para todo X ≥ xn

Es constante en cada intervalo [xi,xi+1)

Es continua por la derecha de cada punto

Es creciente

P(a < X ≤ b) = F (b) – F (a)

Podemos expresar la función de distribución de la siguiente forma:

n

n1n1n21

321

211

i

n21

n21

xxsi1

xxxsiP.........PP

xxxsiPP

xxxsiP

xxsi0

)X(F

:esondistribucidefuncionsu

P..................PP)xX(P)x(f

____________________________________

X..................XXX

adprobabiliddefuncioncomotieneX.vaunaSi

Su representación gráfica tiene forma escalonada, siendo los saltos coincidentes con las

probabilidades Pi, correspondientes a los valores xi de la variable X.

Page 100: Libro de estadistica

99

Ejercicios.

1. Sea X la Variable Aleatoria que representa el número de caras obtenidas al lanzar una moneda

tres veces. Determinar:

a) Función de Probabilidad y su grafica.

b) Probabilidad de obtener a lo máximo 2 caras.

c) Probabilidad de obtener entre 1 y 3 caras.

d) Si se obtiene como mínimo 1 cara, ¿cuál es la probabilidad de obtener como máximo 3

caras?

Solución

E = lanzar una moneda 3 veces. ; x = nº de caras obtenidas

Rx = {0,1,2,3} ; S = {(c,c,c) (c,c,s) (c,s,c) (c,s,s) (s,c,c) (s,c,s) (s,s,c)(s,s,s)}

a) P(x)

X 0 1 2 3

P(x) 1/8 3/8 3/8 1/8

Grafica:

Y

3/8

1/8

b) P(X 2) =

2

0 8

7

8

3

8

3

8

1)2()1()0()(

X

X

PPPxP

c) P(1 X 3) =

3

1 8

7

8

1

8

3

8

3)3()2()1()(

X

X

PPPxP

d) 1

87

87

)1(

)13(

13

XP

XXP

XXP

2. La venta de cierto articulo (en miles de unidades) es una variable aleatoria con la siguiente

función de probabilidad, P(X) = ax + a ; x = 0,1, 2,3. Determinar:

0 1 2 3 x

Page 101: Libro de estadistica

100

a) La probabilidad de que se vendan más de mil artículos y no más de tres mil.

b) Probabilidad de que se vendan a lo sumo mil artículos.

c) Grafique P(x).

Solución.

P (0) = a ; P (1) = 2a ; P (2) = 3a ; P (3) = 4a

x 0 1 2 3

P(x) 1/10 1/5 3/10 2/5

a) P(1 x 3) = P(2 x 3) =

3

2 10

7

5

2

10

3)3()2()(

X

X

PPxP

b) P(x 1) =

1

0 10

3

5

1

10

1)1()0()(

X

X

PPxP

c) Grafica

y

2/5

3/10

1/5

1/10

3. Se lanza un dado 2 veces, Determinar:

a) Función de probabilidad del número de puntos obtenidos.

b) La probabilidad de obtener no más de 5 puntos.

c) Probabilidad de obtener mas de 7 puntos pero no mas de 11

Solución. a)

X 2 3 4 5 6 7 8 9 10 11 12

P(X) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

b) P(x 5) =

5

2 36

10

36

4

36

3

36

2

36

1)5()4()3()2()(

X

X

PPPPxP

c) P (7 x 11) =

11

8 36

14

36

2

36

3

36

4

36

5)11()10()9()8()(

X

X

PPPPxP

3

0X 10

1a1a101a4a3a2a1)x(P

0 1 2 3 x

Page 102: Libro de estadistica

101

Parámetros de una Variable Aleatoria Discreta.

a) Esperanza Matemática o Valor Esperado

n

1i

ii )Media(px)x(E

b) Varianza

n

1i

222

i

2

i )x(E)x(E)x(Epx)x(V ; Desviación Típica: )x(V

Tanto la varianza como la desviación típica son medidas de dispersión, de tal manera que

cuanto menores son estos dos parámetros más agrupados se encuentran los valores de la

distribución entorno a los valores centrales. Por el contrario, para valores grandes de la varianza o

la desviación típica los datos de la distribución se encuentran muy dispersos.

Ejemplos:

1º Un juego consiste en lanzar dos dados. Si la suma de sus caras es mayor o igual a 10 se gana

300 Bolívares, si está comprendida entre 7 y 9 se ganan 100 Bolívares. Para cualquier otro

resultado no se gana nada. ¿Cuál debería ser el precio de la apuesta para que la ganancia esperada

de la banca sea de 50 Bolívares?

Solución

El espacio muestral para el problema es E = {(1,1), (1,2), (1,3),..., (6,6)} con 36 puntos

muestrales. Todos los sucesos elementales tiene la misma probabilidad 1/36.

Se define la v.a. X: suma de las dos caras.

Esta variable puede tomar los valores 2, 3, 4,....,12. El espacio Muestral y la tabla con la P(x) es:

(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)

(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)

S = (1,3) (2,3) (3,3) (4,3) (5,3) (6,3)

(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)

(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)

(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

Definiendo H(x) como la función premio tenemos:

X 2 3 4 5 6 7 8 9 10 11 12

P(x) 1/36 2/36 3/36 3/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

H(x) 0 0 0 0 0 100 100 100 300 300 300

Page 103: Libro de estadistica

102

Por lo tanto el valor esperado del premio es:

12

2x

)h( 7,9136

1300

36

2300

36

3300

36

4100

36

5100

36

6100)x(f)x(hE

En consecuencia, la apuesta debería costar 91,7 + 50 = 141,7 para que la ganancia esperada de la

banca sea 50 Bolívares.

2º La siguiente tabla muestra la f(x) para la variable X: número de personas por día que solicitan

un tratamiento innecesario en el servicio de urgencias de un pequeño hospital.

x 0 1 2 3 4 5

f(x) 0,01 0,1 0,3 0,4 0,1 ?

a. Encontrar f (5)

b. Construir F(x)

c. Encontrar P(x 2)

d. Encontrar P(x < 2)

e. Encontrar P(x > 3)

f. Calcular la media y la varianza

Solución

a). Por la construcción de las f(x) es obvio que

x

1)x(f .

Para que se cumpla esta condición es necesario que f (5)=0,09

b).

X 0 1 2 3 4 5

f(x) 0,01 0,1 0,3 0,4 0,1 0,09

F(x) 0,01 0,11 0,41 0,81 0,91 1

c). P(x 2) = F(2) = 0,41

d). P(x < 2) = P(x 1) = F(1)=0,11

e). P(x > 3) = 1 - P(x 3) = 1- F(3) = 1 - 0,81 = 0,19

Page 104: Libro de estadistica

103

f).

5

0x

)x( 75,209.0x51.0x44.0x33.0x21.0x101.0x0)x(xfE

22 )x(E)x(E)x(V

75.809.051.044.033.021.0101.00)x(fX)x(E 222225

0x

222

1875.1)75.2(75.8)x(V 2

3º Se desarrolla un compuesto para aliviar cierta enfermedad. El fabricante afirma que es efectivo

en un 90% de los casos. Se prueba en 4 pacientes. Sea x el número de pacientes que tienen alivio.

a. Encontrar la f(x) para x, suponiendo que la afirmación del fabricante sea correcta.

b. Encontrar P(x 1)

c. Si el compuesto no alivia a ninguno de los pacientes ¿es esa una razón para poner en duda la

eficacia afirmada por el fabricante? Razonar sobre la base de la probabilidad implicada.

d. Calcular la media. ¿Qué significa en este ejemplo?

Solución

a. Si a representa que un paciente tenga alivio y n que no lo tenga, el espacio muestral para el

problema es E = {aaaa, naaa, anaa, aana, aaan,..., nnnn}(ver en diagrama de árbol), Si es cierta

la afirmación del fabricante P(a) = 0,9 y p(n) = 0,1

La V.A. x: número de pacientes que tienen alivio puede tomar los valores 0, 1, 2, 3, 4. La tabla

con la f(x) inducida es

x 0 1 2 3 4

f(x) 0.0001 0.0036 0.0486 0.2916 0.6561

P(x 1) = f (0) + f (1) = 0,14 + 4 x 0, 9 x 0, 13 = 0,0037

La probabilidad de que no alivie a ningún paciente es f (0) = 0,0001. Es una probabilidad tan baja

que, efectivamente, si ese fuera el resultado hay suficientes razones para poner en duda la

afirmación de que alivia al 90% de los pacientes.

6.3)9.0(x4)9.0(x1.0x4x3)9.0(x)1.0(x6x29.0x)1.0(x4x1)1.0(x0)x(xf)x(Ex

432234

Si se repitiera un número suficientemente grande de veces la experiencia de administrar el

fármaco a 4 pacientes, el número promedio de pacientes que experimentarían alivio sería 3,6.

4º. El beneficio obtenido en un negocio es una variable aleatoria x (en millones de bolívares) con

la siguiente función de probabilidad.

Page 105: Libro de estadistica

104

x -1 0 1 2

P(x) 0.2 0.15 0.5 0.15

Determine:

a) El Beneficio Promedio.

b) El Valor más Probable.

c) La Mediana del Beneficio.

d) Si la inversión en el negocio es la mitad del beneficio, ¿cuál es la inversión promedio del

negocio?

e) Fractil punto 85.

Solución.

X = beneficio obtenido en el negocio.

a) E(x) =

2

1

6.0)15.0)(2()50.0)(1()15.0)(0()20.0)(1()(X

BsdeMillonesxPX .

b) Moda: como P(1) es máxima, la moda es x = 1Millon de Bs. El beneficio mas probable

es de x = 1 millón.

c) Mediana: P(x me) = 0.50 P(-1) = 0.20 0.50; P(-1) + P(0) = 0.20 + 0.15 = 0.35 0.50

P(-1) + P(0) + P(1) = 0.35 + 0.5 = 0.85 0.50, por tanto la mediana se encuentra ubicada

entre x = 0 Millones y x = 1 millón de Bs.

d) y = Inversión Promedio E (y) = Desconocida; y = x/2 E(x/2) = E(x)/2 0.6/2 = 0.3

millones de Bs. la cual es la inversión promedio del negocio.

x (0.85) P (Xx (0.85)) = 0.85) P (-1)+P (0)+P (1) = 0.85, El fractil (0.85) es x = 1 millón

de Bs.

VARIABLES ALEATORIAS CONTINUAS

Una variable aleatoria es continua si puede tomar valores en un conjunto infinito no

numerable. Como hemos visto hay variables aleatorias que pueden tomar cualquier valor de un

intervalo real de la forma (a, b), (a, +∞), (-∞, b), (-∞, +∞) o uniones de ellos. A las variables de

este tipo se las denomina variables aleatorias continuas.

Ejemplos

1. Pretendemos observar la altura de un grupo de personas y vamos a seleccionar a una persona

Page 106: Libro de estadistica

105

de forma totalmente aleatoria. La probabilidad de que la altura de esa persona sea exactamente

1,62894635 Mt. es cero. Pero la probabilidad de que la altura de esa persona esté entre 1,62 Mt. y

1,63 Mt. tendrá un valor concreto y casi con certeza que será mayor que la probabilidad de que

esté entre 2,10 Mts. y 2,11 Mts. Por tanto, la densidad de probabilidad en el entorno de 1,625 Mt.

es mayor que la densidad de probabilidad en el entorno de 2,105 Mt. Sin embargo, que el valor

exacto 1,62894635 tenga probabilidad cero de ocurrir no implica que sea imposible que ocurra.

De hecho, cualquier persona que seleccionemos tendrá una altura concreta y exacta que tenía

probabilidad cero de suceder.

2. Sea X la v.a. que describe la duración de los neumáticos de una determinada marca y modelo.

Los valores de una variable estadística continua siempre se consideran agrupados en intervalos de

clase, luego no tiene sentido plantearse la probabilidad de resultados "aislados" (como, por

ejemplo, la probabilidad de que un neumático dure, exactamente, 56.000 Km., 235 Mt., 47 Cm. y

6 Mm.). En todo caso, esas probabilidades deben valer cero. Pero sí podemos preguntarnos, por

ejemplo, ¿cuál es la probabilidad de que un neumático dure menos de 50.000 Km? o ¿cuál es la

probabilidad de que un neumático dure entre 60.000 y 70.000 Km?

Tanto en el ejemplo 1 como en el 2 si queremos hallar esas probabilidades tendremos que

recurrir a métodos empíricos y usar técnicas estadísticas: tomar una muestra, examinar y anotar

las frecuencias observadas. Entonces tomaremos como valor de la probabilidad de un suceso s1 la

frecuencia observada de éste: p (s1) = fr (s1).

Y así podemos construir un histograma de frecuencias relativas y un histograma de

frecuencias relativas acumuladas. En el primero, la fr (X ≤ x) será la suma de las frecuencias de

todas las clases anteriores a x; lo que, geométricamente, es el área bajo la curva de frecuencias

entre el inicio de la gráfica y el valor x. La obtención de fr(X ≤ x) en la segunda gráfica es más

rápido pues, fr (X ≤ x) es la frecuencia acumulada del valor x y se lee directamente de la

gráfica.

A partir de una situación real con densidades de frecuencias se crea un modelo teórico con

asignación de probabilidades.

Sea X una variable aleatoria continua que toma valores en un intervalo [a, b]. Si

procedemos a dividir el intervalo cada vez en más partes el polígono de frecuencias relativas

(densidades de frecuencias) se va aproximando a una curva con un determinado aspecto.

Una vez realizado este proceso de dividir sucesivamente el intervalo, las densidades de

frecuencias pasan a ser, en el límite, densidades de probabilidad.

La probabilidad de que la variable X tome los valores entre x0 y x0+h es P(x0

0+h) y corresponde al área bajo la curva en el intervalo [x0 , x0+h]. La función

Page 107: Libro de estadistica

106

correspondiente a esta curva, y = f(x), la denominamos Función de densidad.

.

FUNCIÓN DE DENSIDAD

Una función y = f(x) es una función de densidad de una variable aleatoria continua si

cumple las siguientes condiciones:

Es positiva en todo su dominio: 0 f(x) 1

Permite obtener p(a X b) como área bajo la grafica entre X = a y X = b. Verifica la formula

P(a X b) = b

adx)x(f .

El área total entre la grafica de f(x) y el eje x vale 1 1dx)x(f

.

Permite obtener F(x) como área bajo la grafica hasta el valor de x

FUNCIÓN DE DISTRIBUCIÓN

En general, la función de distribución de una variable aleatoria continua X es el modelo

teórico de la curva de frecuencias acumuladas que se espera obtener para X, y debe cumplir,

evidentemente, estas propiedades:

Ser creciente

Tomar valores de 0 a 1

Si X es una variable aleatoria continua con valores en un intervalo [a, b], entonces F(x)

será la probabilidad de que la variable X tome valores entre a y x. F(x) = P(a ≤

bxsi1

bxasidx)x(f

axsi0

)x(F

x

a

x

dx)x(f)xX(p)x(F

badecualquiravalorunxsiendoxXPadprobabilidlaxFdx

xdFtf ,,0)()´(

)()( 00

Es decir, la función de distribución F(x) es una primitiva de la función de densidad f(x), o

dicho de otra forma, la función de densidad es la derivada de la función de distribución.

Indica la probabilidad de que la variable aleatoria continua X sea menor o igual que un

valor dado, es decir, proporciona la probabilidad acumulada hasta un determinado valor de la

variable.

Ejercicios

1. La longitud de una pieza (en metros) es una variable aleatoria X con la siguiente función de

Page 108: Libro de estadistica

107

Densidad f(x) = 2(1-X), 0 X 1 y 0; para otro valor. Determinar:

a) La probabilidad de que la pieza mida entre ½ metro y un metro.

b) Probabilidad de que la pieza mida más de ¾ de metro.

c) Grafica de la función densidad.

Solución

X = longitud de una pieza

a) P(1/2 X 1) = 4

1)2()1(2

1

21

1

21

2 xxdxX

b) P(X 3/4) = 16

1)2()()1(2)(

1

434

3

1

43 1

2

xxdxxfdxXdxxf

c) Grafica

y

2

1

-ω 1 ω x

2. El peso de una caja (Kg.) es una variable aleatoria con la siguiente función de densidad:

..;0

54;4

43;2

1

)(

VO

xx

X

xf Determinar:

a) Grafica de la Función de Densidad.

b) Probabilidad de que el peso de la caja este entre 3,5 y 4,5 Kg.

c) Probabilidad de que el peso supere los 4 Kg.

Solución.

a) Grafica

y

1

1/2

3 4 5/8 x

Page 109: Libro de estadistica

108

b) P(3,5 X 4,5) =

4

5,3

5,4

4

5,4

4

24

5,3 8

34

22

1)4(

2

1x

xxdxxdx

c) c) P(X 4) =

5,4

5

4 5

5

4

2

2

14

2)()4()( x

xdxxfdxxdxxf

3. La temperatura promedio (ºC) de cierta región es una variable aleatoria con la siguiente

función de densidad:

..;0

42;)2(8

3

)(

2

CO

xXxf

Calcular:

a) Probabilidad de que la temperatura promedio sea menor de 3 ºC.

b) Probabilidad de que la temperatura promedio este entre 2,5 y 3,5 ºC.

c) Grafica de la función densidad.

Solución.

X = Temperatura promedio de cierta región.

a) P(x < 3) =

3 2 3

2

2

8

1)2(

8

3)()( dxxdxxfdxxf

b) P(2,5 X 3,5) =

5,3

5,2

2

5,3

5,2

41.0)2(8

3)( dxxdxxf

c) Grafica

PARÁMETROS DE UNA VARIABLE ALEATORIA CONTINUA

Por analogía con las definiciones de estos conceptos para variables aleatorias discretas, se

definen la esperanza matemática E(x) o media μ, la varianza V(x) o σ2 y la desviación típica σ de

una variable aleatoria continúa de la siguiente forma:

Si toma valores en toda la recta real

f(x)

3/2

3/8

2 4

Page 110: Libro de estadistica

109

Valor Esperado o Media

dx)x(fx)x(E

dx)x(fx)x(E;)x(E)x(E)x(VVarianza 2222

Si toma valores en (a, b)

Valor Esperado o Media

b

a

dx)x(fx)x(E

b

a

2222 dx)x(fx)x(E;)x(E)x(E)x(VVarianza

Ejemplo

El peso de una caja (Kg.) es una variable aleatoria X con la siguiente función de Densidad,

..0

102)(

co

xxxf Calcular:

a) Peso promedio de la caja.

b) Peso más Probable.

c) Mediana del peso de la caja.

d) Varianza o Dispersión del peso.

Solución.

X = Peso de la caja.

Grafica de f(x)

a) E(x) = cajaladeomediopesoKgx

xdxxdxxfx Pr,3

2)

322.)( 1

0

1

0

3

b) Moda.

Como F (2) es máximo Moda es X = 1 Kg., entonces el peso de la caja mas probable es

X = 1 Kg.

c) Mediana P(X me) = 0.5

y

2

1

Page 111: Libro de estadistica

110

me

me MedianalaesXmexxdx0

2

0

2 7.07.05.05.0)5.02

d) V(x) = 22 )()( xExE ; 2

1)

24

22)( 1

0

1

0

4422

xxxdxxxE

pesodeldispersiondegradoalecorrespond18

1

9

4

2

1

3

2

2

1)x(V

2

Ejemplo.

Sea X el tiempo de supervivencia en años después de un diagnóstico de leucemia aguda. La

función de densidad es 2x0para,12

x)x(f .

a. Comprobar que es una fdp.

b. Hallar P(X > 1)

c. Hallar P(X = 1)

d. Hallar P(X 1)

e. Calcular la media y la varianza.

Solución.

a) La gráfica de la f(x) es

La condición equivalente a: x

xf 1)(

para variables continuas es que el área bajo la f(x) sea 1. De modo general ese área se calcula

mediante cálculo integral, pero en este caso se puede calcular por la conocida fórmula del área de

un triángulo 12

)12(,

2

)(

Adecires

hbA

Gráficamente, la probabilidad pedida es el área coloreada de negro, por lo tanto se puede calcular

también con la fórmula del área del triángulo. Ahora b = 1 y para calcular h hay que ver que valor

toma la f(x) cuando x = 1, y = -1/2 + 1 = 1/2. Por lo tanto, la probabilidad es (1x1/2)/2 = ¼

Page 112: Libro de estadistica

111

d) Como en toda variable continua la probabilidad de que tome un valor concreto es 0, por lo

tanto p(X = 1) = 0

d) Obviamente p(X 1) =1- p(X > 1) = 1 - 1/4 = 3/4

e) Media

2

0

2

0

2322

03

2

2

4

5

8)

2621

2)()(

xxdxx

xdx

xxdxxfxxEx

Varianza

V(x) = 22 )()( xExE o 222 )( xxE

3

2

3

8

8

16)

3821

2)()( 2

0

2

0

2

0

342

322

xxdxx

xdx

xxdxxfxxE

9

2

3

2

3

22

2

Problemas Propuestos de Variable Aleatoria

Discretas

1. Según estadísticas la probabilidad de que el motor de un auto nuevo, de cierto modelo, y

marca sufra de algún desperfecto en los primeros 12 meses de uso es de 0.02, si se prueban

tres automóviles de esta marca y modelo, encuentre el número esperado de autos que no

sufren de algún desperfecto en los primeros doce meses de uso y su desviación estándar.

2. Se ha detectado en una línea de producción que 1 de cada 10 artículos fabricados es

defectuoso; se toman de esa línea tres artículos uno tras otro, a) obtenga la distribución de

probabilidad del experimento, b) encuentre el número esperado de artículos defectuosos en

esa muestra y su desviación estándar.

3. Según estadísticas, la probabilidad de que un pozo petrolero que se perfore en cierta región

pueda ser beneficiado es de 0.30. Se perforan tres pozos en esa región, encuentre el número

esperado de pozos que pueden ser beneficiados y su desviación estándar.

4. La distribución de probabilidad de x , el número de defectos por cada 10 metros de una tela

sintética en rollos continuos de ancho uniforme , es:

x 0 1 2 3 4

p(x) 0.41 0.37 0.16 0.05 0.01

a) Determine la distribución de probabilidad acumulada de x; P(x).

b) Determine el número esperado de defectos por cada 10 metros de tela sintética en

rollos continuos de ancho uniforme y la desviación estándar del número de defectos por

cada 10 metros de tela.

Page 113: Libro de estadistica

112

c) Determine la probabilidad de que en 10 metros de tela sintética se encuentren como

máximo 2 defectos.

d) Determine la probabilidad de que en 10 metros de tela sintética se encuentren por lo

menos 2 defectos.

5. Sea X una Variable Aleatoria que representa la demanda de horas extras en una empresa. La

experiencia muestra que esta demanda se comporta de acuerdo a la siguiente función de

probabilidad,

parte otraen 0

4,3,2,1x 24/)1x2()x(f

Encuentre la distribución de probabilidad y la distribución acumulada.

6. Un lote de 7 lámparas contiene dos defectuosas. Un restaurante adquiere tres de estas

lámparas. Sea x el número de lámparas defectuosas. Encuentre la distribución de x. Grafique.

7. A continuación se presenta una función de probabilidad, de la variable aleatoria x, el número

de errores de escritura en una página.

0 1 2 3

P(x) 0.40 0.35 0.16 0.09

Encuentre la distribución acumulada para x,

El valor esperado

La varianza

La desviación estándar

8. La función de probabilidad de una variable aleatoria discreta x esta dada por

parte otraen 0

3,2,1,0x si 16/)1x2()x(f

Determine la función de distribución acumulada, la media, la varianza y la desviación estándar.

9. Una empresa de alimentos con la entrada de TLC, necesita modernizar su maquinaria para ser

más competitiva pero no tienen el suficiente capital, por lo que decide ofrecer bonos, los cuales

vencen al cabo de varios años. La distribución acumulada de x el número de año al vencimiento

para un bono elegido al azar, es:

Page 114: Libro de estadistica

113

7 si 1

3 si 6/3

1 si 6/1

1 si 0

)(

x

x

x

x

xF

Encuentre:

P(x = 6), b) P(x > 4), c) P(2.1 < x < 6)

10. El número de semanas, X, en las que una inversión es de alto riesgo, durante cierto período de

8 semanas, tiene como modelo probabilístico a la función dada por: .x

x

Rx,!x

)5(c)x(f

También se sabe que por lo menos en una semana (de este periodo) la inversión es de alto riesgo

pero no en todas será así.

a) Determine el rango de la variable aleatoria y el valor de la constante

b) Determine la probabilidad de que en más de la mitad de las semanas (de este periodo) la

inversión sea de alto riesgo.

c) ¿Cuál es el valor esperado del número de semanas en las que la inversión será de alto

riesgo?

Continuas:

1. Para la siguiente función:

2x9

1)x(f Cuando 0 x 3 , f(x) = 0 para cualquier otro valor

a) Diga si esta función nos define una distribución de probabilidad.

b) Si la función define una distribución de probabilidad, entonces, determine su

media y desviación estándar.

c) Determine la probabilidad de que 1 x 2.

2. Suponga que el error en la temperatura de reacción, en oC, para un experimento

controlado de laboratorio es una variable aleatoria continua x, que tiene la función de

densidad de probabilidad:

3

x)x(f

2

, para -1 x 2 y f(x) = 0 en cualquier otro caso

a) Verifique la tercera condición de la definición de una distribución de

probabilidad continua.

b) Determine la media o valor esperado de la distribución de probabilidad.

c) Encuentre la probabilidad de que 0 x 1.

Page 115: Libro de estadistica

114

3. La variable aleatoria continua X está distribuida según:

valorotro 0

4x1 si 3

1

)x(f

Indique la probabilidad de que X:

a) sea 3.

b) sea menor o igual a 3.

c) sea a lo sumo 3.

d) sea menor a 3.

e) sea mayor o igual a 3.

f) sea como mínimo 3.

g) sea mayor a 4.

h) esté entre 3 y 6.

i) sea menor que 2, sabiendo que es menor que 3.

j) sea menor que 3.5, sabiendo que es mayor que 1.5.

k) Sean los sucesos A y B:

A: X < 2

B: X > 3

Determine si A y B son independientes

4. Determinar para qué valor de k las siguientes funciones son funciones de densidad de

probabilidad:

valorotro 0

3x0 si kx)x(f)a

2

valorotro 0

kx0 si x)x(f)b

2

5. El tiempo (en años) hasta la ocurrencia de cierto evento catastrófico puede considerarse como

una variable aleatoria continua, X, con función de densidad dada por: .5x0,25

x2)x(f

a) ¿Cuál es la probabilidad de que dicho evento ocurra después de 2 años?

b) Una persona adquiere una póliza contra este tipo de evento. El contrato estipula que si el

evento ocurre antes del primer año la compañía aseguradora debe pagarle una suma

indemnizatoria de seis mil Bs., por única vez. La póliza cuesta dos mil Bs. Determine la

utilidad esperada de la aseguradora.

6. El ingreso familiar mensual en miles de Bs. fuertes en una ciudad, es una variable aleatoria X

con función de densidad:

Page 116: Libro de estadistica

115

5x1),x5(k

1x0,kx4)x(f

a) Determinar la constante k y calcule el porcentaje de familias con ingresos mensuales de a

los más 2 mil Bs. Fuertes

b) ¿Cuál es el ingreso familiar esperado y la varianza esperada?

7. La proporción diaria de veces que ciertos comerciantes evaden la entrega de una factura de pago es una

variable aleatoria con función de densidad .1x0),x1(x6)x(f

Una muestra aleatoria de 100 comerciantes fue supervisada durante un día y se registró, para cada uno de

estos, la proporción diaria de evasiones:

Proporción de evasiones 0 - 0,2 0,2 – 0,4 0,4 - 0,6 0,6 - 0,8 0,8 - 1

Número de comerciantes 9 26 30 25 10

a) Determine el valor esperado de la proporción diaria de evasión por comerciante.

b) ¿Cuán frecuentemente la proporción de evasión diaria es menor que 0,2?

c) ¿Cuán cercanos resultaron los valores observados respecto a lo esperado según la densidad dada?

Page 117: Libro de estadistica

116

Distribuciones de Probabilidad Discretas

La Distribución Binomial o de Bernoulli

En estadística la distribución binomial o de Bernoulli es una distribución probabilidad

discreta describiendo el numero de éxitos de n experimentos independientes con probabilidad P

de un éxito.

Una variable aleatoria se dice que es una distribución binomial o de Bernoulli si se

cumple:

En cada realización del experimento sólo son posibles dos resultados A y B (experimento

dicotómico).

El resultado obtenido en cada realización es independiente de los obtenidos en las

anteriores.

La probabilidad del resultado A, y por tanto la de B, no varía a lo largo del experimento.

Si llamamos p a la probabilidad de que se verifique A y q a la de que se verifique B, entonces:

p + q = 1 (A y B son sucesos contrarios).

Ejemplos:

a. Si analizamos productos que vayan saliendo de una línea de producción, usualmente

seleccionamos algunos cuantos, por ejemplo 20, para ver si tienen algún defecto. Si, por ejemplo,

el porcentaje de defectuosos en la producción es de 20%, podemos preguntarnos ¿cuál es la

probabilidad de que al revisar los 20, nos encontremos 4 defectuosos?

b. Si tenemos una gran cantidad de facturas expedidas, podemos seleccionar algunas, por ejemplo

14, y analizarlas para ver si los clientes quedaron satisfechos con la venta que les hicimos. Si, por

ejemplo, el 3% de nuestros clientes no quedan satisfechos, podemos preguntar ¿cuál es la

probabilidad de que tengamos más de 3 clientes insatisfechos entre los 14?

c. Si la probabilidad de que un movimiento financiero nos dé ganancia es de 78%, por ejemplo,

podemos preguntarnos por la probabilidad de que de 12 movimientos 8 resulten buenos.

d. Si la probabilidad de que un empleado llegue tarde un día es de 0.02, qué probabilidad hay de

que llegue tarde más de 3 veces en 28 días seleccionados.

Condiciones del modelo Binomial

En los ejemplos anteriores se usa el modelo binomial. Lo que tienen de común es lo

siguiente:

Page 118: Libro de estadistica

117

En a, revisamos un artículo. Esto lo repetimos 20 veces.

En b, analizamos la venta asentada en una factura. Repetimos 14 veces.

En c, un movimiento puede resultar malo. Repetimos 12 veces.

En d, la llegada tarde de un empleado. Repetimos 28 veces.

En cada ocasión, el resultado sólo puede ser uno de dos: éxito o fracaso.

En a, éxito es un artículo defectuoso.

En b, éxito es un cliente insatisfecho.

En c, éxito es que un movimiento resulte favorable.

En d, éxito es la llegada tarde.

Cada nueva repetición se hace de manera independiente de las otras. La probabilidad de

un éxito en una repetición siempre es la misma, sin verse influida por los resultados de las otras.

Esta condición es más o menos falsa en algunos de nuestros ejemplos, pero es parte esencial del

modelo binomial. Si creemos que esta condición no se satisface, debemos usar algún otro

modelo, no el binomial.

En a, puede pasar que los artículos defectuosos vengan en lotes. Es posible que los

artículos del mismo lote hayan sido elaborados en condiciones semejantes y entonces los defectos

de fabricación harían que no haya independencia entre artículos sucesivos. Sin embargo, si se

selecciona al azar productos de varios lotes, la independencia se mantiene.

En b, puede ser que el malestar sea a causa de un empleado y los clientes atendidos por

ese empleado tenderán a estar insatisfechos. Si escogemos al azar a las personas a las que les

vamos a pedir su opinión, se recupera la independencia.

En c, podría pasar que el estado general de la economía influya en que los movimientos

buenos se presenten por rachas. Si es así, no se ocurre como mantener la independencia.

En d, el que un empleado llegue tarde no implica que el siguiente lo llegue.

Vamos a obtener la función de probabilidad de una variable aleatoria de tipo binomial, es

decir, vamos a calcular la probabilidad de obtener r resultados A si se realizan n pruebas:

Uno de los posibles resultados es:

A, A,A,A,...A,B,B,...B (A repetida r veces y B repetida n-r veces).

La probabilidad de este suceso es:

P(A).P(A)....P(A).P(B).P(B)...P(B) = prq

n-r

Page 119: Libro de estadistica

118

Siendo p la probabilidad de que aparezca A y q = 1-p la de que aparezca B.

Pero la aparición de r valores de A pude producirse de Cnr maneras. Por tanto, la

probabilidad de que la variable aleatoria que asigna el número de apariciones de A tome el valor r

es:

rnrqpr

n)rx(P

En todos los casos hay un número de repeticiones que denotamos por n.

También hay una probabilidad de éxito en cada intento a la que denotamos por p.

n y p son los parámetros del modelo.

En a, n = 20, p = 0.20

En b, n = 14, p = 0.03

En c, n = 12, p = 0.78

En d, n = 28, p = 0.02

Los valores de n y p en cada situación específica cambian. A estas cantidades les

llamamos parámetros.

Parámetros del Modelo Binomial.

En cuanto a los parámetros de la distribución tenemos a la media y la desviación típica: de

la distribución binomial se tiene:

a) Valor Esperado.

El valor esperado o media estadística de una variable aleatoria de probabilidad binominal es:

np)x(E (El producto de n y p)

b) Desviación Estándar.

La calculamos así: varianza npqo).p1(np)x(V

La desviación estándar es la raíz cuadrada de la varianza.

PROBABILIDAD.

La variable aleatoria en el modelo binomial es el número de éxitos en las n repeticiones.

La denotamos con X. El símbolo

rnrqpr

n)rx(P

Se usa para denotar la probabilidad de que el número de éxitos sea igual a r.

Como un ejemplo, vamos a calcular la probabilidad que se pide en el ejemplo a.

Page 120: Libro de estadistica

119

En ese ejemplo n = 20, p = 0.20. Se nos pide calcular P (X = 4).

Resolviendo se obtiene: 0.2182.

En ese mismo ejemplo:

El valor esperado es 4.0

La desviación estándar es 1.79.

Otro ejemplo de más cuidado es el B.

En este ejemplo n = 14, p = 0.03 y se nos pide P(X > 3). Para calcularla es mejor hacer: P (X≤ 3)

y restarla de 1.

P(X ≤ 3) = P(X =0) + P(X =1) + P(X =2) + P(X = 3)

Verifique que el planteamiento indica P(X ≤ 3) = 0.9628. Y la respuesta a la pregunta es P(X > 3)

= 0.0372

En nuestro ejemplo:

122.149

60

7

4.

7

3.5

14,27

15

7

3.5

Ejercicios:

1. Se extraen cinco bolas con devolución de una caja que contiene 6 blancas y 8 negras. Hallar la

probabilidad de obtener 3 bolas blancas.

Solución.

La probabilidad de extraer una blanca es p = 6/14=3/7 y la de obtener una negra es q = 8/14 = 4/7

(se cumple p+q=1), entonces:

257,049

16

343

27

2

45

49

16

343

27

)!35(!3

!5

7

4

7

3

3

5)3(

23

xp

La función de distribución de la distribución binomial será:

rnrnn

ii qpr

nqP

nqP

nxXPxF

....

10)()( 110

Su función de densidad es

xnx qpx

nxXP

)(

Eso es por que en n experimentos hay n sobre x (el coeficiente binomial) posibilidades

para un numero de x éxitos (probabilidad kp ) y n-x no éxitos ( xn)p1( ).

En nuestro ejemplo, la probabilidad de obtener 2 bolas blancas o menos en la caja es:

Page 121: Libro de estadistica

120

632,0343,0228,0061,0343

64

49

910

2401

256

7

35

16807

1024

7

4

7

3

2

5

7

4

7

3

1

5

7

4

0

5)2()2(

3245

xPF

2. Una familia tiene seis hijos, hallar la probabilidad que sean:

a) Tres varones y tres hembras.

b) Menos varones que hembras.

Solución.

X = Numero de hijos varones de la familia

X B (n, p) ; X B (6,1/2)

a) P (tres varones) = P(X = 3) = 0,3125.

b) P(menos varones que hembras) = P(X 2) = 0,34375

3. El 70% de los trabajadores de una empresa tienen más de 25 años de edad, si se seleccionan

una muestra de 5 trabajadores, ¿Cuál es la probabilidad de que existan?:

a) Tres trabajadores con más de 25 años.

b) A lo sumo dos trabajadores con mas de 25 años.

Solución.

X = Numero de trabajadores con mas de 25 años. X B (n, p) ; X B (5, 0.7)

a) P(X = 3) = 0, 3087.

b) P(X ≤ 2) = 0,163

4. Un equipo A tiene 1/3 de probabilidad de ganar cuando juega. Si A juega 4 partidos,

Determine:

a) Probabilidad de que gane 2 partidos.

b) Probabilidad de que gane por lo menos 1 partido.

c) Numero mas probable de partidos que puede ganar A.

Solución.

X = numero de partidos ganados

X B (n, p) ; X B (4, 1/3).

a) P(X = 2) = 0, 2963.

Page 122: Libro de estadistica

121

b) P(X 1) = 1 – P(X < 1) 1 – P (0) = 1 – 0, 1975.

c) Moda P(x) es Máximo ; como P (1) es Mediana Moda es 1 juego, que es el numero

mas probable de juegos ganados.

d) E(x) = n. p = 4 x 1/3 = 4/3.

e) V(x) = n.p.q = 4 x 1/3 x 2/3 = 8/9.

5. Supongamos que la probabilidad de tener una unidad defectuosa en una línea de ensamblaje es

de 0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes:

a. ¿cuál es la probabilidad de que entre diez unidades dos se encuentren defectuosas?

b. ¿y de que a lo sumo dos se encuentren defectuosas?

c. ¿cual es la probabilidad de que por lo menos una se encuentre defectuosa?

Solución

X = numero de unidades defectuosas

X B (n, p) ; X B (10, 0.05).

a) P(X = 2) = 0,988 ojo

b) P(X 2) =

c) P(X 1) = 1 – P(X < 1) 1 – P (0) =

6. El gerente de un restaurante que sólo da servicio mediante reservas sabe, por experiencia, que

el 20% de las personas que reservan una mesa no asistirán. Si el restaurante acepta 25 reservas

pero sólo dispone de 20 mesas, ¿cuál es la probabilidad de que a todas las personas que asistan al

restaurante se les asigne una mesa?

Solución

En el caso particular de este problema, n = 25. Entonces, para que aquellas personas que

asistan al restaurante de las 25 que han hecho la reserva puedan disponer de una mesa, debe

ocurrir que acudan 20 o menos. Así se tiene que:

P(X 20) = 0,5799

Distribución de Poisson.

La distribución de Poisson es otra función de distribución de probabilidad que tiene

muchas aplicaciones prácticas importantes. Un proceso Poisson no sólo representa numerosos

fenómenos discretos, sino que el modelo Poisson también se usa para proporcionar

aproximaciones a la distribución binomial.

Page 123: Libro de estadistica

122

Se dice que un proceso de Poisson existe si podemos observar eventos discretos en un

área de oportunidad, un intervalo continuo, de tal manera que si acotamos el área de oportunidad

o intervalo de manera suficiente:

La probabilidad de observar exactamente un éxito en el intervalo es estable.

La probabilidad de observar exactamente más de un éxito en el intervalo es cero.

La ocurrencia de un éxito en cualquier intervalo es estadísticamente independiente de aquella en

cualquier otro intervalo.

Características

En este tipo de experimentos los éxitos buscados son expresados por unidad de área,

tiempo, pieza, etc.

- # de defectos de una tela por m2

- # de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc.

- # de bacterias por cm2 de cultivo

- # de llamadas telefónicas a un conmutador por hora, minuto, etc.

- # de llegadas de embarcaciones a un puerto por día, mes, etc.

Cada vez que se especifica el parámetro λ, puede generarse una distribución de

probabilidad de Poisson específica. Una distribución de Poisson estará sesgada a la derecha

cuando λ es pequeña, y se aproximará a la simetría al crecer.

Una variable aleatoria que describe el número de sucesos ocurridos en una región, de tal

modo que dichos sucesos ocurren independientemente y con una tasa constante decimos que

sigue distribución de Poisson de parámetro λ.

X ~ Р (λ)

Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo, área, o

producto, la fórmula a utilizar sería:

....3,2,1xcon;!x

e)xX(P

x

Función de Probabilidad ; donde

P(X = x) = probabilidad de que ocurran x éxitos, cuando el número promedio de ocurrencia de

ellos es

= media o promedio de éxitos por unidad de tiempo, área o producto

e = 2.718

X = variable que nos denota el número de éxitos que se desea que ocurra

Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad

Page 124: Libro de estadistica

123

de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente

de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es

independiente de otro producto dado.

Parámetros de la distribución de Poisson

a) Valor Esperado.

El valor esperado o media estadística de una variable aleatoria de probabilidad Poisson es:

)x(E

b) Varianza.

La calculamos así: varianza )x(V

La distribución de Poisson Como una Aproximación de la Binomial

El otro uso que se le da a la distribución de Poisson es la aproximación de la distribución

binomial. En los casos en las que n es grande (mayor o igual a 20) y p es muy pequeña (menor a

0.05, la distribución de Poisson puede usarse para aproximar la distribución binomial.

La variable aleatoria de Poisson puede variar teóricamente de 0 a ∞. Sin embargo, cuando

se usa como una aproximación a la distribución binomial, la variable aleatoria de Poisson, el

número de éxitos de n observaciones, claramente no puede exceder el tamaño de la muestra n.

Características

μ = λ = n * p

Ejercicios:

1. Una empresa electrónica observa que el número de componentes que fallan antes de cumplir

100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de

estos fallos es ocho,

a. ¿Cuál es la probabilidad de que falle un componente en 25 horas?

b. ¿De que fallen no más de dos componentes en 50 horas?

c. ¿Cuál es la probabilidad de que fallen por lo menos diez en 125 horas?

Solución.

a) Sea la variable aleatoria X, con distribución de Poisson con parámetro λ = 8, que determina el

número de componentes que fallan antes de cumplir 100 horas de funcionamiento.

Considerando que se cumplen ciertas condiciones de regularidad, podemos asumir que

Page 125: Libro de estadistica

124

una variable Y que mide el número de componentes que fallan antes de cumplir 25 horas de

funcionamiento sigue una distribución de Poisson con parámetro: λ = 8/4 = 2.

Recordemos que 25 horas es una cuarta parte de 100 horas. Por lo tanto, la probabilidad deseada es

la siguiente:

P (Y = 1) = 0,27067

b) Análogamente, definimos una variable aleatoria Z con distribución de Poisson de parámetro: λ

= 8/2 = 4, que mide el número de componentes que fallan antes de cumplir las 50 horas de

funcionamiento. Se tiene entonces que:

P(Z 2) = P(0) + P(1) +P(2) = 0,2381

c) De la misma forma, definiendo una variable aleatoria W con distribución de Poisson de

parámetro λ = 10., se obtiene:

P(X 10) = 1 – P(X < 10) = 1- P(Z 9) = 1 - [P(0)+P(1)+…….+P(9)] = 0,41696

2. Supóngase que 220 errores están distribuidos al azar a lo largo de 200 páginas, hallar la

probabilidad de que una pagina dada contenga:

a) Ningún error.

b) Más de 2 errores.

c) Cual es la probabilidad de hallar un error en dos paginas

Solución

X = Numero de errores por pagina

X. Poisson con = pag

errpaginas

errores1,1

200

220

a) P(X = 0) = 0.3329.

b) P(X > 2) =

3

0995,0........)6()5()4()3()(x

PPPPxp

c) Y = Numero de errores en 2 paginas ; Y. Poisson con = 2 x 1,1 = 2,2

P(Y = 1) = 0,2438.

3. Supongamos que el número de imperfecciones en un alambre delgado de cobre sigue una

distribución Poisson con una media de 2.3 imperfecciones por milímetro.

(a) Determine la probabilidad de 2 imperfecciones en un milímetro de alambre.

Page 126: Libro de estadistica

125

(b) Determine la probabilidad de 10 imperfecciones en 5 milímetros de alambre.

(c) Determine la probabilidad de al menos una imperfección en 2mm de alambre

Solución.

a) Entonces λ = 2.3 imperfecciones

P(X = 2) = 0.265

b) Sea que X denote el número de imperfecciones en 5 milímetro de alambre. Entonces, X tiene

una distribución Poisson con λ = 5mmx2.3 imperfecciones/Mm. = 11,5 imperfecciones.

Por lo tanto: P(X = 10) = 0.113

c) Sea que x denote el número de imperfecciones en 2 milímetros de alambre. Entonces, X tiene

una distribución de Poisson con λ = 2mm x 2.3imperdecciones/Mm. = 4.6imperfecciones

Por lo tanto: P(X 1) = 1 – P(X < 1) = 1- P(Z 0) = 1-P(0) = 0.9899

4. La contaminación constituye un problema en la fabricación de discos de almacenamiento

óptico. El número de partículas de contaminación que ocurre en un disco óptico tiene una

distribución de Poisson y el número promedio de partículas por centímetro cuadrado de superficie

del disco es 0.1. El área de un disco bajo estudio es 100 centímetros cuadrados.

(a) Encuentre la probabilidad de que ocurran 12 partículas en el área del disco bajo estudio.

(b) La probabilidad de que ocurran cero partículas en el área del disco bajo estudio

(c) Determine la probabilidad de que 12 o menos partículas ocurran en el área del disco bajo

estudio.

Solución.

a. Sea que X denote el número de partículas en el área de un disco bajo estudio. Puesto que el

número promedio de partículas es 0.1 partículas por cm2

.

La variable X tiene parámetro λ =100 cm2

x 0.1 partículas/ cm2

= 10 partículas

Por lo tanto: P(X = 12) = 0.095

b. P(X = 0) = 4.54x10 −5

c. P(Z 12) = P(0) + P(1) +P(2)+……….+P(12) = OJO

5. Supongamos que en una región se producen terremotos de acuerdo con una distribución de

Poisson con media λ = 2 terremotos/semana.

Page 127: Libro de estadistica

126

a. Calcular la probabilidad de al menos tres terremotos ocurran en un período de dos semanas.

Solución.

a. Si en una semana hay, en promedio, 2 terremotos, en dos semanas habrá, también un promedio

de 4 terremotos. Entonces, debemos estudiar variable aleatoria, Y, de Poisson con media λ = 4:

P [Y ≥ 3] = 1 − P [Y < 3] = 1 − [P(Y = 0) + P(Y = 1) + P(Y = 2)] =

= 1 − e−4

− 4e−4

−8e−4

= 0.7618.

6. El número de pinchazos en los neumáticos de cierto vehiculo industrial tiene una distribución

de Poisson con media 0.3 por cada 50000 kilómetros .Si el vehiculo recorre

100000 Km., se pide:

a) Probabilidad de que no tenga pinchazos.

b) Probabilidad de que tenga menos de tres pinchazos.

c) Número de Km. recorridos para que la probabilidad de que no tenga ningún pinchazo sea

0.4066.

Solución.

Si λ = 0.3 para 50000 Km., entonces para 10000km tendremos una X con λ = 0.6.

a) P(X= 0) = 0.5488

b) P(X<3) = P(X= 0) + P(X=1) + P(X=2) = 0.5488 + 0.3292 + 0.09878 = 0.9767

c) P(X= 0) = e- λ

Por tanto, ln e- λ

= ln 0.4066 y λ = 0.9

Si 0.3 → 50000 Km. , 0.9 → x Km., y por tanto x = 150000 Km.

DISTRIBUCION GEOMETRICA

En estadística la distribución geométrica es una distribución de probabilidad cuya

función de densidad para valores discretos x = 1,2,…. es 1)1()( XppxXP

Su función de distribución es

XpxXP )(

El parámetro p (la probabilidad de éxito de un experimento) fija la media estadística

pXE 1)( y la varianza 2

)1()(

pp

XV

.

Ejemplo

El número de tirar una cifra determinada con un dado X veces seguidas es una distribución

Page 128: Libro de estadistica

127

geométrica con el parámetro.6

1p

Problemas Propuestos de Distribución de Probabilidades Discretas

Binomial

1. Se tiene una familia con tres hijos. Determine la probabilidad de que:

a) dos sean hombres.

b) los tres hijos sean mujeres.

c) uno de los hijos sea mujer.

d) al menos dos de los hijos sean hombres.

e) al menos uno de los hijos sea mujer.

2. Si el 20% de lentes para microscopio producidos por una máquina son defectuosos.

a) Determinar la probabilidad de que de 4 lentes elegidos al azar :

i) uno sea defectuoso.

ii) ninguno sea defectuoso

iii) a lo más 2 sean defectuosos.

b) Si se envía un pedido de 400 lentes para microscopios ¿Cuál es el número

esperado de lentes defectuosos en el pedido?

3. Al inocular ratas con una sustancia presumiblemente tóxica generalmente el 10 %

muere. Si se inoculan 20 ratas con esta sustancia,

a) ¿Cuál es la probabilidad de que:

i) 5 ratas mueran?

ii) a lo más 3 ratas mueran ?

b) ¿Cuál es el número esperado de mortalidad?

4. Una máquina produce un tipo de artículo que generalmente resulta defectuoso en un

10% de la producción total.

Hallar la probabilidad que de un total de 4 artículos producidos por esa máquina sean

defectuosos:

i) como mucho 3 iii) entre 1 y 3

ii) entre 2 y 4 inclusive iv) 2 o más.

5. Si el 20 % de la población tiene por lo menos un defecto físico. Determine la

probabilidad de que 4 individuos elegidos al azar :

i) uno tenga defectos físicos

ii) ninguno tenga defectos

iii) a lo más dos tengan defectos

6. Un cirujano tiene 25% de posibilidades de fracasar en una operación

a) Si opera 4 veces. Halle la probabilidad que el cirujano fracase:

Page 129: Libro de estadistica

128

i) en 2 operaciones

ii) por lo menos en 1 operación

iii) en más de la mitad de las operaciones.

b) Si al mes opera 20 veces. ¿En cuántas operaciones se espera que tenga éxito?

7. Si el 10% de las conservas en tarro producidas por una máquina son defectuosas. El

departamento de control de calidad escoge 4 conservas al azar

a) ¿ Cuál es la probabilidad de :

i) Una sea defectuosa

ii) Ninguna sea defectuosa

iii) A lo más dos sean defectuosas.

b) Si se envía un cargamento de 4000 conservas ¿Cuál es el número esperado de

conservas en mal estado en el cargamento? ¿Cuál es su desviación estándar?

8. Se dice que el 75% de los accidentes de una planta se atribuyen a errores humanos. Si

en un período de tiempo dado, se suscitan 5 accidentes, determine la probabilidad de

que:

a) dos de los accidentes se atribuyan a errores humanos,

b) como máximo 1 de los accidentes se atribuya a errores de tipo humano,

c) tres de los accidentes no se atribuyan a errores humanos.

9. Si la probabilidad de que el vapor se condense en un tubo de aluminio de cubierta

delgada a 10 atm de presión es de 0.40, si se prueban 12 tubos de ese tipo y bajo esas

condiciones, determine la probabilidad de que:

a) el vapor se condense en 4 de los tubos,

b) en más de 2 tubos se condense el vapor,

c) el vapor se condense en exactamente 5 tubos.

10. La probabilidad de que el nivel de ruido de un amplificador de banda ancha exceda de 2

dB (decibeles) es de 0.15, si se prueban 10 amplificadores de banda ancha, determine la

probabilidad de que:

a) en solo 5 de los amplificadores el nivel de ruido exceda los 2 dB.

b) por lo menos en 2 de los amplificadores, el ruido exceda de 2 dB.

c) que entre 4 y 6 amplificadores no se excedan de los 2 dB.

d) encuentre el número esperado de amplificadores que se exceden de un nivel de

ruido de 2dB y su desviación estándar.

11. Una máquina produce un tipo de artículo que generalmente resulta defectuoso en un

10% de la producción total .Hallar la probabilidad que de un total de 400 artículos

producidos por esa máquina sean defectuosas:

i) Como mucho 30 iii) Entre 35 y 45

ii) Entre 30 y 50 inclusive iv) 55 o más.

Page 130: Libro de estadistica

129

Poisson

1. Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades

de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques sin fondos en

cualquiera de dos días consecutivos?

2. En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican

0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a)

una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando

más una imperfección en 15 minutos

3. La probabilidad de que haya un accidente en una compañía de manufactura es de 0.02 por

cada día de trabajo. Si se trabajan 300 días al año, ¿cuál es la probabilidad de tener 3

accidentes?

4. La probabilidad de que un producto salga defectuoso es de 0.012. ¿Cuál es la probabilidad

de que entre 800 productos ya fabricados hayan 5 defectuosos?

5. El número de buques tanque que llegan en un día a una refinería tiene una distribución de

Poisson con λ= 2. Si más de tres buques llegan en un día, los que están en exceso deben

enviarse a otro puerto, pues las actuales instalaciones portuarias pueden despachar a lo

sumo tres buques al día. a) ¿Cuál es la probabilidad de tener que hacer salir buques en un

día determinado? b) ¿Cuál es el número esperado de buques que llegan en un día? c) ¿Cuál

es el número más probable de buques que llegan en un día? d) ¿Cuál es el número esperado

de buques atendidos diariamente? e) ¿Cuál es el número esperado de buques rechazados

diariamente? f) ¿En cuánto deben aumentarse las instalaciones actuales para permitir la

atención a todos los buques el 90% de los días?

6. Los errores de imprenta de una cierta editorial son en promedio de 2,5 por página, según

una distribución de Poisson. Si un cierto libro tiene 50 páginas, ¿cuál es la probabilidad de

que en alguna de ellas haya 5 ó más errores?

7. El porcentaje de rollos de tela de 150 metros de longitud que presenta fallas de teñido es del

2%. Por otra parte tienen una cantidad de fallas de tejido según una distribución Poisson

con λ= 0,01 fallas/m. a) ¿Cuál es la probabilidad de encontrar un rollo sin fallas? ¿Qué

condición entre sucesos debe presentarse? b) Si un cliente controla el 10% de los rollo de

una partida de 100 y la rechaza si encuentra uno o más rollos con falla de teñido o más de

dos rollos con alguna falla de tejido, ¿cuál es la probabilidad de aceptar la partida?

8. Cierto tipo de cable presenta en promedio 1 falla cada 250 metros. ¿Cuál es la probabilidad

de que un rollo de 1000 metros tenga: a) ninguna falla?; b) menos de 4 fallas? c) 6 ó más

fallas?

9. El proceso de fabricación de una tela genera en promedio 1 falla cada 100 metros. La

longitud de cada rollo queda determinada por la aparición de la segunda falla, de modo que

todos los rollos tienen una falla. Calcular: a) el porcentaje de los rollos con longitudes

inferiores a 150 m; b) la longitud superada por el 90% de los rollos; c) la longitud superada

por el 10% de los rollos; d) la longitud mediana; e) la longitud modal.

Page 131: Libro de estadistica

130

10. Los mensajes que llegan a una computadora utilizada como servidor lo hacen de acuerdo

con una distribución de Poisson con una tasa promedio de 0.1 mensajes por minuto. a)

¿Cuál es la probabilidad de que lleguen como mucho 2 mensajes en una hora? b)

Determinar el intervalo de tiempo necesario para que la probabilidad de que no llegue

ningún mensaje durante ese lapso de tiempo sea 0.8.

Page 132: Libro de estadistica

131

Distribuciones de Probabilidades Continuas

DISTRIBUCIÓN NORMAL

Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio

nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que

ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución.

Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene

forma de campana.

En otras ocasiones, al considerar distribuciones binomiales, tipo B(n, p), para un mismo

valor de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se

aproximan a una curva en "forma de campana".

En resumen, la importancia de la distribución normal se debe principalmente a que hay

muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal

Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie, p.ejm.

Tallas, pesos, envergaduras, diámetros, perímetros,...

Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una

misma cantidad de abono.

Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de

individuos, puntuaciones de examen.

Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un

medio,...

Errores cometidos al medir ciertas magnitudes.

Valores estadísticos muéstrales, por ejemplo: la media.

Otras distribuciones como la binomial o la de Poisson son aproximaciones normales,...

Y en general cualquier característica que se obtenga como suma de muchos factores.

FUNCIÓN DE DENSIDAD

Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función

de densidad que corresponde a tales distribuciones viene dado por la fórmula:

2

x

2

1

e2

1)x(f

Varianza,dardtanSDesviacion,Media 2

Page 133: Libro de estadistica

132

Representación gráfica de esta función de densidad

La distribución normal queda definida por dos parámetros, su media y su desviación típica

y la representamos así:

normalesonesdistribucidefamiliaunarepresentaσ)N(μ(expresionlatanto

pordistinta,densidaddefuncionunatendremosσyμdevalorcadaParaσ),N(μ(

FUNCIÓN DE DISTRIBUCIÓN

Puede tomar cualquier valor (- , + )

Son más probables los valores cercanos a uno central que llamamos media Conforme

nos separamos de ese valor , la probabilidad va decreciendo de igual forma a derecha e

izquierda (es simétrica).

Conforme nos separamos de ese valor , la probabilidad va decreciendo de forma más o

menos rápida dependiendo de un parámetro , que es la desviación típica.

x

x

2

1

xe2

1)xX(P)X(F

2

F(x) es el área sombreada de esta gráfica

Page 134: Libro de estadistica

133

TIPIFICACIÓN DE LA VARIABLE NORMAL

Para simplificar los cálculos se sigue un proceso que consiste en obtener a partir de una N

(,) una N (0,1) (Normal Estándar o Tipificada) de media 0 y desviación típica 1. De ese modo

la probabilidad desde - hasta 0 es de 0,5.

La forma de hacerlo es la siguiente:

Si tenemos una V.A. X, N (,), la variable Z

X

será una N (0,1). Y así:

)()()(

KZP

KXPkXP , siendo Z una N (0,1).

Por tanto el proceso que se sigue en un problema con una N (,), es primero tipificar la

variable Z

X

será una N (0,1), es decir μ = 0 y σ =1, para luego calcular el valor con la

ayuda de la tabla:

Por tanto su función de densidad es:

z;e2

1)z( 2

z2

y su función de distribución es:

dze2

1)z()zZ(P)z(F

z2

z2

Siendo la representación gráfica de esta función:

A la variable Z se la denomina variable tipificada de X, y a la curva de su función de

densidad curva normal tipificada.

Page 135: Libro de estadistica

134

Ejemplo:

X → N (3,5) 7881,0)8,0Z(P)5

37Z(P)

5

37

5

3X(P)7X(P

Característica de la distribución normal tipificada (reducida, estándar)

No depende de ningún parámetro

Su media es 0, su varianza es 1 y su desviación típica es 1.

La curva f(x) es simétrica respecto del eje 0y

Tiene un máximo en este eje

Tiene dos puntos de inflexión en z =1 y z = -1

Uso de las tablas de una N (0,1).

Existen varios tipos de tablas, pero en todas, como la normal es simétrica respecto al 0:

)kZ(P)qZ(P)qZk(P

)kZ(P1)kZ(P)kZ(P

)kZ(P1)kZ(P

Las dos tablas fundamentales de una N (0,1) se diferencian en que mientras que una nos

da la P (Z k), la otra nos da sólo la P (0 Z k) (por tanto habrá que añadir a la probabilidad

observada en la tabla 0,5: P (Z k) = 0,5resultado de la tabla).

En ambos casos, la tabla representa las unidades y décimas del valor en la columna

vertical, y las centésimas en la fila horizontal.

Aproximación de la Binomial por la Normal (Teorema de De Moivre):

Demostró que bajo determinadas condiciones (para n grande y tanto p como q no estén

próximos a cero) la distribución Binomial B(n, p) se puede aproximar mediante una distribución

normal

)01(Nesnpq

npXZtotanpornpq,np(N

Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto más próximo sea

p a 0.5, tanto mejor será la aproximación realizada. Es decir, basta con que se verifique: nр ≥5

y nq ≥5

Gracias a esta aproximación es fácil hallar probabilidades binomiales, que para valores

grandes de n resulten muy laboriosos de calcular.

Hay que tener en cuenta que para realizar correctamente esta transformación de una

variable discreta (binomial) en una variable continua (normal) es necesario hacer una corrección

de continuidad.

Page 136: Libro de estadistica

135

MANEJO DE TABLAS. CASOS MÁS FRECUENTES.

La distribución de la variable Z se encuentra tabulada

Page 137: Libro de estadistica

136

Page 138: Libro de estadistica

137

DISTRIBUCION PROBABILIDAD GAMA.

Los tiempos que tardan en revisar un motor de un automóvil ó avión tienen una

distribución de frecuencias sesgadas. Las poblaciones asociadas a estas variables aleatorias

frecuentemente tienen distribuciones que se pueden modelar adecuadamente por la función de

densidad tipo gamma.

Función de densidad de probabilidad para una variable aleatoria tipo gamma:

0

)()(

/1

yeyyf

y0;0,

En donde:

0

1)( dyeyy

La cantidad de la función alfa se conoce como la función gamma. La integración directa

nos da que la función uno igual a uno. La integración por partes nos da que la función de alfa

menos uno alfa menos uno por la función alfa menos uno para cualquier intervalo de alfa mayor o

igual a uno y que la función de n sea igual a n menos uno factorial, para un número entero n.

En el caso especial cuando alfa es un número entero, se puede expresar la función de

distribución de una variable aleatoria tipo gamma como una suma de ciertas variables aleatorias

de Poisson.

Si alfa no es un número entero, es imposible encontrar la antiderivada del integrando de la

expresión:

dyeyd

c

y

)(

/1

Donde: dc0

Y por lo tanto es importante obtener las áreas bajo la función de densidad tipo gamma

mediante integración directa.

Hay dos casos especiales de las variables aleatorias tipo gamma que merece consideración

particular:

Una variable aleatoria tipo gamma que tiene una función de densidad con parámetros alfa

igual a v entre dos y beta igual a dos se denomina variable aleatoria Chi – cuadrada o Ji -

cuadrada.

Chi - cuadrada se presenta con frecuencia en la teoría de la estadística. El parámetro v se

denomina número de grados de libertad asociado a la variable aleatoria Chi - cuadrada.

La función de densidad gamma para el caso especial v = 1 se denomina función de

densidad exponencial.

Page 139: Libro de estadistica

138

y0;0

0

1)(

/

y

eyf

En cualquier punto.

DISTRIBUCIÓN EXPONENCIAL

Los modelos matemáticos de situaciones de la vida real requieren de supuestos

simplificadores que mantengan el análisis matemático en un nivel razonable. Sin embargo estas

simplificaciones no deben llegar al nivel de romper el vınculo entre la teoría y la realidad.

Un supuesto simplificador muy frecuente consiste en asumir que ciertas variables

aleatorias se distribuyen exponencialmente, esta distribución es relativamente fácil de manejar y

al mismo tiempo es una buena aproximación de la distribución real de la variable.

Una de sus propiedades fundamentales es que no se deteriora con el tiempo (de hecho es la única

distribución que presenta esta propiedad).

Se encuentra, también, íntimamente relacionada con los procesos de conteo (o de

Poisson), juega un papel importante tanto en teoría de colas como en problemas de confiabilidad.

El tiempo entre las llegadas en las instalaciones de servicio (tiempo entre dos sucesos) y el

tiempo de falla de los componentes y sistemas eléctricos.

Los casos típicos donde se usa esta distribución son: el tiempo que tardara una maquina de

cajero automático en entregar efectivo. Esta función puede usarse para determinar la

probabilidad de que el proceso tarde como máximo un minuto.

Sea X una variable aleatoria contınua. Se dice que X tiene una distribución exponencial

con parámetro λ si su función de Densidad esta dada por:

0x,0

0x,e)x(f

x

Y la función de Distribución:

.

0x,0

0x,e1du)u(f)x(F

xx

Siendo el valor del parámetro y x el valor de la función.

Page 140: Libro de estadistica

139

Relación de la distribución exponencial con el proceso de poisson.

Las aplicaciones más importantes de la distribución exponencial son aquellas situaciones

en donde se aplica el proceso de Poisson, es necesario recordar que un proceso de Poisson

permite el uso de la distribución de Poisson. Recuérdese también que la distribución de Poisson

se utiliza para calcular la probabilidad de números específicos de “eventos” durante un período o

espacio particular. En muchas aplicaciones, el período o la cantidad de espacio es la variable

aleatoria. Por ejemplo un ingeniero industrial puede interesarse en el tiempo T entre llegadas en

una intersección congestionada durante la hora de salida de trabajo en una gran ciudad. Una

llegada representa el evento de Poisson.

La relación entre la distribución exponencial y el proceso llamado de Poisson es bastante

simple. La distribución de Poisson se desarrolló como una distribución de un solo parámetro ,

donde puede interpretarse como el número promedio de eventos por unidad de “tiempo”.

Considérese ahora la variable aleatoria descrita por el tiempo que se requiere para que ocurra el

primer evento. Mediante la distribución de Poisson, se encuentra que la probabilidad de que no

ocurran en el espacio hasta el tiempo t está dada por:

718.2e;e!0

)t(e)t,0(P t

0t

Ahora puede utilizarse lo anterior y hacer que X sea el tiempo para el primer evento de

Poisson. La probabilidad de que el período hasta que ocurre el primer evento de Poisson exceda x

es la misma que la probabilidad de que no ocurra un evento de Poisson en x. Esto último por

supuesto está dado porx . Como resultado,

xe)xX(P

Entonces, la función de distribución acumulada para x es:

xe1)xX(P

Ahora, con objeto de que se reconozca la presencia de la distribución exponencial, puede

derivarse la distribución acumulada anterior para obtener la función de densidad:

xe)x(f

La cual es la función de densidad de la distribución exponencial con E

P

1

.

Page 141: Libro de estadistica

140

Nótese que la media de la distribución exponencial es el parámetroE , el recíproco del

parámetro en la distribución de Poisson. El lector debe recordar que con frecuencia se dice que la

distribución de Poisson no tiene memoria, lo cuál implica que las ocurrencias en períodos de

tiempo sucesivos son independientes. Aquí el parámetro importante E es el tiempo promedio

entre eventos. En teoría de la confiabilidad, donde la falla de un equipo concuerda con el proceso

de Poisson, E recibe el nombre de tiempo promedio entre fallas. Muchas descomposturas de

equipo siguen el proceso de Poisson, y entonces la distribución exponencial es aplicable.

Propiedad de no memoria de la distribución exponencial

Una variable aleatoria X no tiene memoria si:

0,;

tssXPtX

tsXP

Para analizar el caso de la exponencial, vemos que la expresión de la izquierda se pude

escribir como:

)(

)(

)(

,(

tXP

tsXP

tXP

tXtsXP

tXtsXP

Que en el caso de la exponencial será: s

t

ts

t

ts

ee

ee

e

e

)(

Es decir, la exponencial no tiene memoria. De hecho, se puede comprobar que la

exponencial es la única distribución que tiene esta propiedad.

Si lo pensamos en términos de la vida de un componente, esta propiedad nos dice que la

esperanza de que el componente sobreviva 15 periodos cuando ya ha sobrevivido 10, es igual a la

probabilidad inicial de sobrevivir 5 periodos. Es decir, la distribución de la duración en cualquier

periodo t es la misma que la distribución original de la vida útil.

Otras propiedades de la distribución exponencial

1. Sean X1 y X2 variables aleatorias exponenciales con tasas λ1 y λ2 respectivamente, entonces:

21

1

21 )(

XXP

2. Si X1, . . . ,Xn son variables aleatorias independientes, distribuidas exponencialmente con

parámetro μi Entonces la mas pequeña de estas variables se distribuye como una exponencial con

Page 142: Libro de estadistica

141

tasa igual a la suma de las μi. Es decir, si Z = min. {X1, . . . ,Xn}, entonces:

Z ~ Exp (μ1+..…+μn)

Parámetros de la distribución exponencial

1. Media E(X) = l / λ

2. Varianza V(X) = 1 / λ2

Ejemplos:

1. Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en años está

dado por la variable aleatoria T, distribuida exponencialmente con promedio de falla de 5

componentes por año, sí 5 de estos componentes se instalan en diferentes sistemas, ¿cuál es la

probabilidad de que al menos 2 continúen funcionando después de 8 años?

Solución:

La probabilidad de que un determinado componente esté funcionando aún después de 8 años es:

2.05

1)8( 5

8

8

5

edteTP

t

Sea x el número de componentes funcionando después de 8 años. Entonces mediante la

distribución Binomial,

n = 5

p = 0.20 = probabilidad de que un componente esté funcionando después de 8 años

q = 1-p = 0.80 = probabilidad de que un componente no funcione después de 8 años

P(X 2) = P(X= 2) + P(X = 3) + P(X = 4) + P(X = 5) = 1 – [P(X = 0) + P(X = 1)]

=1-0.7373 = 0.2627

2. El tiempo que transcurre antes de que una persona sea atendida en un establecimiento

comercial es una variable aleatoria que tiene una distribución exponencial con una media de 4

minutos. ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3

minutos en al menos 5 de los 6 días siguientes? Solución:

5276.014

1)3( 4

33

0

4

13

0

4

eedteTP

t

Page 143: Libro de estadistica

142

X = número de días en que un cliente es atendido antes de que transcurran 3 minutos

X = 0, 1, 2,...,6 días

p = probabilidad de que un cliente sea atendido antes de que transcurran 3 minutos en un día

cualquiera = 0.5276

q = probabilidad de que un cliente no sea atendido antes de que transcurran 3 minutos en un día

cualquiera = 1- p = 0.4724

P(X 5) = P(X= 5) + P(X = 6) = 0.11587 + 0.02157 = 0.13744

3. Supóngase que los tiempos transcurridos entre llegadas a cierta estación de peaje se distribuye

de manera exponencial con una media de ½ minuto.

a. Cual es la varianza de los tiempos entre llegadas

b. Cual es la probabilidad de que el tiempo transcurrido entre dos llegadas

consecutivas este comprendido entre 0 y 1 minuto.

c. Cual es el valor de P(X ≥ 2)

Solución:

a. Como la media es ½ minuto entre llegadas → 4

2

1

1)x(V

2

12

b. xe1)1X(P

4. Una maquina textilera produce con 10 defectos en cada 50 m de tela.

a. Cual es la probabilidad de que la longitud entre 2 defectos consecutivos sea menor a 4 m.

b. Cual es la probabilidad de que la longitud entre 2 defectos consecutivos este entre 6 y 8 m

5. A una peluquería acude un promedio de 16 clientes entre las 8 y la 12 de la mañana. Los

clientes llegan de acuerdo a una distribución de Poisson.

a. Cual es la probabilidad de que el tiempo entre 2 llegadas consecutivas de clientes sea

superior a 3 minutos.

b. Cual es la probabilidad de que el tiempo entre 2 llegadas consecutivas de clientes este

comprendido entre 4 y 7 minutos.

6. Supóngase que en una entidad bancaria, se atiende en promedio a cuatro clientes cada seis

minutos, supóngase también que el número de clientes atendidos sigue una distribución de

Poisson.

a. Cual es la probabilidad de que se empleen más de tres minutos en atender a un cliente.

b. Cual es la probabilidad de que el tiempo de atención a un cliente este comprendido entre

dos y cuatro minutos.

Page 144: Libro de estadistica

143

DISTRIBUCIÓN DE PROBABILIDAD CUADRADAI

Considerando nuevamente las muestras aleatorias independientes de distribuciones

normales, sabemos que : 2

2

2

22

2

2

2

1

2

11

2

1/1/1 SnySn

Tienen distribuciones 2 independientes con:

11 2211 nvynv

Grados de libertad, respectivamente. Esto implica que:

2

2

2

2

2

1

2

1

2

2

2

2

22

1

2

1

2

11

2

2

2

1

2

1

/

/

1/1

1/1

/

/

S

S

nSn

nSn

v

vF

Tiene una distribución F con 11n grados de libertad del numerador y 1

2n

grados de libertad del denominador.

En al figura Siguiente se muestra la gráfica de una típica función de densidad F . Los

valores de

F tales que FFP se dan en las tablas de la distribución F, para los

valores de ,100,0 0,050, 0,025, 0,010 y 0,005. En esas tablas, los encabezados de las

columnas corresponden a los grados de libertad del numerador, en tanto que los grados de

libertad del denominador se encuentran como los encabezados principales de los renglones.

Frente a los grados de libertad del denominador (los encabezados de los renglones), se

encuentran los valores de 0,100, 0,050, 0,025, 0,010 y 0,005. Por ejemplo, si la variable F

estudiada tiene 5 grados de libertad del numerador y 7 grados de libertad del denominador, F 0.100

= 2.88, F 0.050 = 3.97, F 0.025 = 5.29, F 0.010 = 7,46 y F 0.005 = 9.52. Luego la probabilidad de que

una variable aleatoria con una distribución F con 5 grados de libertad del numerador y 7 grados

de libertad del denominador exceda de 7.46 es 0,01. Lo correspondiente se afirma para los demás

casos.

uf

Una típica función de densidad

De probabilidad F

F

u

DISTRIBUCION "T DE STUDENT"

Supóngase que se toma una muestra de una población normal con media µ y varianza 2 x es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la

Page 145: Libro de estadistica

144

distribución

n

xz

es una distribución normal estándar. Supóngase que la varianza de la

desconocida. ¿Qué sucede con la distribución de este estadístico si se reemplaza

σ por s? La distribución t proporciona la respuesta a esta pregunta.

La media y la varianza de la distribución t son = 0 para >2,

respectivamente.

La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de

la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y

unimodales, y el valor máximo de la ordenada se alcanza en la media = 0

la distribución t tiene colas más amplias que la normal; esto es, la probabilidad de las colas es

mayor que en la distribución normal. A medida que el número de grados de libertad tiende a

infinito, la forma límite de la distribución t es la distribución normal estándar.

Propiedades de las distribuciones t

Cada curva t tiene forma de campana con centro en 0.

Cada curva t, está más dispersa que la curva normal estándar z.

A medida que aumenta, la dispersión de la curva t correspondiente disminuye.

A medida que ∞, la secuencia de curvas t se aproxima a la curva normal estándar, por lo que

la curva z recibe a veces el nombre de curva t con gl = ∞

La distribución de la variable aleatoria t está dada por:

tv

t1

v)2/v(

2/1v)t(h

2/)1v(2

Esta se conoce como la distribución t con grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con

media µ y desviación estándar σ. Entonces la variable aleatoria

ns

xt

tiene una distribución t

Page 146: Libro de estadistica

145

con = n- 1 grados de libertad.

La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de

W. S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la

publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo

en secreto bajo el nombre de "Student". En consecuencia, la distribución t normalmente se llama

distribución t de Student, o simplemente distribución t. Para derivar la ecuación de esta

distribución, Gosset supone que las muestras se seleccionan de una población normal. Aunque

esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales

que poseen distribuciones en forma casi de campana aún proporcionan valores de t que se

aproximan muy de cerca a la distribución t.

La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la

muestra y siempre es mayor a uno. Únicamente cuando el tamaño de la muestra tiende a infinito

las dos distribuciones serán las mismas.

Se acostumbra representar con t el valor t por arriba del cual se encuentra un área igual a

α. Como la distribución t es simétrica alrededor de una media de cero, tenemos tt 1 ; es

decir, el valor t que deja un área de 1-α a la derecha y por tanto un área de α a la izquierda, es

igual al valor t negativo que deja un área de α en la cola derecha de la distribución. Esto es, t0.95 =

-t0.05, t0.99=-t0.01, etc.

Ejemplo:

El valor t con = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un

área de 0.975 a la derecha, es

t0.975=-t0.025 = -2.145

Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que se tiene

que hacer la resta de 1-α. La manera de encontrar el valor de t es buscar el valor de α en el primer

renglón de la tabla y luego buscar los grados de libertad en la primer columna y donde se

intercepten α y se obtendrá el valor de t.

Ejemplo:

Encuentre la probabilidad de –t0.025 < t < t0.05.

Solución:

Page 147: Libro de estadistica

146

Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda,

encontramos un área total de 1-0.05-0.025 = 0.925.

P (–t0.025 < t < t0.05) = 0.925

Ejemplo:

Encuentre k tal que P (k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se

selecciona de una distribución normal.

Solución:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este

valor le corresponde un área de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta

0.05 y 0.045 se tiene un valor de 0.005, que eq

el primer renglón con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el valor

de α está en el extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto:

P (-2.977 < t < -1.761) = 0.045

Ejemplo:

Un ingeniero químico afirma que el rendimiento medio de la población de cierto proceso en lotes

es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra

de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su

afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por

milímetro y una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos

es aproximadamente normal.

Solución:

De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. El fabricante queda

satisfecho con esta afirmación si una muestra de 25 lotes rinde un valor t entre –1.711 y 1.711.

Page 148: Libro de estadistica

147

Se procede a calcular el valor de t:

25,2

2540

500518

ns

xt

Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor

de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de

0.02. De aquí que es probable que el fabricante concluya que el proceso produce un mejor

producto del que piensa.

DISTRIBUCION DE PROBABILIDAD BETA.

La distribución de probabilidad beta es una función de densidad con dos parámetros

definida en el intervalo cerrado 0 <= y <= 1. Se utiliza frecuentemente como modelo para

fracciones, tal como la proporción de impurezas en un producto químico o la fracción de tiempo

que una maquina está en reparación.

Función de densidad probabilidad:

10;0, y

),(

)1({)(

11

B

yyyf

En cualquier otro punto donde

)(

)()()1(),( 11

dyyyB

Nótese que la definición de (y) sobre el intervalo 0≤ y ≤ 1 restringe su aplicación. Si c≤ y

≤ d, y = (y- c) / (d- c) definirá una nueva variable en el intervalo 0≤ y ≤ 1. Así la función de

densidad beta se puede aplicar a una variable aleatoria definida en el intervalo c≤ y ≤ d mediante

una traslación y una medición en la escala.

La función de distribución acumulativa para la variable aleatoria beta se llama

comúnmente función beta y esta dada por:

),(),(

)1()(

0

11

y

y

IdtB

ttyF

Para valores enteros de alfa y beta, Iy (alfa, beta) está relacionada con la función de

probabilidad binomial. Cuando y = p, se puede demostrar que:

n

y

yny ppdyB

yypF

)1(

),(

)1()(

11

En donde 0 < p < 1 y n igual a alfa más beta menos uno.

Page 149: Libro de estadistica

148

DISTRIBUCIÓN WEIBULL

Devuelve la probabilidad de una variable aleatoria siguiendo una distribución de Weibull.

Esta distribución se aplica en los análisis de fiabilidad, para establecer, por ejemplo, el periodo de

vida de un componente hasta que presenta una falla.

La ecuación para la función de distribución acumulada de Weibull es:

xexF 1,,

La función de densidad de probabilidad es:

xexxf 1,, .

Cuando = 1 la distribución de Weibull devuelve la distribución exponencial con:

1

.

DISTRIBUCION DE PROBABILIDAD F

Supóngase que deseamos comparar las varianzas de dos poblaciones normales basados en

la información contenida en muestras aleatorias independiente de las dos poblaciones. Supóngase

que una muestra aleatoria contiene n1 variables aleatorias distribuidas normalmente con una

varianza común 2

1 y que la otra muestra aleatoria contiene 2n variables aleatorias distribuidas

normalmente con una varianza común 2

1 y que la otra muestra aleatoria contiene 2n variables

aleatorias distribuidas normalmente con una varianza común 2

1 . Si calculamos 2

1S de las

observaciones en la muestra 1, entonces 2

1S es una estimación de 2

1 . De manera similar, 2

2S

calculada a partir de las observaciones de la segunda muestra es una estimación para 2

2 . Así

intuitivamente podríamos pensar en utilizar 2

1S /

2

2S para hacer inferencias con respecto a las

magnitudes relativas de 2

1 y

2

2 . Si dividimos cada

2

iS por

2

i , entonces la razón siguiente

2

2

2

1

2

1

2

2

2

2

2

2

2

1

2

1

/

/

S

S

S

S

Tiene una distribución F con 11 21 nn grados de libertad. La definición general de

una distribución F es como sigue:

Definición Sean 2

1 y 2

2 variables aleatorias ji - cuadrada con 1v y 2v grados de libertad.

Respectivamente. Entonces si 2

1 y 2

2 son independientes,

Page 150: Libro de estadistica

149

2

2

2

1

2

1

/

/

v

vF

Se dice que tiene una distribución F con 1v grados de libertad del numerador y 2v

grados de libertad del denominador.

La función de densidad para variables aleatorias con la distribución F es un miembro de

la familia de las distribuciones beta. Omitimos la formula para la densidad de una variable

aleatoria con la distribución F , pero el método para obtenerla se indica en los ejercicios al final

del capitulo.

Problemas Propuestos de Distribución de Probabilidades Continuas

Normal

1. Si X se distribuye N (0,1) Hallar:

a) ( 1.2 2.4)P X d) ( 1.64)P X

b) (1.23 1.87)P X e) ( 1.96 1.96)P X

c) ( 2.35 0.5)P X

2. La longitud de los peces de un río sigue un modelo normal con media 6,8 pulgadas y

varianza 0.09 pulgadas cuadradas. Si se extrae una muestra de 300 peces ¿Cuántos peces

de la muestra tendrán una longitud :

i) Mayor que 7,2 pulgadas?

ii) Menor o igual a 6,4 pulgadas?

iii) Entre 6,5 y 7,1 pulgadas?

3. El acero que se utiliza para tuberías de agua a menudo se recubre internamente con un

mortero de cemento para evitar la corrosión. En un estudio de los recubrimientos de

mortero de una tubería empleada en un proyecto de transmisión de agua en California se

especificó un espesor de 7/16 pulgadas para el mortero. Un gran número de mediciones de

espesor dieron una media de 0.635 pulgadas y una desviación estándar de 0.082 pulgadas.

Sí las mediciones de espesor, tenían una distribución Normal, ¿qué porcentaje aproximado

fue inferior a 7/16 de pulgada?

4. Un tubo fluorescente estándar tiene una duración distribuida Normalmente, con una media

de 7,000 horas y una desviación estándar de 1,000 horas. Un competidor ha inventado un

sistema de iluminación fluorescente compacto que se puede insertar en los receptáculos de

lámparas incandescentes. El competidor asegura que el nuevo tubo compacto tiene una

duración distribuida Normalmente con una media de 7,500 horas y una desviación estándar

de 1,200 horas.

Page 151: Libro de estadistica

150

a. ¿Cuál tubo fluorescente tiene mayor probabilidad de tener una duración mayor de

9,000 horas?

b. ¿Cuál tubo tiene mayor probabilidad de tener una duración de menos de 5,000 horas?

5. Supongamos que el peso de los habitantes de una población sigue un modelo normal con

media 71.3 kilos y una desviación estándar de 20,2 kilos. Hallar porcentaje de habitantes con

un peso:

i) Inferior o igual a 46 kilos.

ii) Entre 55,2 y 59,8 kilos

iii) Entre 69 y 80,5 kilos.

iv) Mayor o igual a 92 kilos.

6. La distribución de la demanda (en número de unidades por unidad de tiempo) de un

producto a menudo puede aproximarse con una distribución de probabilidad Normal. Por

ejemplo, una compañía de comunicación por cable ha determinado que el número de

interruptores terminales de botón solicitados diariamente tiene una distribución Normal, con

una media de 200 y una desviación estándar de 50.

a) ¿En qué porcentaje de los días la demanda será de menos de 90 interruptores?

b) ¿En qué porcentaje de los días la demanda estará entre 225 y 275 interruptores?

c) Con base en consideraciones de costos, la compañía ha determinado que su mejor

estrategia consiste en producir una cantidad de interruptores suficiente para atender

plenamente la demanda en 94% de todos los días. ¿Cuantos interruptores terminales

deberá producir la compañía cada día?

7. Supongamos que una máquina fabrica tapas para tarros cuyo diámetro sigue un modelo

normal con una media de 2,5 pulgadas y una desviación estándar de 0,25 pulgadas. El

departamento de control de calidad considera defectuosa una tapa si su diámetro es menor o igual

2 pulgadas o mayor o igual a 2,8 pulgadas. ¿Hallar el porcentaje de tapas defectuosas

producidas por esa máquina?

8. Para aplicar un tratamiento se toma una muestra de 200 ratas cuya longitud promedio fue de

2,1 pulgadas con una varianza de 0,01 pulgadas cuadradas. Si el tamaño de las ratas sigue un

modelo normal.

a. ¿Cuántas ratas de la muestra tienen un tamaño:

i) Que exceda las 2 pulgadas?

ii) Menor o igual a 1.98 pulgadas?

iii) Entre 1.98 y 2.23 pulgadas?

b. ¿Cuál es el tamaño mínimo del 5% de las ratas más grandes?

9. El peso verdadero de prematuros nacidos en una clínica, sigue un modelo normal con media

2.8 kilos y desviación estándar 0.46 kilos. ¿Cuál es la probabilidad de que un prematuro que

nazca en la clínica pese por lo menos 2.5 kilos?

Page 152: Libro de estadistica

151

10. Si las alturas de 300 estudiantes sigue un modelo normal con media 68 pulgadas y

varianza 9 pulgadas 2 ¿Cuántos estudiantes de la muestra tienen alturas :

a) Mayor de 72 pulgadas ?

b) Menor o igual a 64 pulgadas?

c) Entre 65 y 71 pulgadas?

d) Menor o igual a 68 pulgadas?

11. En un quiosco de periódicos se supone que el número de ventas diarias se distribuye

normalmente con media 30 y varianza 2. Determinar:

a) Probabilidad de que en un día se vendan entre 13 y 31 periódicos.

b) Determinar el máximo número de periódicos que se venden en el 90% de las ocasiones.

c) Supongamos que en una ciudad hay 10 quioscos independientes del mismo tipo y con las

mismas características. Determinar la probabilidad de que más de dos quioscos vendan

entre 13 y 31 periódicos.

Exponencial

1. El tiempo de reparación de unas máquinas de escribir tiene una distribución

aproximadamente exponencial, con media 22 minutos.

a. Hallar la probabilidad de que el tiempo de reparación sea menor que diez minutos.

b. Para efectuar una programación, ¿cuanto tiempo se debe asignar a cada reparación para que

la probabilidad de que cualquier tiempo de reparación mayor que el tiempo asignado sea solo

de 0.1?

2. El personal de la compañía Onda S.L. usa una Terminal para realizar sus pedidos

internacionales. Si el tiempo que cada comercial gasta en una sesión en la Terminal tiene

una distribución exponencial con media 36 minutos, encontrar:

a) Probabilidad de que un comercial utilice la Terminal 30 minutos o menos.

b) Si un comercial a estado 30 minutos en la Terminal, ¿Cuál es la probabilidad de que pase

al menos una hora más en la Terminal?.

c) El 90% de las sesiones terminan en menos de R minutos. ¿Cuánto vale R?

3. Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una

distribución exponencial con media de 16 años.

a) ¿Cuál es la probabilidad de que a una persona a la que se le ha implantado este marcapasos

se le deba reimplantar otro antes de 20 años? Si el marcapasos lleva funcionando

correctamente 5 años en un paciente.

b) ¿Cuál es la probabilidad de que haya que cambiarlo antes de 25% años?

Page 153: Libro de estadistica

152

4. El tiempo que una persona espera la llegada del autobús se distribuye exponencialmente

con media de 10 minutos, es decir, λ = 1/10.

a. Cual es la probabilidad de que el pasajero espere más de 5 minutos al autobús?

b. La probabilidad de que el tiempo de espera sea de mas de quince minutos? Cual es esta

probabilidad si ya ha esperado 10 minutos?

5. Supongamos que la vida de un bombillo se distribuye exponencialmente con media de 10

horas. Una persona entra en la habitación cuando el bombillo esta encendido y desea

trabajar por cinco horas.

i. Cual es la probabilidad de que la persona concluya su trabajo antes de que el bombillo

se dañe?

ii. Que se puede decir de esta probabilidad si la distribución no fuera exponencial?

6. Supongamos que se tiene una cadena de música que consiste en un reproductor de CD’s y

un altavoz. Si la vida del reproductor de CDs es exponencial con media de 1000 horas y la

del altavoz exponencial con media 500 horas e independiente de la del reproductor. Cual

es la probabilidad de que un fallo del sistema sea causada por el reproductor?

Page 154: Libro de estadistica

153

Teoría del Muestreo

La estadística Inferencial, es el proceso por el cual se deducen (infieren) propiedades o

características de una población a partir de una muestra significativa. Uno de los aspectos

principales de la inferencia es la estimación de parámetros estadísticos. Por ejemplo, para

averiguar la media, µ, de las estaturas de todos los soldados de un reemplazo, se extrae una

muestra y se obtiene su media, x . La media de la muestra (media muestral), x , es un estimador

de la media poblacional, µ. El punto de interés es la muestra, la cual debe ser representativa de la

población objeto de estudio.

Se seguirán ciertos procedimientos de selección para asegurar de que las muestras reflejen

observaciones a la población de la que proceden, ya que solo se pueden hacer observaciones

probabilísticas sobre una población cuando se usan muestras representativas de la misma.

Si el proceso de muestreo está bien realizado (es decir, la muestra tiene el tamaño adecuado y ha

sido seleccionada aleatoriamente), entonces el valor de µ, desconocido, puede ser inferido a partir

de x .

Población y Muestra

Población

La población es un agregado de unidades individuales, compuesto de personas o cosas

que se hallan en una situación determinada. Las unidades individuales se llaman unidades

elementales. Definir una población es determinar sus unidades elementales de acuerdo con el

interés que se tiene respecto a alguna característica de aquélla.

Tanto la definición de una población como la característica por observar de sus unidades

elementales dependen de la naturaleza del problema. Por ejemplo, si el problema es "Camisas

para personas adultas de un país", se trata de determinar la cantidad adecuada de producción de

camisas de acuerdo con las diversas medidas. La población son todas las personas adultas de ese

país. La característica de interés son las medidas del cuello de las personas adultas en dicho país.

Las poblaciones pueden ser infinitas o finitas.

Una población infinita es la que contiene un número infinito de unidades elementales; por

ejemplo, el conjunto de piezas que se obtienen en un proceso productivo; en el sentido de que se

siguen produciendo indefinidamente. Otro ejemplo son todos los posibles resultados al lanzar una

moneda sin cesar.

Una población es finita cuando tiene un número finito de unidades elementales. Por

ejemplo, los estudiantes de una determinada universidad; el número de escuelas que existen en

Page 155: Libro de estadistica

154

una determinada ciudad, el número de árboles de coco sembrados en una determinada parcela,

etcétera. (El número de unidades elementales de una población se denota con la letra N).

Muestra

Una muestra es una parte de la población; por ejemplo, cuando se desea hacer un estudio

relativo al rendimiento académico de los alumnos de cierta universidad, y para esto se toma sólo

un grupo de estudiantes de la misma. Todos los estudiantes de ella son la población y el grupo

escogido constituye la muestra. Es importante hacer notar que para hacer una investigación

mediante el análisis de una muestra, ésta tiene que ser, necesariamente, representativa. La

representatividad de la muestra implica que cada unidad de la población debe tener igual

probabilidad de ser seleccionada. En estas condiciones, se dice que la muestra es aleatoria. La

obtención de una muestra representativa es uno de los aspectos más importantes de la teoría

estadística, estas se utilizan por muchas razones; una enumeración completa de la población,

llamada censo, puede ser económicamente imposible, o no se cuenta con el tiempo suficiente. (El

número de unidades elementales de una muestra se denota con la letra n).

A continuación se verá algunos usos del muestreo en diversos campos:

Política. Las muestras de las opiniones de los votantes se usan para que los candidatos

midan la opinión pública y el apoyo en las elecciones.

Educación. Las muestras de las calificaciones de los exámenes de estudiantes se usan para

determinar la eficiencia de una técnica o programa de enseñanza.

Industria. Muestras de los productos de una línea de ensamble sirve para controlar la

calidad.

Medicina. Muestras de medidas de azúcar en la sangre de pacientes diabéticos prueban la

eficacia de una técnica o de un fármaco nuevo.

Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la producción

los efectos de un fertilizante nuevo.

Gobierno. Una muestra de opiniones de los votantes se usaría para determinar los criterios

del público sobre cuestiones relacionadas con el bienestar y la seguridad nacional.

Parámetros y Estadísticos

Matemáticamente, podemos describir muestras y poblaciones al emplear mediciones

como la media, la mediana, la moda y la desviación estándar. Cuando estos términos describen

las características de una muestra, se denominan estadísticos. Cuando describen las características

de una población, se llaman parámetros. Un estadístico es una característica de una muestra y un

parámetro es una característica de una población.

Page 156: Libro de estadistica

155

Diferencias entre poblaciones y muestras

Población Muestra

Definición Colección de elementos

considerados

Parte o porción de la

población seleccionada para

su estudio

Características “Parámetros” “Estadísticos”

Símbolos Tamaño de la población = N Tamaño de la muestra = n

Media de la población = μ Media de la muestra = x

Desviación estándar de la

población = σ

Desviación estándar de la

muestra = s

Símbolos estándar: N, μ, σ, y n , x , s

Para ser consecuentes, los estadísticos emplean letras latinas minúsculas para denotar

estadísticos de muestra y letras griegas o latinas mayúsculas para representar parámetros de

población. En la tabla 1 se enumeran estos símbolos y se resumen sus definiciones.

Errores en el Muestreo

Cuando se utilizan valores muéstrales, o estadísticos para estimar valores poblacionales, o

parámetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral.

El error muestral se refiere a la variación natural existente entre muestras tomadas de la misma

población.

Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran

cuidado para asegurar que dos muestras del mismo tamaño sean representativas de una cierta

población, no esperaríamos que las dos sean idénticas en todos sus detalles. El error muestral es

un concepto importante que ayudará a entender mejor la naturaleza de la estadística inferencial.

Los errores que surgen al tomar las muestras no pueden clasificarse como errores muéstrales y se

denominan errores no muéstrales.

El Sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a

una tendencia sistemática inherente a un método de muestreo que da estimaciones de un

parámetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el

parámetro real.

El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización. La

aleatorización se refiere a cualquier proceso de selección de una muestra de la población en el

que la selección es imparcial o no está sesgada; una muestra elegida con procedimientos

aleatorios se llama muestra aleatoria.

Page 157: Libro de estadistica

156

Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio

simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemático.

Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan la

misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.

Ejemplos

1. Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de

estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no ordenada y

este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las 15,504 en trozos

separados de papel, una tarea tremenda, luego los colocamos en un recipiente y después los

revolvemos, entonces podremos tener una muestra aleatoria de 5 si seleccionamos un trozo de

papel con cinco nombres. Un procedimiento más simple para elegir una muestra aleatoria sería

escribir cada uno de los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,

revolverlos y después extraer cinco papeles al mismo tiempo.

Otro método parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20

utiliza una tabla de números aleatorios. Se puede construir la tabla usando una calculadora o una

computadora. También se puede prescindir de estas y hacer la tabla escribiendo diez dígitos del 0

al 9 en tiras de papel, las colocamos en un recipiente y los revolvemos, de ahí, la primera tira

seleccionada determina el primer número de la tabla, se regresa al recipiente y después de

revolver otra vez se selecciona otra tira, esta determina el segundo número de la tabla; el proceso

continúa hasta obtener una tabla de dígitos aleatorios con tantos números como se desee.

Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico,

imposible o no deseado; aunque sería deseable usar muestras aleatorias simples para las encuestas

nacionales de opinión sobre productos o sobre elecciones presidenciales, sería muy costoso o

tardado.

El muestreo estratificado requiere de separar a la población según grupos que no se

traslapen llamados estratos, y de elegir después una muestra aleatoria simple en cada estrato. La

información de las muestras aleatorias simples de cada estrato constituiría entonces una muestra

global.

Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una

gran universidad. Puede ser difícil obtener una muestra con todos los profesores, así que

supongamos que elegimos una muestra aleatoria de cada colegio, o departamento académico; los

estratos vendrían a ser los colegios, o departamentos académicos.

El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de

unidades heterogéneas entre sí de la población llamadas conglomerados. Cada elemento de la

Page 158: Libro de estadistica

157

población pertenece exactamente a un conglomerado, y los elementos dentro de cada

conglomerado son usualmente heterogéneos o disímiles.

Suponga que una compañía de servicio de televisión por cable está pensando en abrir una

sucursal en una ciudad grande; la compañía planea realizar un estudio para determinar el

porcentaje de familias que utilizarían sus servicios, como no es práctico preguntar en cada casa,

la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un conglomerado.

En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como sea

posible, a toda la población; entonces se usa una muestra aleatoria simple de conglomerados para

estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se

realizan, generalmente, con base en el muestreo por conglomerados.

El muestreo sistemático es una técnica de muestreo que requiere de una selección

aleatoria inicial de observaciones seguida de otra selección de observaciones obtenida usando

algún sistema o regla.

Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede

obtenerse primero una muestra aleatoria de los números de las páginas del directorio telefónico;

al elegir el vigésimo nombre de cada página obtendríamos un muestreo sistemático, también

podemos escoger un nombre de la primera página del directorio y después seleccionar cada

nombre del lugar número cien a partir del ya seleccionado. Por ejemplo, podríamos seleccionar

un número al azar entre los primeros 100; supongamos que el elegido es el 40, entonces

seleccionamos los nombres del directorio que corresponden a los números 40, 140, 240, 340 y así

sucesivamente.

Error Muestral

Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media

poblacional μ, entonces la media muestral, como medida, conlleva algún error. Por ejemplo,

supongamos que se ha obtenido una muestra aleatoria de tamaño 25 de una población con media

μ = 15: si la media de la muestra es x =12, entonces a la diferencia observada x - μ = -3 se le

denomina el error muestral. Una media muestral x puede pensarse como la suma de dos

cantidades, la media poblacional μ y el error muestral; si e denota el error muestral, entonces:

eX

Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6, para

simular una población "grande" de manera que el muestreo pueda realizarse un gran número de

veces, supondremos que éste se hace con reemplazo, es decir, el número elegido se reemplaza

antes de seleccionar el siguiente, además, se seleccionan muestras ordenadas. En una muestra

ordenada, el orden en que se seleccionan las observaciones es importante, por tanto, la muestra

Page 159: Libro de estadistica

158

ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccionó primero

4 y después 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2

que es posible seleccionar con reemplazo y también contiene las medias muéstrales y los

correspondientes errores muéstrales. La media poblacional es igual a: μ = (2+4+6)/3 = 4.

Nótese las interesantes relaciones siguientes contenidas en la tabla:

La media de la colección de medias muéstrales es 4, la media de la población de la que se

extraen las muestras. Si X

denota la media de todas las medias muéstrales entonces tenemos:

X = (3+4+3+4+5+5+2+4+6)/9 = 4

La suma de los errores muéstrales es cero.

e1 + e2 + e3 +. . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0

Muestra x Error muestral, e = x -μ

(2,2) 2 2 – 4 = -2

(2,4) 3 3 – 4 = -1

(2,6) 4 4 – 4 = 0

(4,2) 3 3 – 4 = -1

(4,4) 4 4 – 4 = 0

(4,6) 5 5 - 4 = 1

(6,2) 4 4 – 4 = 0

(6,4) 5 5 - 4 = 1

(6,6) 6 6 – 4 = 2

En consecuencia, si x se usa para medir, estimar, la media poblacional μ, el promedio de

todos los errores muéstrales es cero.

Distribuciones Muéstrales

Las muestras aleatorias obtenidas de una población son, por naturaleza propia,

impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la

misma población tenga la misma media muestral o que sean completamente parecidas; puede

esperarse que cualquier estadístico, como la media muestral, calculado a partir de las medias en

una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la

distribución de todos los valores posibles de un estadístico. Tales distribuciones serán muy

importantes en el estudio de la estadística inferencial, porque las inferencias sobre las

poblaciones se harán usando estadísticas muéstrales. Como el análisis de las distribuciones

asociadas con los estadísticos muéstrales, podremos juzgar la confiabilidad de un estadístico

muestral como un instrumento para hacer inferencias sobre un parámetro poblacional

desconocido.

Page 160: Libro de estadistica

159

Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se

le puede considerar como una variable aleatoria con su correspondiente distribución de

frecuencias.

La distribución de frecuencia de un estadístico muestral se denomina distribución

muestral. En general, la distribución muestral de un estadístico es la de todos sus valores posibles

calculados a partir de muestras del mismo tamaño.

Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población

grande. Se calcula la media muestral x para cada muestra; la colección de todas estas medias

muéstrales recibe el nombre de distribución muestral de medias.

Ahora bien si se calcula la desviación estándar de cada una. La colección de todas estas

desviaciones estándar muéstrales se llama distribución muestral de la desviación estándar.

Ejemplo

Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6.

Encuentre:

La media poblacional. (μ)

La desviación estándar poblacional. (σ)

La media de la distribución muestral de medias. (X

)

La desviación estándar de la distribución muestral de medias. ( ,X

)

Solución: REVISAR

Muestra x

(0,0) 0

(0,2) 1

(0,4) 2

(0,6) 3

(2,0) 1

(2,2) 2

(2,4) 3

(2,6) 4

(4,0) 2

(4,2) 3

(4,4) 4

(4,6) 5

(6,0) 3

(6,2) 4

(6,4) 5

(6,6) 6

Page 161: Libro de estadistica

160

La media poblacional es:

34

6420

La desviación estándar de la población es:

236.24

)36()34()32()30( 2222

La media de la distribución muestral de medias es:

33

48

16

16253443322110

n

)fx(X

c) La desviación estándar de la distribución muestral de medias es:

n

f)x( 2

X

X

58.116

1)36(2)35(3)34(4)33(3)32(2)31(1)30( 2222222

X

De aquí que podamos deducir que: 58.12

236.2

nX

Como para cualquier variable aleatoria, la distribución Muestral de medias tiene una

media o valor esperado, una varianza y una desviación estándar, se puede demostrar que la

distribución muestral de medias tiene una media igual a la media poblacional. Esto

es: 3)( xEX

Distribuciones muéstrales

Después de haber realizado el ejercicio anterior se puede ver que una distribución

muestral se genera extrayendo todas las posibles muestras del mismo tamaño de la población y

calculándoles a éstas su estadístico.

Si la población de la que se extraen las muestras es normal, la distribución muestral de

medias será normal sin importar el tamaño de la muestra.

Por consiguiente si la población de donde se extraen las muestras no es normal, entonces

el tamaño de la muestra debe ser mayor o igual a 30, para que la distribución muestral tenga una

Page 162: Libro de estadistica

161

forma acampanada. Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución

muestral de ser normal.

Para muchos propósitos, la aproximación normal se considera buena si se cumple n = 30.

La forma de la distribución muestral de medias sea aproximadamente normal, aún en casos donde

la población original es bimodal, es realmente notable.

Teorema del límite central

Si se seleccionan muestras aleatorias de n observaciones de una población con media μ y

desviación estándar σ, entonces, cuando n es grande, la distribución muestral de medias tendrá

aproximadamente una distribución normal con una media igual a μ y una desviación estándar de

n . La aproximación será cada vez más exacta a medida de que n sea cada vez mayor.

El teorema del límite central es de importancia fundamental para la estadística porque

justifica el uso de métodos de curva normal en una gran variedad de problemas; se aplica a

poblaciones infinitas y también a poblaciones finitas cuando n, a pesar de ser grande, no

constituye más que una pequeña porción de la población. Es difícil señalar con precisión qué tan

grande debe ser n de modo que se pueda aplicar el teorema del límite central, pero a menos de

que la distribución de la población tenga una forma muy inusual, por lo regular se considera que

n = 30 es lo suficientemente alto. Nótese que cuando en realidad estamos tomando una muestra

de una población, la distribución del muestreo de la media es una distribución normal, no

obstante el tamaño de n.

Ejemplo

En el ejercicio de elegir muestras ordenadas de tamaño 2, con reemplazo, de la población de

valores 0, 2, 4 y 6, podemos calcular lo siguiente:

El error muestral de cada media

Page 163: Libro de estadistica

162

La media de los errores muéstrales

La desviación estándar de los errores muéstrales.

Solución:

Muestra x Error muestral, e = x -μ

(0,0) 0 0-3 = -3

(0,2) 1 1 – 3 = -2

(0,4) 2 2 – 3 = -1

(0,6) 3 3 – 3 = 0

(2,0) 1 1 – 3 = -2

(2,2) 2 2 – 3 = -1

(2,4) 3 3 – 3 = 0

(2,6) 4 4 – 3 = 1

(4,0) 2 2 – 3 = -1

(4,2) 3 3 – 3 = 0

(4,4) 4 4 – 3 = 1

(4,6) 5 5 - 3 = 2

(6,0) 3 3 – 3 = 0

(6,2) 4 4 – 3 = 1

(6,4) 5 5 - 3 = 2

(6,6) 6 6 – 3 = 3

La media de los errores muéstrales es μe, es:

016

32.....0)1()2()3(e

La desviación estándar de la distribución de los errores muéstrales σe, es entonces:

58.116

1)03(2)02(3)01(4)00(3)01(2)02(1)03(

)(

2222222

2

N

fe e

e

La desviación estándar de la distribución muestral de un estadístico se conoce como error

estándar del estadístico. Para el ejercicio anterior el error estándar de la media denotado por σx, es

1.58. Con esto se puede demostrar que si de una población se eligen muestras de tamaño n con

reemplazo, entonces el error estándar de la media es igual a la desviación estándar de la

distribución de los errores muéstrales.

En general se tiene: ex

Page 164: Libro de estadistica

163

Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la

formula siguiente para encontrar σx.

1N

nN

nx

Donde σ es la desviación estándar de la población de donde se toman las muestras, n es el

tamaño de la muestra y N el de la población.

Como regla de cálculo, si el muestreo se hace sin reemplazo y el tamaño de la población

es al menos 20 veces el tamaño de la muestra (N 20), entonces se puede usar la fórmula.

El factor 1N

nN

se denomina factor de corrección para una población finita.

Ejemplo:

Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de tres Docentes

Universitarios de Matemáticas:

Docente de Matemáticas Antigüedad

A 6

B 4

C 2

Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo. Calcule la

antigüedad media para cada muestra, la media de la distribución muestral y el error estándar, o la

desviación estándar de la distribución muestral.

Solución:

Se pueden tener 3 muestras posibles. La tabla lista todas las muestras posibles de tamaño 2, con

sus respectivas medias muéstrales.

Muestras Antigüedad Media muestral

A , B (6,4) 5

A , C (6,2) 4

B , C (4,2) 3

La media poblacional es: 43

642

La media de la distribución muestral es: 43

345x

La desviación estándar de la población es:

Page 165: Libro de estadistica

164

63.13

)42()44()46( 222

El error estándar o la desviación estándar de la distribución muestral es:

816.03

)43()44()45( 222

Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos que:

152.12

63.1

nx

Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección

obtendremos el valor correcto:

816.013

23

2

63.1

1N

nN

nx

El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el valor del error

estándar:

Distribución Muestral de Medias

Si recordamos a la distribución normal, esta es una distribución continua, en forma de

campana en donde la media, la mediana y la moda tienen un mismo valor y es simétrica.

Con esta distribución podíamos calcular la probabilidad de algún evento relacionado con la

variable aleatoria, mediante la siguiente fórmula:

xz

En donde z es una variable estandarizada con media igual a cero y varianza igual a uno.

Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio,

utilizando la tabla de la distribución z.

Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier

tamaño de una población normal, la distribución muestral de medias tiene un comportamiento

aproximadamente normal, por lo que se puede utilizar la formula de la distribución normal con

x y

x , entonces la fórmula para calcular la probabilidad del comportamiento del

estadístico, en este caso la media de la muestra, quedaría de la siguiente manera:

n

xz

Para poblaciones finitas y muestro con reemplazo:

Page 166: Libro de estadistica

165

1N

nN

n

xz

Ejemplo:

Una empresa eléctrica fabrica Bombillos que tienen una duración que se distribuye

aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas.

Encuentre la probabilidad de que una muestra aleatoria de 16 Bombillos tenga una vida promedio

de menos de 775 horas.

Solución

5.2

1640

800775z

Este valor se busca en la tabla de z 0062.0)5.2z(P)775x(P

La interpretación sería que la probabilidad de que la media de la muestra de 16 Bombillos sea

menor a 775 horas es de 0.0062.

Ejemplo:

Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma normal con una

media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200

muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine:

El número de las medias muéstrales que caen entre 172.5 y 175.8 centímetros.

El número de medias muéstrales que caen por debajo de 172 centímetros.

Solución:

Como se puede observar en este ejercicio se cuenta con una población finita y un muestreo sin

reemplazo, por lo que se tendrá que agregar el factor de corrección. Se procederá a calcular el

denominador de Z para sólo sustituirlo en cada inciso.

36.111000

251000

259.6

1N

nN

n

47.136.1

5.1745.172

1

N

nN

n

xz

Page 167: Libro de estadistica

166

96.036.1

5.1748.175

z

P (172.5≤ x ≤ 175.8) = 0.7607

(0.7607)(200) = 152 medias muéstrales

83.136.1

5.1741752

z

P(x ≤ 172) = 0.00336

(0.0336)(200) = 7 medias muéstrales

Distribución Muestral de Proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que

queremos investigar la proporción de artículos defectuosos o la proporción de alumnos

reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar

respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución

muestral de medias, a excepción de que al extraer las muestras de la población se calcula el

estadístico proporción (p = x/n en donde "x" es el número de éxitos u observaciones de interés y

"n" el tamaño de la muestra) en lugar del estadístico media.

Una población binomial está estrechamente relacionada con la distribución muestral de

proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una

distribución muestral de proporciones contiene las posibilidades o proporciones de todos los

números posibles de éxitos en un experimento binomial, y como consecuencia de esta relación,

las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse usando la

aproximación normal a la binomial, siempre que np ≥5 y n(1-p) ≥ 5. Cualquier evento se puede

convertir en una proporción si se divide el número obtenido entre el número de intentos.

Page 168: Libro de estadistica

167

Veamos con un ejemplo la Generación de la Distribución Muestral de Proporciones

Ejemplo

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos. Se van a

seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución muestral de

proporciones para el número de piezas defectuosas.

Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta

población es 4/12 = 1/3. Por lo que podemos decir que el 33% de las piezas de este lote están

defectuosas.

El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos es

12C5=792, las cuales se pueden desglosar de la siguiente manera:

Artículos

Buenos

Artículos

Defectuosos

Proporción

de artículos

defectuoso

Número de maneras

en las que se puede

obtener la muestra

1 4 4/5=0.8 8C1*4C4=8

2 3 3/5=0.6 8C2*4C3=112

3 2 2/5=0.4 8C3*4C2=336

4 1 1/5=0.2 8C4*4C1=280

5 0 0/5=0 8C5*4C0=56

Total 792

Para calcular la media de la distribución muestral de proporciones se tendría que hacer la

sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre el número total

de muestras. Esto es:

3333.03

1

792

)560()2802.0()3364.0()1126.0()88.0(p

Como podemos observar la media de la distribución muestral de proporciones es igual a la

Proporción de la población.

μp = P

También se puede calcular la desviación estándar de la distribución muestral de proporciones:

Page 169: Libro de estadistica

168

1681.0792

56)3

10(280)3

12.0(336)3

14.0(112)3

16.0(8)3

18.0( 22222

p

La varianza de la distribución binomial es σ 2= npq, por lo que la varianza de la

distribución muestral de proporciones es σ 2

p = (pq)/n. Si se sustituyen los valores en esta fórmula

tenemos que:

2108.05

)3

2)(3

1(p , este valor no coincide con el de 0.1681, ya que nos falta agregar el

factor de corrección para una población finita y un muestreo sin reemplazo:

1681.0112

512

5

)3

2)(3

1(

p

1

N

nN

n

Pqp

La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de

proporciones está basada en la aproximación de la distribución normal a la binomial. Esta

fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la

muestra.

n

Pq

Ppz

A esta fórmula se le puede agregar el factor de corrección de 1N

nN

si se cumple con las

condiciones necesarias.

Ejercicios:

1. Se ha determinado que 60% de los estudiantes de una Universidad fuman cigarrillos. Se toma

una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la

muestra de la gente que fuma cigarrillos sea menor que 0.55.

Solución:

Page 170: Libro de estadistica

169

Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la aproximación de

la distribución normal a la binomial y el segundo utilizando la fórmula de la distribución muestral

de proporciones.

Aproximación de la distribución normal a la binomial:

Datos:

n = 800 estudiantes P = 0.60 x = (.55) (800) = 440 estudiantes P (x ≤ 440) = ?

Media = n p = (800)(0.60) = 480

92.2)4.0)(6.0(800

4805.439

npq

npxz

p (x ≤ 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de que al extraer

una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

Distribución Muestral de Proporciones

Datos:

n =800 estudiantes P = 0.60 p = 0.55 p (p≤ 0.55) = ?

92.2

800

)4.0)(6.0(

60.0549375.0

n

Pq

Ppz

Observe que este valor es igual al obtenido en el método de la aproximación de la

distribución normal a la binomial, por lo que si lo buscamos en la tabla de "z" nos da la misma

probabilidad de 0.0017. También se debe de tomar en cuenta que el factor de corrección de 0.5 se

Page 171: Libro de estadistica

170

esta dividiendo entre el tamaño de la muestra, ya que estamos hablando de una proporción.

La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo

que diríamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa

universidad, la proporción de estudiantes que fuman cigarrillos sea menor al 55% es del 0.17%.

2. Un medicamento para el dolor de cabeza tiene la advertencia de que algunos usuarios pueden

presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios

tienen tal reacción. Si una muestra aleatoria de 150 personas con dolor de cabeza usa el

medicamento, encuentre la probabilidad de que la proporción de la muestra de los usuarios que

realmente presentan una reacción adversa, exceda el 4%.

a. Resolverlo mediante la aproximación de la normal a la binomial

b. Resolverlo con la distribución muestral de proporciones

Solución:

Aproximación de la distribución normal a la binomial:

n =150 personas p = 0.03 x = (0.04) (150) = 6 personas p(x>6) = ?

Media = np = (150) (0.03)= 4.5

96.0)97.0)(03.0(150

5.45.6

npq

npxz

p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una

muestra de 150 personas, más de 6 presentarán una reacción adversa.

Distribución Muestral de Proporciones

n =150 personas P =0.03 P = 0.04 P (p>0.04) = ?

Page 172: Libro de estadistica

171

96.0

150

)97.0)(03.0(

03.00433.0

n

Pq

Ppz

Observe que este valor es igual al obtenido y la interpretación es: existe una probabilidad

del 17% de que al tomar una muestra de 150 personas se tenga una proporción mayor de 0.04

presentando una reacción adversa.

3. Se sabe que la verdadera proporción de los componentes defectuosos fabricados por una

Empresa es de 4%, y encuentre la probabilidad de que una muestra aleatoria de tamaño 60 tenga:

Menos del 3% de los componentes defectuosos.

Más del 1% pero menos del 5% de partes defectuosas.

Solución:

n = 60 artículos P = 0.04 p = 0.03 p (p<0.03) = ?

073

60

)96.0)(04.0(

04.00216.0

n

Pq

Ppz

4. La probabilidad de que en una muestra de 60 artículos exista una proporción menor de 0.03

artículos defectuosos es de 0.2327.

Solución:

n = 60 artículos P = 0.04 P = 0.01 y 0.05 P (0.01<p<0.05) = ?

Page 173: Libro de estadistica

172

86.0

60

)96.0)(04.0(

04.00183.0

n

Pq

Ppz 06.0

60

)96.0)(04.0(

04.00416.0

n

Pq

Ppz

Distribución Muestral de Diferencias y Sumas de Medias

Supóngase que se tiene dos poblaciones, para cada muestra de tamaño N1 extraída de la

primera población se calcula el estadístico S1, esto proporciona una distribución muestral cuya

media y desviación Standard vienen dadas por ,y 1S1S respectivamente. Análogamente para

cada muestra de tamaño N2 extraída de la segunda población se calcula el parámetro estadístico

S2 cuya media y desviación Standard son ,y 2S2S respectivamente.

De todas las posibles combinaciones de estas muestras de las dos poblaciones se pueden

obtener una distribución de las diferencias S1-S2 que se conoce como distribución muestral de

diferencias de los estadísticos.

La media y la varianza de esta distribución se indican por respectivamente y su expresión

es:

2121 ssss ,ss 2

S

2

S21 21 Siempre que las muestras sean independientes.

Si S1 y S2 son las medias muéstrales de las dos poblaciones que se expresan, entonces la

distribución muestral de las diferencias de medias para poblaciones infinitas con medias y

desviaciones Standard respectivamente se expresan como sigue:

(5)

que esta basado en el conjunto de ecuaciones (2).

Estas ecuaciones son válidas para poblaciones finitas sin el muestreo es con

reemplazamiento.

Para el caso de poblaciones finitas en las que el muestreo se realiza sin reemplazamiento,

se obtienen resultados similares partiendo de las ecuaciones (1).

Si el caso se trata de diferencias de distribuciones muéstrales de proporciones de dos

poblaciones con distribución binomial y parámetros p1, q1 y p2, q2 respectivamente. Entonces S1 y

S2 corresponden a las proporciones de éxito p1 y p2 y las ecuaciones (4) dan los resultados

siguientes:

Page 174: Libro de estadistica

173

A veces es útil considerar la distribución muestral de la suma de estadísticas.

La media y la desviación Standard de esta distribución vienen dadas por:

Todo lo anterior supone que las muestras son independientes.

Problemas propuestos

1. Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye normalmente con

media de 2000 libras y una varianza de 25,000 lbs2. Si se selecciona una muestra aleatoria de 100

cuerdas; determine la probabilidad de que en esa muestra:

La resistencia media encontrada sea de por lo menos 1958 libras.

La resistencia media se mayor de 2080 libras.

2. Como parte de un proyecto general de mejoramiento de la calidad, un fabricante textil decide

controlar el número de defectos encontradas en cada pieza de tela. Se estima que el número

promedio de defectos por cada pieza de tela es de 12, determine la probabilidad de que en la

próxima pieza de tela fabricada se encuentren:

Entre 10 y 12 defectos.

Menos de 9 y más de 15 defectos.

3. En una Prueba de aptitud la puntuación media de los estudiantes es de 72 puntos y la

desviación estándar es de 8 puntos. ¿Cuál es la probabilidad de que dos grupos de estudiantes,

formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuación media en:

3 ó más puntos.

6 o más puntos.

Entre 2 y 5 puntos.

4. Un especialista en genética ha detectado que el 26% de los hombres y el 24% de las mujeres de

cierta región del país tiene un leve desorden sanguíneo; si se toman muestras de 150 hombres y

150 mujeres, determine la probabilidad de que la diferencia muestral de proporciones que tienen

ese leve desorden sanguíneo sea de:

Menos de 0.035 a favor de los hombres.

Entre 0.01 y 0.04 a favor de los hombres.

5. Una Caja contiene 80 bolas de las que 60% son rojas y 40% blancas. De un total de 50

muestras de 20 bolas cada una, sacadas de la caja con remplazamiento, ¿en cuántas cabe esperar

¿Igual número de bolas rojas y blancas?

¿12 bolas rojas y 8 blancas?

8 bolas rojas y 12 blancas?

Page 175: Libro de estadistica

174

10 ó mas bolas blancas?

6. Los pesos de 1500 Rodamientos se distribuyen normalmente con media de 2.40 onzas y

desviación estándar de 0.048 onzas. Si se extraen 300 muestras de tamaño 36 de esta población,

determinar la media esperada y la desviación estándar de la distribución muestral de medias, si el

muestreo se hace:

Con remplazamiento

Sin remplazamiento

7. La vida media de una máquina para hacer pasta es de siete años, con una desviación estándar

de un año. Suponga que las vidas de estas máquinas siguen aproximadamente una distribución

normal, encuentre:

La probabilidad de que la vida media de una muestra aleatoria de 9 de estas máquinas caiga entre

6.4 y 7.2 años.

El valor de la x a la derecha del cual caería el 15% de las medias calculadas de muestras

aleatorias de tamaño nueve.

8. Se llevan a cabo dos experimentos independientes en lo que se comparan dos tipos diferentes

de pintura. Se pintan 18 Piezas con el tipo A y en cada uno se registra el tiempo de secado en

horas. Lo mismo se hace con el tipo B. Se sabe que las desviaciones estándar de la población son

ambas 1.0. Suponga que el tiempo medio de secado es igual para los dos tipos de pintura.

Encuentre la probabilidad de que la diferencia de medias en el tiempo de secado sea mayor a uno

a favor de la pintura A.

Page 176: Libro de estadistica

175

Estimación

Como ya hemos visto, el objetivo principal de la estadística inferencial es la estimación,

esto es que mediante el estudio de una muestra de una población se quiere generalizar las

conclusiones al total de la misma., los estadísticos varían mucho dentro de sus distribuciones

muéstrales, y mientras menor sea el error estándar de un estadístico, más cercanos serán unos de

otros sus valores.

Definición de estimador

Cualquier estadístico de muestra que se utilice para estimar un parámetro de población se

conoce como estimador, es decir, un estimador es un estadístico de muestra utilizada para estimar

un parámetro de población. La media de la muestra X puede ser un estimado de la media de la

población , y la porción de la muestra se puede utilizar como estimador de la porción de la

población. También podemos utilizar el alcance de la muestra como un estimador del alcance de

la población.

Propiedades de un Buen Estimador

Algunos estadísticos son mejores estimadores que otros. Afortunadamente, podemos

evaluar la calidad de un estadístico como estimador mediante el uso de cuatro criterios:

Insesgado.- Se dice que un estimador puntual

es un estimador insesgado de si

)(

E , para todo valor posible de θ. En otras palabras, un estimador insesgado es aquel para

el cual la media de la distribución muestral es el parámetro estimado. Si se usa la media muestral

x para estimar la media poblacional μ, se sabe que la x , por lo tanto la media es un

estimador insesgado.

Eficiente o con varianza mínima.- Suponga que

1 y

2 son dos estimadores

insesgados de θ. Entonces, aun cuando la distribución de cada estimador esté centrada en el valor

verdadero de θ, las dispersiones de las distribuciones alrededor del valor verdadero pueden ser

diferentes.

Entre todos los estimadores de θ que son insesgados, seleccione al que tenga varianza mínima. El

resultante recibe el nombre de estimador insesgado con varianza mínima (MVUE, minimum

variance unbiased estimator) de θ.

En otras palabras, la eficiencia se refiere al tamaño de error estándar de la estadística. Si

comparamos dos estadísticas de una muestra del mismo tamaño y tratamos de decidir cual de

ellas es un estimador mas eficiente, escogeríamos la estadística que tuviera el menor error

estándar, o la menor desviación estándar de la distribución de muestreo.

Tiene sentido pensar que un estimador con un error estándar menor tendrá una mayor

Page 177: Libro de estadistica

176

oportunidad de producir una estimación mas cercana al parámetro de población que se esta

considerando.

Como se puede observar las dos distribuciones tienen un mismo valor en el parámetro

sólo que la distribución muestral de medias tiene una menor varianza, por lo que la media se

convierte en un estimador eficiente e insesgado.

Coherencia.- Una estadística es un estimador coherente de un parámetro de población, si

al aumentar el tamaño de la muestra se tiene casi la certeza de que el valor de la estadística se

aproxima bastante al valor del parámetro de la población. Si un estimador es coherente se vuelve

más confiable si tenemos tamaños de muestras más grandes.

Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la información

contenida de la muestra que ningún otro estimador podría extraer información adicional de la

muestra sobre el parámetro de la población que se esta estimando.

Es decir se pretende que al extraer la muestra el estadístico calculado contenga toda la

información de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan

todos los datos. Cuando se calcula la mediana de una muestra sólo se utiliza a un dato o a dos.

Esto es solo el dato o los datos del centro son los que van a representar la muestra. Con

esto se deduce que si utilizamos a todos los datos de la muestra como es en el caso de la media, la

varianza, desviación estándar, etc.; se tendrá un estimador suficiente.

Definición de estimación

Cuando hemos observado un valor numérico específico de nuestro estimador, nos

referimos a ese valor como una estimación. En otras palabras, una estimación es un valor

específico observado de un estadístico. Hacemos una estimación si tomamos una muestra y

calculamos el valor que toma nuestro estimador en esa muestra. Suponga que calculamos la

lectura media de un odómetro (kilometraje) a partir de una muestra de taxis en servicio y

encontramos que ésta es de 160,000 kilómetros. Si utilizamos este valor específico para estimar

el kilometraje de la flotilla de taxis completa, el valor obtenido de 160,000 kilómetros sería una

Page 178: Libro de estadistica

177

estimación.

Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo.

Una estimación puntual es un único valor estadístico y se usa para estimar un parámetro.

El estadístico usado se denomina estimador.

Una estimación por intervalo es un rango, generalmente de ancho finito, que se espera que

contenga el parámetro.

Estimación Puntual

La inferencia estadística está casi siempre concentrada en obtener algún tipo de

conclusión acerca de uno o más parámetros (características poblacionales). Para hacerlo, se

requiere que un investigador obtenga datos muéstrales de cada una de las poblaciones en estudio.

Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades

muéstrales. Por ejemplo, representamos con μ (parámetro) el verdadero promedio de resistencia a

la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podría

tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de

cada una, y la media muestral de la resistencia a la ruptura x se podía emplear para sacar una

conclusión acerca del valor de μ. De forma similar, si 2 es la varianza de la distribución de

resistencia a la ruptura, el valor de la varianza muestral s2 se podría utilizar para inferir algo

acerca de 2 .

Cuando se analizan conceptos generales y métodos de inferencia es conveniente tener un

símbolo genérico para el parámetro de interés. Se utilizará la letra griega θ para este propósito. El

objetivo de la estimación puntual es seleccionar sólo un número, basados en datos de la muestra,

que represente el valor más razonable de θ.

Una muestra aleatoria de 3 baterías para calculadora podría presentar duraciones

observadas en horas de x1 = 5.0, x2 = 6.4 y x3 = 5.9. El valor calculado de la duración media

muestral es x = 5.77, y es razonable considerar 5.77 como el valor más adecuado de μ.

Una estimación puntual de un parámetro θ es un sólo número que se puede considerar como el

valor más razonable de θ. La estimación puntual se obtiene al seleccionar una estadística

apropiada y calcular su valor a partir de datos de la muestra dada. La estadística seleccionada se

llama estimador puntual de θ.

El símbolo

(theta sombrero) suele utilizarse para representar el estimador de θ y la

estimación puntual resultante de una muestra dada. Entonces x

se lee como "el estimador

puntual de μ es la media muestral x ". El enunciado "la estimación puntual de μ es 5.77" se puede

escribir en forma abreviada 77.5

.

Ejemplo:

Page 179: Libro de estadistica

178

En el futuro habrá cada vez más interés en desarrollar aleaciones de Mg de bajo costo, para varios

procesos de fundición. En consecuencia, es importante contar con métodos prácticos para

determinar varias propiedades mecánicas de esas aleaciones. Examine la siguiente muestra de

mediciones del módulo de elasticidad obtenidos de un proceso de fundición a presión:

44.2 - 43.9 - 44.7 - 44.2 - 44.0 - 43.8 - 44.6 - 43.1

Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la

varianza poblacional 2 . Un estimador natural es la varianza muestral:

251.018

)0625.441.43(.....)0625.449.43()0625.442.44(

1

)(

222

2

22

n

xxS

i

En el mejor de los casos, se encontrará un estimador

para el cual

= siempre. Sin embargo,

es una función de las Xi muéstrales, por lo que en sí misma una variable aleatoria.

= + error de estimación

Entonces el estimador preciso sería uno que produzca sólo pequeñas diferencias de estimación,

de modo que los valores estimados se acerquen al valor verdadero.

Estimación por Intervalos

Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información

alguna sobre la precisión y confiabilidad de la estimación. Por ejemplo, imagine que se usa el

estadístico x para calcular un estimado puntual de la resistencia real a la ruptura de toallas de

papel de cierta marca, y suponga que x = 9322.7. Debido a la variabilidad de la muestra, nunca

se tendrá el caso de que x .El estimado puntual nada dice sobre lo cercano que esta de μ. Una

alternativa para reportar un solo valor del parámetro que se esté estimando es calcular e informar

todo un intervalo de valores factibles, un estimado de intervalo o intervalo de confianza (IC).

Un intervalo de confianza se calcula siempre seleccionando primero un nivel de

confianza, que es una medida del grado de fiabilidad en el intervalo. Un intervalo de confianza

con un nivel de confianza de 95% de la resistencia real promedio a la ruptura podría tener un

límite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un nivel de confianza de 95%, es

posible tener cualquier valor de μ entre 9162.5 y 9482.9. Un nivel de confianza de 95% implica

que 95% de todas las muestras daría lugar a un intervalo que incluye μo cualquier otro parámetro

que se esté estimando, y sólo 5% de las muestras producirá un intervalo erróneo.

Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima

está dentro del intervalo.

Una interpretación correcta de la "confianza de 95%" radica en la interpretación frecuente

de probabilidad a largo plazo: decir que un evento A tiene una probabilidad de 0.95, es decir que

Page 180: Libro de estadistica

179

si el experimento donde A está definido re realiza una y otra vez, a largo plazo A ocurrirá 95% de

las veces. Para este caso

El 95% de los intervalos de confianza calculados contendrán a μ.

Esta es una construcción repetida de intervalos de confianza de 95% y se puede observar

que de los 11 intervalos calculados sólo el tercero y el último no contienen el valor de μ.

De acuerdo con esta interpretación, el nivel de confianza de 95% no es tanto un enunciado sobre

cualquier intervalo en particular, más bien se refiere a lo que sucedería si se tuvieran que

construir un gran número de intervalos semejantes.

Encontrar z a partir de un nivel de confianza

Existen varias tablas en las cuales podemos encontrar el valor de z, según sea el área

proporcionada por la misma. En esta sección se realizará un ejemplo para encontrar el valor de z

utilizando tres tablas diferentes.

Ejemplo:

Encuentre el valor de z para un nivel de confianza del 95%.

Solución 1:

Se utilizará la tabla que tiene el área bajo la curva de - hasta z. Si lo vemos gráficamente sería:

El nivel de confianza bilateral está dividido en partes iguales bajo la curva:

Page 181: Libro de estadistica

180

En base a la tabla que se esta utilizando, se tendrá que buscar el área de 0.975, ya que cada

extremo o cola de la curva tiene un valor de 0.025.

Por lo que el valor de z es de 1.96.

Solución 2:

Si se utiliza una tabla en donde el área bajo la curva es de 0 a z:

En este caso sólo se tendrá que buscar adentro de la tabla el área de 0.475 y el resultado del valor

de z será el mismo, para este ejemplo 1.96.

Solución 3:

Para la tabla en donde el área bajo la curva va desde z hasta: ∞

Se busca el valor de 0.025 para encontrar z de 1.96.

Independientemente del valor del Nivel de Confianza este será el procedimiento a seguir para

localizar a z. En el caso de que no se encuentre el valor exacto se tendrá que interpolar.

Page 182: Libro de estadistica

181

Intervalo de Confianza para la Media (µ) ; con σ Conocida

Construcción de intervalos de confianza

Un fabricante de fibras Sintéticas desea estimar la tensión de ruptura media de una fibra.

Las tensiones de ruptura de 16 fibras son: 20.8, 20.6, 21, 20.9, 19.9, 20.2, 19.8, 19.6, 20.9, 21.1,

20.4, 20.6, 19.7, 19.6, 20.3 y 20.7. Supóngase que la tensión de ruptura de una fibra se Puede

modelizar por una normal con desviación estándar de 0.45 libras.

Vamos a construir un intervalo con confianza del 98% para el valor real de la tensión media de

ruptura.

Dado que estimamos una media poblacional utilizaremos el estadístico media muestral

pero no sólo su valor esperado (como se hace en la estimación puntual); la distribución completa

del estadístico va a ser clave para determinar un intervalo con una probabilidad fijada de contener

al parámetro la probabidad (que denominamos confianza) en este caso es el 98%.

La distribución del estadístico

4

45.0,NesX

Por ello los valores Z0,99 Z 0,01 y , delimitan un 98% de los valores del estadístico estandarizado:

98.01125.0

01.099.0

ZX

Zp

De lo cual podemos “despejar” los extremos de un intervalo de forma que contengan al

parámetro:

98.0)1125.0()1125.0( 01.099.0 ZXZp

98.0)1125.0()1125.0( 01.099.0 XZXZp

98.0)1125.0()1125.0( 01.099.0 XZXZp

Ordenando y teniendo en cuenta que Z 0,99 = - Z 0,01

98.0)1125.0()1125.0( 01.001.0 ZXZXp

))1125.0(),1125.0(()( 01.001.098.0 ZXZXIC

3263.2;38125.20 01.099.0

1

ZZ

n

X

X

n

i

i

)6429.20;1195.20()(98.0 IC

Page 183: Libro de estadistica

182

Nivel de Confianza: Los extremos de un Intervalo de Confianza son aleatorios (dependen de la

muestra) por lo que podrán, o no, contener al verdadero parámetro. A la probabilidad de que un

Intervalo de Confianza Contenga al parámetro poblacional objeto de análisis se le denomina

Nivel de Confianza y se denota: 1-α

NOTA: Usualmente se adopta 1-α = 0.99, 0.95, 0.90

Relación entre Amplitud, Confianza y Precisión

Lógicamente, cuanto mayor es la amplitud del intervalo, la precisión para el parámetro es

menor. La precisión esta relacionada con la Capacidad Informativa. Cuando se precisa una

elevada confianza, se originan intervalos de mayor amplitud.

Por otro lado ya por todos es conocido, que en base a la distribución muestral de medias

que se generó en el tema anterior, la formula para el cálculo de probabilidad es la siguiente:

n

xz

Como en este caso no conocemos el parámetro y lo queremos estimar por medio de la

media de la muestra, sólo se despejará μ de la formula anterior, quedando lo siguiente:

n

zx

De esta formula se puede observar que tanto el tamaño de la muestra como el valor de z se

conocerán. Z se puede obtener de la tabla de la distribución normal a partir del nivel de confianza

establecido. Pero en ocasiones se desconoce σ por lo que en esos casos lo correcto es utilizar otra

distribución llamada "t" de student si la población de donde provienen los datos es normal.

Para el caso de tamaños de muestra grande se puede utilizar una estimación puntual de la

desviación estándar, es decir igualar la desviación estándar de la muestra a la de la población (s =

σ).

Ejemplos:

1. para medir la concentración promedio de zinc que tiene el agua de un río, se procedió a realizar

una muestra de mediciones en 36 sitios diferentes, encontrándose que la misma es de 2.6 gramos

por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de

zinc en el río. Suponga que la desviación estándar de la población es 0.3.

Page 184: Libro de estadistica

183

Solución:

La estimación puntual de es x = 2.6. El valor de z para un nivel de confianza del 95% es 1.96,

por lo tanto:

70.2y50.236

)3.0)(96.1(6.2

n

zx

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo será más

amplio:

73.2y47.236

)3.0)(575.2(6.2

n

zx

El intervalo de confianza proporciona una estimación de la precisión de nuestra

estimación puntual. Si μ es realmente el valor central de intervalo, entonces x estima μ sin error.

La mayor parte de las veces, sin embargo, x no será exactamente igual a μ y la estimación

puntual es errónea. La magnitud de este error será el valor absoluto de la diferencia entre μ y x ,

y podemos tener el nivel de confianza de que esta diferencia no excederá. n

z

Como se puede observar en los resultados del ejercicio se tiene un error de estimación

mayor cuando el nivel de confianza es del 99% y más pequeño cuando se reduce a un nivel de

confianza del 95%.

2. Una empresa eléctrica fabrica Bombillos que tienen una duración aproximadamente distribuida

de forma normal con una desviación estándar de 40 horas. Si una muestra de 30 Bombillos tiene

una duración promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media

de la población de todos los Bombillos que produce esta empresa.

Solución:

Page 185: Libro de estadistica

184

79576530

)40)(054.2(780

30

)40)(054.2(780

n

zx

n

zx

Con un nivel de confianza del 96% se sabe que la duración media de los Bombillos que

produce la empresa está entre 765 y 765 horas.

3. La prueba de corte sesgado es el procedimiento más aceptado para evaluar la calidad de una

unión entre un material de reparación y su sustrato de concreto. El artículo "Testing the Bond

Between Repair Materials and Concrete Substrate" informa que, en cierta investigación, se

obtuvo una resistencia promedio muestral de 17.17 N/mm2, con una muestra de 48 observaciones

de resistencia al corte, y la desviación estándar muestral fue 3.28 N/mm2. Utilice un nivel de

confianza inferior del 95% para estimar la media real de la resistencia al corte.

Solución:

En este ejercicio se nos presentan dos situaciones diferentes a los ejercicios anteriores. La

primera que desconoce la desviación estándar de la población y la segunda que nos piden un

intervalo de confianza unilateral.

El primer caso ya se había comentado y se solucionará utilizando la desviación estándar

de la muestra como estimación puntual de sigma.

Para el intervalo de confianza unilateral, se cargará el área bajo la curva hacia un solo lado

como sigue:

39.1648

)38.3)(654.1(17.17

n

zx

Esto quiere decir que con un nivel de confianza de 95%, el valor de la media está en el

intervalo (16.39, ).

4. Se consideran lo siguientes tiempos de reacción de un producto químico, en segundos: 1,4 1,2

1,2 1,3 1,5 1,3 2,2 1,4 1,1 Obtener un intervalo de confianza del 90% para el tiempo de reacción.

Suponer la variable normal con desviación típica poblacional conocida σ = 0,4.

Solución:

Para calcular un intervalo de confianza para media de una población normal de la que conocemos

Page 186: Libro de estadistica

185

la varianza poblacional, tenemos que usar el estadístico

nx

x

x

Por tanto, necesitamos calcular la media de la muestra. Que en nuestro caso es: X

1,4. Como queremos obtener un intervalo con nivel de confianza del 90%, tenemos que α = 0,1.

Así un intervalo de confianza del 90% para la media obtendrá:

nZx x

21

En nuestro caso, si miramos en la tabla de la función de distribución de la N (0,1),

tenemos que Z1-α/2 = Z0,95 = 1,64 es el valor normal estándar que corresponde al percentil 95. Un

intervalo de confianza del 90% para la media μ será:

(1,4 - 1,64 . 0,4/3 ; 1,4 + 1,64 . 0,4/3) = (1,1813; 1,6186)

Intervalo de Confianza para la Media (µ) ; con σ desconocida

Si X y S son la media y la desviación estándar de una muestra aleatoria de una población

normal con varianza 2 , desconocida, un intervalo de confianza de (1 - α) 100% para µ es:

n

StX

n

StX

22

Donde t /2 es el valor t con = n-1 grados de libertad, que deja un área de α /2 a la

derecha.

Se hace una distinción entre los casos de σ conocida y σ desconocida al calcular las

estimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza el

teorema del límite central, mientras que para σ desconocida se hace uso de la distribución

muestral de la variable aleatoria t. Sin embargo, el uso de la distribución t se basa en la premisa

de que el muestreo se realiza de una distribución normal. En tanto que la distribución tenga forma

aproximada de campana, los intervalos de confianza se pueden calcular cuando la varianza se

desconoce mediante el uso de la distribución t y se puede esperar buenos resultados.

Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se

pueda suponer, con σ desconocida y n 30, Se pueda reemplazar a σ y se puede utilizar el

Page 187: Libro de estadistica

186

intervalo de confianza:

nSZX

2

Por lo general éste se denomina como un intervalo de confianza de muestra grande. La

justificación yace sólo en la presunción de que con una muestra grande como 30, s estará muy

cerca de la σ real y de esta manera el teorema del límite central sigue valiendo. Se debe hacer

énfasis en que esto es solo una aproximación y que la calidad de este enfoque mejora a medida

que el tamaño de la muestra crece más.

Ejemplos:

1. El contenido de siete recipientes similares de un compuesto químico son 9.8, 10.2, 10.4, 9.8,

10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los

recipientes si se supone una distribución aproximadamente normal.

Solución:

La media muestral y la desviación estándar para los datos dados son:

X 10 y s = 0.283

En la tabla se encuentra que t0.025 = 2.447 con 6 grados de libertad, de aquí, el intervalo de

confianza de 95% para µ es:

7

283.0)477.2(0.10

7

283.0)477.2(0.10

Con un nivel de confianza del 95% se sabe que el promedio del contenido de los

recipientes está entre 9.47 y 10.26 litros.

2. Un artículo publicado en una revista especializada, presenta las siguientes 20 mediciones del

tiempo de combustión residual en segundos de especimenes tratados de ropa de dormir para

niños:

9.85 - 9.93 - 9.75 - 9.77 - 9.67 - 9.87 - 9.67 - 9.94 - 9.85 - 9.75

9.83 - 9.92 - 9.74 - 9.99 - 9.88 - 9.95 - 9.95 - 9.93 - 9.92 - 9.89

Se desea encontrar un nivel de confianza del 95% para el tiempo de combustión residual

Page 188: Libro de estadistica

187

promedio. Supóngase que el tiempo de combustión residual sigue una distribución normal.

Solución:

La media muestral y la desviación estándar para los datos dados son: X 9.8525 y s = 0.0965

En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de aquí, el intervalo de

confianza de 95% para µ es:

20

0965.0)093.2(8525.9

20

0965.0)093.2(8525.9

Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustión residual

promedio se encuentra entre 9.8073 y 9.8977 segundos.

3. Calcular un intervalo de confianza al nivel α = 0.001 para el peso exacto mediante los

resultados obtenidos con 10 básculas: 7.20, 7.01, 7.36, 6.91, 7.22, 7.03, 7.11, 7.12, 7.03, 7.05

Solución:

Suponiendo que las medidas del peso de las básculas sigue una distribución normal N (μ ,σ 2 )

con media el peso exacto, estamos interesados en encontrar un intervalo de confianza que

contenga a la media de esta distribución, que a un nivel α = 0.001 y desviación típica

desconocida, esta determinado por: n

stx x1n

21

donde n = 10, S = 0.1286 ; X 7.1040, y

utilizando la tabla de la distribución t de Student (T 9;0.9995) = 4.78091 Por tanto, el intervalo de

confianza al nivel 0.001 es: (6.9096,7.2984)

Page 189: Libro de estadistica

188

Intervalos de confianza para diferencias de medias 1-2 si 12

y 2

2 conocidas

Esto se utiliza cuando conocemos las medias muéstrales y las varianzas poblacionales entonces

se puede estimar el intervalo de confianza de la siguiente manera:

y

2

y

x

2

x

21

yx

y

2

y

x

2

x

21 nn

Z)yx(nn

Z)yx(

Ejemplos:

1. Se realizaron pruebas a muestras de dos productos, para encontrar su contenido calórico

determinando que para muestras iguales de 50 productos, las medias son de 750 y 800 para las

muestras A y B respectivamente, se sabe que sus desviaciones poblacionales son de 30 y 40

respectivamente, halle los intervalos de confianza para la media al 95%

Solución:

31.5268.4750

40

50

3096,1)750800(

50

40

50

3096,1)750800( yxyx

Intervalo de confianza para diferencia de medias 1-2 si 12

= 2

2 desconocidas

Esto se utiliza cuando conocemos las medias muéstrales y las varianzas poblacionales

sabemos que son iguales, aún cuando no las conozcamos, entonces se puede estimar el intervalo

de confianza de la siguiente manera:

yx

p

2nn

2

yx

yx

p

2nn

2n

1

n

1St)yx(

n

1

n

1St)yx( yxyx

2

)1()1( 22

yx

yyxx

pnn

SnSnS

Ejemplo:

1. Se desea encontrar la diferencia de las medias de dos marcas de tornillos, se han tomado dos

muestras iguales de 11 tornillos, y se han realizado ensayos a corte, la media de la muestra A fue

de 50,000lb de presión, la media de la muestra B fue de 45,000 sus desviaciones fueron 500 y

250 lb respectivamente, encuentre a los intervalos de confianza a un 95%.

Solución:

Page 190: Libro de estadistica

189

,28.39520

)250(10)500(10

2nn

S)1n(S)1n(S

22

yx

2

yy

2

xx

p

con v = 20, se tiene t = 1,725,

por lo tanto: 4709.25< 74.5290yx

Intervalo de confianza para diferencias de medias 1-2; 12 2

2 y desconocidas:

Si x1 y s12, y x2 y s2

2 son las medias y varianzas de muestras de tamaños n1 y n2 respectivamente,

de distribuciones aproximadamente normales con varianzas diferentes y desconocidas, un

intervalo de confianza con (1-) 100% para 1-2 esta dado por:

,n

S

n

St)yx(

n

S

n

St)yx(

y

2

y

x

2

xv

2

yx

y

2

y

x

2

xv

2

donde t/2 es el valor de t con

,2

1n

n

S

1n

nS

n

S

nS

V

y

2

y

2

y

x

2

x

2

x

2

y

2

y

x

2

x

grados de libertad con un área de /2 a la derecha.

Ejemplos:

1. Se registraron los siguientes datos en días, que representan los tiempos de recuperación de

pacientes tratados aleatoriamente con uno de dos medicamentos para aliviarlos de graves

infecciones en la vesícula:

Medicamento 1 Medicamento 2

n1 = 14 N2 = 116

x1 = 17 x2 = 19

s12 = 1.5 S2

2 = 1.8

Encuentre un intervalo de confianza del 99% para la diferencia 2 - 1 en el tiempo de

recuperación para los medicamentos, suponiendo poblaciones normales con varianzas diferentes.

Solución:

1- = 0.99 = 0.01 /2 = 0.005

Page 191: Libro de estadistica

190

,1799,162

1116

1168.1

114

145.1

1168.1

145.1

V22

2

t/2 = 2.898 2.90

01.398.0116

8.1

14

5.19.2)1719(

116

8.1

14

5.19.2)1719( yxyx

Conclusión:

Para un nivel de confianza del 99% se espera que la diferencia entre medias poblacionales esté

entre 0.98 y 3.01.

Intervalos de Confianza para la varianza:

Si s2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un intervalo

de confianza del (1-)100% para 2 es:

2

21

22

2

2

2 S)1n(S)1n(

donde /22 1-/2

2 son valores de chi cuadrado con v = n-1 grados de libertad, con áreas de /2 y

1- /2, respectivamente a la derecha

Ejemplo:

1. Se obtiene una muestra aleatoria de 20 estudiantes con una media de 72 y una varianza de 16

en un examen de ubicación de matemáticas. Suponga que las calificaciones tienen una

distribución normal y determine un intervalo de confianza de 98% para la varianza poblacional.

Solución:

Datos:

x = 72 1 - = 0.98 = 0.02 y /2 = 0.01 1- /2 = 0.99

s2= 16 = 19

n = 20 /22 = 36.19 1-/2

2 = 7.63

Entonces: 84,3940,863,7

16)120(

19,36

16)120( 22

Conclusión:

Page 192: Libro de estadistica

191

Para un nivel de confianza del 98% se espera que la varianza poblacional esté entre 8.40 y 39.84

2. Dada la siguiente muestra 1.02 - 0.87 -1.08 -1.09 -1.04. Determinar la estimación de la

desviación poblacional.

Un intervalo de confianza para la varianza 2 al nivel α = 0.05 es el siguiente:

2

21

22

2

2

2 S)1n(S)1n(

S = 0.089, utilizando la tabla de 2 se obtiene 7004.22

976,0,9

2

21,1n

es decir

4,312

20,05,0

2. Calcular un intervalo de confianza al nivel α = 0.05 para 2 mediante las desviaciones que se

producen en un proceso de fabricación cuya distribución es N(0,σ ) a partir de la muestra 1.2, -

2.2, -3.1, -0.2, 0.5, 0.6, -2.1, 2.2, 1.3

Solución:

Sabiendo que el proceso de fabricación sigue una distribución normal de media conocida μ = 0 ,

un intervalo de confianza para la varianza 2 al nivel α = 0.05 es el siguiente:

2

21

22

2

2

2 S)1n(S)1n(

5333,3S , utilizando la tabla de 2 se obtiene 7004.22

976,0,9

2

21,1n

es decir

es decir, (1.44458,10.1763)

Es el intervalo que contendrá con un 95% de acierto las desviaciones que se producen en el

proceso de fabricación.

Page 193: Libro de estadistica

192

3. Los responsables municipales de la salud miden la radiactividad en el agua de una fuente

natural en una zona abundante en granito. Realizadas 12 mediciones en diferentes fechas del año

se observó una media de 3,6 picocurios con una desviación típica de 0,82.determinar, al 95% y al

99%, intervalos de confianza para la radiación media y para la varianza.

Solución:

Tenemos los siguientes datos muéstrales

n = 12, 6,3x x = 3,6 y s = 0,82.

Para determinar el intervalo de confianza para σ2 tenemos en cuenta el estadístico:

2

2S)1n(

Es un variable 2 con 11 grados de libertad. Los percentiles necesarios para la determinación de

los intervalos al 95% y 99% de confianza son: 2 11;0,005 = 2,603 2; 2 11;0,025 =3,816 2; 2 11;0,975 =21,92 y 2; 2 11;0,995 =26,8.

Así el intervalo de confianza al 95% es:

816,3

)82,0)(11(;

92,21

)82,0)(11( 22

Y al 99%

603,2

)82,0)(11(;

8,26

)82,0)(11( 22

Efectuando los cálculos se obtiene, respectivamente,

(0,3681;2,1145) y (0,3011;3,0998).

En lo relativo a la media, el intervalo se determina teniendo en cuenta que

n

x

Es una variable t de Student con 11 grados de libertad. El intervalo, para un nivel de confianza

p=1-α, viene dado por:

n

stx

21,1n

Siendo t11; 1-α/2 el valor del percentil 100 ·(1-α/2) para 11 grados de libertad.

Concretamente

t11; 0,975 = 2,201 y t11; 0,995 = 3,1058, y los intervalos de confianza son, respectivamente,

3,6 ± 2,201

11

0,82

y 3,6 ± 3,1058

11

Page 194: Libro de estadistica

193

0,82

,

Obteniéndose 3,6 ± 0,544 y 3,6 ± 0,768.REVISAR

4. Se sabe que la longitud de los diámetros de los tornillos fabricados por una máquina siguen

una distribución normal y se busca un intervalo en el cual se encuentre la variabilidad de las

longitudes de los tornillos fabricados por la máquina con una probabilidad del 80%. Construir

dicho intervalo sabiendo que una muestra de 16 tornillos presenta una variabilidad cuantificada

en 30.

Solución:

Estamos ante el caso del cálculo de intervalos de confianza para la varianza de una distribución

normal con una media desconocida. En este caso el intervalo de confianza para la varianza se

basa en el siguiente estadístico:2

2S)1n(

lo que nos lleva al intervalo de confianza definido por:

2

21

2

2

2

2 S)1n(;

S)1n(

para un 90%, tenemos: 1-α = 0,90 → α = 0,02→ α/2 = 0,01; 4,312

20,05,0 , 9,102

20,95,0

El intervalo de confianza será entonces:

[21,43 56,14]

Luego el intervalos en el cual se encuentre la variabilidad de las longitudes de los tornillos

fabricados por la máquina con una probabilidad del 80% es [21,43 56,14]. Revisar

Intervalo de Confianza para la desviación estándar:

Si s2 es la varianza de una muestra aleatoria de tamaño n de una población normal, un

intervalo de confianza del (1-)100% para es:

2

21

2

2

2

2 S)1n(S)1n(

Donde /22 1-/2

2 son valores de chi cuadrado con v = n-1 grados de libertad, con áreas de /2 y

1- /2, respectivamente a la derecha

Ejemplos:

1. Una muestra aleatoria de 8 cigarros de una marca determinada tiene un contenido promedio de

nicotina de 2.6 miligramos y una desviación estándar de 0.9 miligramos determine un intervalo

Page 195: Libro de estadistica

194

de confianza de 99% para . Suponga que la población se distribuye aproximadamente en forma

normal.

Solución:

Datos:

x = 2.6 1 - = 0.99 = 0.01 y /2 = 0.005 1- /2 = 0.995

s = 0.9 = 7

n = 8 /22 = 20.27 1-/2

2 = 0.99

Entonces: 39,253,099,0

)9,0)(18(

27,20

)9,0)(18( 22

Conclusión:

Para un nivel de confianza del 99% se espera que la desviación estándar poblacional esté entre

0.53 y 2.39

2. En un proceso de fabricación de pilas alcalinas se sabe que su duración media es de 1100 horas

y que dicha duración sigue una distribución normal. El nuevo proceso busca reducir la dispersión

de la duración de las pilas por lo que se hace necesario construir intervalos de confianza para la

citada dispersión con coeficientes de confianza 90% y 98%. Construir dichos intervalos a partir

de una muestra de tamaño 20 cuya dispersión es 2240 horas.

Solución:

Estamos ante el caso del cálculo de intervalos de confianza para la desviación típica de una

distribución normal con media conocida. En este casi el intervalo de confianza para la desviación

típica se basa en el siguiente estadístico:

2

21

2

2

2

2 S)1n(S)1n(

Lo que nos lleva al intervalo de confianza para la desviación típica definido por:

Page 196: Libro de estadistica

195

2

21

2

2

2

2 S)1n(S)1n(

En nuestro caso, para el nivel del 90% tenemos: 1-α = 0,9 → α = 0,1→ α/2 = 0,05

4,312

20,05,0 , 9,102

20,95,0 El intervalo de confianza será entonces:

2

21

2

2

2

2 S)1n(;

S)1n(

ojo verificar formula

Para el nivel del 95% tenemos: 1-α = 0,98 → α = 0,02→ α/2 = 0,01; 4,312

20,05,0 ,

9,102

20,95,0

El intervalo de confianza será entonces:

[109,2 232,88]

Podemos concluir entonces que hay una probabilidad del 90% de que la dispersión de la duración

de las pilas en el nuevo proceso de fabricación esté entre 119,42 y 203,2 horas, y hay una

probabilidad del 98% de que la dispersión de la duración de las pilas en el nuevo proceso de

fabricación esté entre 109,2 y 232,88 horas.

Ejercicios Propuestos de Intervalos de Confianza

1. En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas. Se

obtiene X = 132 mg/dl y S2

2. Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se

eligen aleatoriamente a 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la gripe.

Construir un IC al 95% para la probabilidad de pasar la gripe si se está vacunado. En los otros

100 pacientes sin vacunar la pasan 20. ¿Hay evidencia de que la vacuna es eficaz?

3. La cantidad de horas que duermen los estadounidenses cada noche varía mucho. Consideremos

la siguiente muestra de las horas que duermen cada noche 16 personas.

6.9 - 7.6 - 6.5 - 6.2 - 7.8 - 7.0 - 5.5 - 7.6 - 7.3 - 6.6 - 7.1 - 6.9 -6.8 - 6.5 - 7.2 - 5.8

(a) Calcula una estimación puntual para la media de horas que se duerme cada noche y para la

desviación típica. ¿Que estimadores utilizas? ¿Por qué?

Suponer que la población sigue una distribución normal.

(b) Determinar un intervalo de confianza del 80% para la media de horas que se duerme cada

noche.

Page 197: Libro de estadistica

196

4. Se hicieron determinaciones, del nivel de contaminantes en el suero de 16 personas expuestas a

un químico nocivo y se registraron los siguientes valores en mg/Kg:

15.6 14.0 16.2 13.9

14.8 17.3 14.7 14.8

14.4 17.4 15.7 17.5

16.6 18.6 16.9 13.8

Suponga que la población mostrada es normal, calcule el intervalo de confianza del 95% para la

media de los niveles de contaminación.

5. El gerente de una estación de televisión quiere determinar que porcentaje de casas tienen más

de 1 televisión. Una muestra de 500 casas revela que 275 tienen 2 o más. ¿Cuál es el intervalo de

confianza para el 90% para estimar la proporción de todas las casas que tienen 2 o más

televisiones?

6. Un laboratorio industrial, desea determinar la dureza del agua que entra a su caldera, por lo

tanto realiza análisis a 60 muestras de agua de caldera, determinando que la concentración de

calcio y magnesio es en promedio 30ppm. Se estima que la desviación poblacional es de 5ppm,

determine con un nivel de confianza del 95% el intervalo de confianza para la media poblacional.

7. Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el

rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y

75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen

constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el

promedio para el motor B es 24 millas por galón. Encuentre un intervalo de confianza de 96%

sobre la diferencia promedio real para los motores A y B. Suponga que las desviaciones estándar

poblacionales son 6 y 8 para los motores A y B respectivamente.

8. Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su

flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento

utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se desgastan, dando como

resultado promedio para la marca A 36,300 kilómetros y para la marca B 38,100 kilómetros.

Calcule un intervalo de confianza de 95% para la diferencia promedio de las dos marcas, si se

sabe que las poblaciones se distribuyen de forma aproximadamente normal con desviación

estándar de 5000 kilómetros para la marca A y 6100 kilómetros para la marca B.

Page 198: Libro de estadistica

197

9. Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clases de largueros de

aluminio utilizados en la fabricación de alas de aeroplanos comerciales. De la experiencia pasada

con el proceso de fabricación se supone que las desviaciones estándar de las resistencias a la

tensión son conocidas. La desviación estándar del larguero 1 es de 1.0 Kg/mm2 y la del larguero 2

es de 1.5 Kg/mm2. Se sabe que el comportamiento de las resistencias a la tensión de las dos

clases de largueros son aproximadamente normal. Se toma una muestra de 10 largueros del tipo 1

obteniéndose una media de 87.6 Kg/mm2, y otra de tamaño 12 para el larguero 2 obteniéndose

una media de 74.5 Kg/mm2. Estime un intervalo de confianza del 90% para la diferencia en la

resistencia a la tensión promedio.

10. El salario medio semanal de una muestra de n = 30 empleados de una gran empresa

manufacturera es, x = 280.Bs, con una desviación estándar muestral de s = 14 Bs. En otra gran

empresa, una muestra aleatoria de n = 40 empleados tiene un salario medio semanal de 270.Bs,

con una desviación estándar muestral de s = 10.Bs. Calcule un intervalo de confianza de 99%

para la estimación de la diferencia entre los niveles salariales medios semanales de las dos

empresas.

11. En relación con una muestra aleatoria de n1,= 10 Bombillos, el ciclo medio de vida de los

Bombillos es X 1 = 4 600 horas, con s1, = 250 hr. El ciclo medio de vida y la desviación estándar

de una muestra de n2 = 8 bombillos de otra marca son X 2 = 4 000 hr Y S2 = 200 Hr. Se supone

que el ciclo de vida de ambas marcas tiene una distribución normal. Hallar un intervalo de

confianza de 90% para estimar la diferencia entre el ciclo medio de vida útil de las dos marcas de

bombillos.

12. Se desea estimar la precisión de un instrumento de medición. Al realizar tres mediciones con

el instrumento encontró una varianza muestral de 10.57 unidades.

Usando un nivel de confianza del 95%, Calcule un intervalo de confianza para la variación real

del instrumento.

Page 199: Libro de estadistica

198

Prueba de Hipótesis

Las secciones anteriores han mostrado cómo puede estimarse un parámetro a partir de los

datos contenidos en una muestra. Puede encontrarse ya sea un sólo número (estimador puntual) o

un intervalo de valores posibles (intervalo de confianza). Sin embargo, muchos problemas de

ingeniería, ciencia, y administración, requieren que se tome una decisión entre aceptar o rechazar

una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. Este es

uno de los aspectos más útiles de la inferencia estadística, puesto que muchos tipos de problemas

de toma de decisiones, pruebas o experimentos en el mundo de la ingeniería, pueden formularse

como problemas de prueba de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más

poblaciones.

Es importante no olvidar lo anteriormente dicho las hipótesis siempre son proposiciones

sobre la población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo

general, el valor del parámetro de la población especificado en la hipótesis nula se determina en

una de tres maneras diferentes:

Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el

objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del

parámetro.

Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo

estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo.

Cuando el valor del parámetro proviene de consideraciones externas, tales como las

especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación, el

objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el

nombre de prueba de hipótesis. Los procedimientos de prueba de hipótesis dependen del empleo

de la información contenida en la muestra aleatoria de la población de interés. Si esta

información es consistente con la hipótesis, se concluye que ésta es verdadera; sin embargo si

esta información es inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse

hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse con

certidumbre, a menos que pueda examinarse a toda la población. Usualmente esto es imposible

en muchas situaciones prácticas. Por tanto, es necesario desarrollar un procedimiento de prueba

de hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión equivocada.

La Hipótesis nula, representada por Ho, es la afirmación sobre una o más características

de poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").

Page 200: Libro de estadistica

199

La Hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta

es la hipótesis del investigador.

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia

muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se continúa

creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un análisis

por prueba de hipótesis son rechazar Ho o no rechazar Ho.

Prueba de una Hipótesis Estadística

Para ilustrar los conceptos generales, consideremos lo siguiente. Suponga que se tiene

interés en la rapidez de combustión de un agente propulsor sólido utilizado en los sistemas de

salida de emergencia para la tripulación de aeronaves. El interés se centra sobre la rapidez de

combustión promedio. De manera específica, el interés recae en decir si la rapidez de combustión

promedio es o no 50 cm./s. Esto puede expresarse de manera formal como

Ho; μ = 50 cm/s

H1; μ ≠ 50 cm/s

La proposición Ho; μ = 50 cm./s, que no es mas que la rapidez promedio de combustión es

50 cm./s, se conoce como hipótesis nula, mientras que la proposición H1; μ ≠ 50 cm./s o que la

rapidez promedio de combustion no es igual a 50 cm/s recibe el nombre de hipótesis alternativa.

Puesto que la hipótesis alternativa especifica valores de μ que pueden ser mayores o menores que

50 cm./s, también se conoce como hipótesis alternativa bilateral. En algunas situaciones, lo que

se desea es formular una hipótesis alternativa unilateral, como en

Ho; μ = 50 cm/s Ho; μ = 50 cm/s o H1; μ < 50 cm/s H1; μ > 50 cm/s

Pero en el caso anterior, tenemos que:

Ho; μ = 50 cm/s

H1; μ≠ 50 cm/s

Supóngase que se realiza una prueba sobre una muestra de 10 especimenes, y que se

observa cual es la rapidez de combustión promedio muestral. La media muestral es un estimador

de la media verdadera de la población. Un valor de la media muestral que este próximo al valor

hipotético μ = 50 cm./s es una evidencia de que el verdadero valor de la media μ es realmente 50

cm./s; esto es, tal evidencia apoya la hipótesis nula Ho. Por otra parte, una media muestral muy

diferente de 50 cm./s constituye una evidencia que apoya la hipótesis alternativa H1. Por tanto, en

Page 201: Libro de estadistica

200

este caso, la media muestral es el estadístico de prueba.

La media muestral puede tomar muchos valores diferentes. Supóngase que si

48.5 x 51.5, entonces no se rechaza la hipótesis nula Ho; μ = 50 cm./s, y que si x < 48.5 ó

x >51.5, entonces se acepta la hipótesis alternativa H1; μ≠ 50 cm./s.

Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la región

crítica de la prueba, mientras que todos los valores que están en el intervalo 48.5 x 51.5

forman la región de aceptación. Las fronteras entre las regiones críticas y de aceptación reciben el

nombre de valores críticos. La costumbre es establecer conclusiones con respecto a la hipótesis

nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadístico de prueba cae en la región

crítica, de lo contrario, no se rechaza Ho.

Este procedimiento de decisión puede conducir a una de dos conclusiones erróneas. Por

ejemplo, es posible que el valor verdadero de la rapidez promedio de combustión del agente

propulsor sea igual a 50 cm./s. Sin embargo, para todos los especimenes bajo prueba, bien puede

observarse un valor del estadístico de prueba x que cae en la región crítica. En este caso, la

hipótesis nula Ho será rechazada en favor de la alternativa H1cuando, de hecho, Ho en realidad es

verdadera. Este tipo de conclusión equivocada se conoce como error tipo I.

El error tipo I o error α se define como el rechazo de la hipótesis nula Ho cuando ésta es

verdadera. También es conocido como α ó nivel de significancia. Si tuviéramos un nivel de

confianza del 95% entonces el nivel de significancia sería del 5%. Análogamente si se tiene un

nivel de confianza del 90% entonces el nivel de significancia sería del 10%.

Ahora supóngase que la verdadera rapidez promedio de combustión es diferente de 50

cm./s, aunque la media muestral x caiga dentro de la región de aceptación. En este caso se acepta

Ho cuando ésta es falsa. Este tipo de conclusión recibe el nombre de error tipo II.

El error tipo II ó error β se define como la aceptación de la hipótesis nula cuando ésta es falsa.

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes

que determinan si la decisión final es correcta o errónea.

Decisión Ho es verdadera Ho es falsa

Aceptar Ho No hay error Error tipo II ó β

Rechazar Ho Error tipo I ó α No hay error

Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por

lo general tiene como resultado un aumento en la probabilidad del otro.

Page 202: Libro de estadistica

201

El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I,

siempre se puede reducir al ajustar el o los valores críticos.

Un aumento en el tamaño muestral n reducirá α y β de forma simultánea. Si la hipótesis

nula es falsa, β es un máximo cuando el valor real del parámetro se aproxima al hipotético. Entre

más grande sea la distancia entre el valor real y el valor hipotético, será menor β

Pasos Para Establecer un Ensayo de Hipótesis Independientemente de la Distribución Que

se Este Tratando

Interpretar correctamente hacia que distribución muestral se ajustan los datos del

enunciado.

Interpretar correctamente los datos del enunciado diferenciando los parámetros de los

estadísticos. Así mismo se debe determinar en este punto información implícita como el tipo de

muestreo y si la población es finita o infinita.

Establecer simultáneamente el ensayo de hipótesis y el planteamiento gráfico del

problema. El ensayo de hipótesis está en función de parámetros ya que se quiere evaluar el

universo de donde proviene la muestra. En este punto se determina el tipo de ensayo (unilateral o

bilateral).

Establecer la regla de decisión. Esta se puede establecer en función del valor crítico, el

cual se obtiene dependiendo del valor de α (Error tipo I o nivel de significancia) o en función del

estadístico límite de la distribución muestral. Cada una de las hipótesis deberá ser argumentada

correctamente para tomar la decisión, la cual estará en función de la hipótesis nula o Ho.

Calcular el estadístico real, y situarlo para tomar la decisión.

Justificar la toma de decisión y concluir.

Tipos de Ensayo

Se pueden presentar tres tipos de ensayo de hipótesis que son:

Unilateral Derecho

Unilateral Izquierdo

Bilateral

Dependiendo de la evaluación que se quiera hacer se seleccionará el tipo de ensayo.

Unilateral Derecho. El investigador desea comprobar la hipótesis de un aumento en el

parámetro, en este caso el nivel de significancia se carga todo hacia el lado derecho, para definir

las regiones de aceptación y de rechazo.

Ensayo de hipótesis:

Page 203: Libro de estadistica

202

Ho; Parámetro ≤ x

H1; Parámetro > x

Unilateral Izquierdo: El investigador desea comprobar la hipótesis de una disminución

en el parámetro, en este caso el nivel de significancia se carga todo hacia el lado izquierdo, para

definir las regiones de aceptación y de rechazo.

Ensayo de hipótesis:

Ho; Parámetro ≥ x

H1; Parámetro < x

Bilateral: El investigador desea comprobar la hipótesis de un cambio en el parámetro. El

nivel de significancia se divide en dos y existen dos regiones de rechazo.

Ensayo de hipótesis:

Ho; Parámetro = x

H1; Parámetro ≠ x

Para realizar los ejemplos y ejercicios de ensayo de hipótesis se recomienda seguir los

pasos mencionados anteriormente. Los ejemplos siguientes se solucionarán por los pasos

recomendados, teniéndose una variedad de problemas en donde se incluirán a todas las

distribuciones muéstrales que se han visto hasta aquí.

Page 204: Libro de estadistica

203

Prueba de Hipótesis Sobre la Media de Una Distribución Normal, Con Varianza Conocida

Ejemplos:

1. Una muestra aleatoria de 100 muertes por causas naturales, registradas en Carabobo el año

pasado muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de

8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice un

nivel de significancia de 0.05.

Solución:

Se trata de una distribución muestral de medias con desviación estándar conocida.

Datos:

μ =70 años ; σ = 8.9 años ; x = 71.8 años ; n = 100 ; α = 0.05

Ensayo de hipótesis

Ho; μ = 70 años.

H1; μ > 70 años.

Regla de decisión:

Si zR ≤ 1.645 no se rechaza Ho.

Si zR > 1.645 se rechaza Ho.

02.2

1009.8

708.71

n

xZ R

R

Justificación y decisión.

Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la vida

media hoy en día es mayor que 70 años.

Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en

este caso la media de la muestra. De la formula de la distribución muestral de medias se despeja

la media de la muestra:

n

xZ L

L

46.71100

)9.8)(645.1(70

n

Zx L

L

Page 205: Libro de estadistica

204

Regla de decisión:

Si R

x 71.46 No se rechaza Ho

Si R

x > 71.46 Se rechaza Ho

Como la media de la muestral es de 71.8 años y es mayor al valor de la media muestral límite de

71.46 por lo tanto se rechaza Ho y se llega a la misma conclusión.

2. Una empresa eléctrica dedicada a la fabricación de Bombillos, afirma que su producto tiene

una duración que se distribuye de forma aproximadamente normal con una media de 800 horas y

una desviación estándar de 40 horas. Si una muestra aleatoria de 30 Bombillos tiene una duración

promedio de 788 horas, ¿muestran los datos suficiente evidencia para decir que la duración media

ha cambiado? Utilice un nivel de significancia del 0.04.

Solución:

Se trata de una distribución muestral de medias con desviación estándar conocida.

Datos:

μ =800 horas ; σ = 40 horas ; x = 788 horas ; n = 30 ; α = 0.04

Ensayo de hipótesis

Ho; μ = 800 horas

H1; μ ≠ 800 horas

Regla de Decisión:

Si –2.052 ≤ ZR ≤ 2.052 No se rechaza Ho

Si ZR < -2.052 ó si ZR > 2.052 Se rechaza Ho

Page 206: Libro de estadistica

205

643.1

3040

800788

n

xZ R

R

Justificación y decisión:

Como –2.052 ≤ -1.643 ≤ 2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de

significancia del 0.04 que la duración media de los bombillos no ha cambiado.

Solución por el otro método:

98.81402.78530

)40)(052.2(800 y

n

Zx L

Regla de decisión:

Si 785.02 R

x 814.98 No se rechaza Ho

Si R

x < 785.02 ó R

x > 814.98 se rechaza Ho

Como la R

x = 788 horas, entonces no se rechaza Ho y se concluye que la duración media de los

bombillos no ha cambiado.

3. Una empresa esta estudiando la posibilidad de implementar un nuevo sistema de publicidad,

con la finalidad de incrementar las ventas promedio por cliente, con el sistema actual, las ventas

promedio se sitúan en 200 Bs. El nuevo sistema supone unos costos adicionales que se justifican

si las ventas aumentan, para ello toma una muestra aleatoria de 100 clientes, una vez concluido el

periodo de prueba del nuevo sistema. Se sabe que la desviación típica de las ventas por cliente es

de 40 Bs. Y la media de la muestra fue 210 Bs. ¿Adoptaría usted el nuevo sistema, use un nivel

de significación de 5%?

Solución:

Se trata de una distribución muestral de medias con desviación estándar conocida.

Datos:

μ =200 Bs. ; σ = 40 Bs. ; x =210 Bs. ; n = 100. ; α = 0.05

Ensayo de hipótesis

Ho; μ = 200 Bs.

H1; μ > 200 Bs.

Page 207: Libro de estadistica

206

Regla de decisión:

Si zR ≤ 1.645 no se rechaza Ho.

Si zR > 1.645 se rechaza Ho.

5.2

10040

200210

n

xZ R

R

Justificación y decisión.

Como 2.5 >1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la ventas

promedio por cliente en la actualidad es mayor que 200 Bs.

Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en

este caso la media de la muestra. De la formula de la distribución muestral de medias se despeja

la media de la muestra:

n

xZ L

L

58,206100

)40)(645.1(200

n

Zx L

L

Regla de decisión:

Si R

x 206,58 No se rechaza Ho

Si R

x > 206,58 Se rechaza Ho

Como la media de la muestral es de 210 Bs y es mayor al valor de la media muestral límite de

206,58 por lo tanto se rechaza Ho y se llega a la misma conclusión.

Page 208: Libro de estadistica

207

4. Una empresa productora de neumáticos, afirma que su producto dura en promedio 20.000 Km.

o más. Un potencial distribuidor del producto quiere verificar tal afirmación, para lo cual somete

a prueba 100 neumáticos. La duración promedio de la muestra fue de 19.320 Km. Se conoce por

experiencia pasada que la desviación típica de la duración de los neumáticos producidos por la

empresa es de 2.000 Km. Contraste la hipótesis de que la duración promedio es de 20.000 Km. O

más, use un nivel de significación del 2,5%

Solución:

Se trata de una distribución muestral de medias con desviación estándar conocida.

Datos:

μ =20.000 Km. ; σ = 2.000 Km. ; x = 19.320 Km. ; n = 100 ; α = 0.025

Ensayo de hipótesis

Ho; μ ≥ 20.000 Km.

H1; μ < 20.000 Km.

Regla de decisión:

Si ZR -1. 96 No se rechaza Ho

Si ZR < -1. 96 Se rechaza Ho

4,3

100000.2

000.20320.19

n

xZ R

R

Justificación y decisión:

Como –1,96 > -3,4, por lo tanto se rechaza Ho y se concluye con un nivel de significancia del

0.025 que el número promedio de Kilómetros que duran los neumáticos es significativamente

menor que 20.000.

Prueba de Hipótesis Sobre la Media de Una Distribución Normal, Varianza Desconocida

Con Muestras Grandes

Ciertamente sospechamos que las pruebas sobre una media poblacional µ con 2

desconocida, debe incluir el uso de la distribución t de Student. La estructura de la prueba es

idéntica a la del caso de σ conocida, con la excepción de que el valor σ en la estadística de

prueba se reemplaza por la estimación de S calculada y la distribución normal estándar se utiliza

ya que el tamaño de la muestra es grande, recordando el teorema central del limite n > 30.

Page 209: Libro de estadistica

208

1. Un fabricante de productos de limpieza desea conocer el verdadero peso de uno de sus

productos, para ello selecciona una muestra aleatoria de 64 bolsas de detergente industrial que

pesan, en promedio 5.23 kilos con una desviación estándar de 0.24 kilos. Por especificaciones del

producto las bolsas de detergente industrial que fabrican en ese tamaño deben pesar 5.5 kilos,

puede afirmar el fabricante que el peso de su producto es correcto, use un nivel de significancia

de 0.05.

Solución:

Se trata de una distribución muestral de medias con desviación estándar desconocida, pero como

el tamaño de muestra es mayor a 30 se puede tomar la desviación muestral como un estimador

puntual para la poblacional.

Datos:

μ = 5.5 kilos ; s = 0.24 kilos ; x = 5.23 kilos ; n = 64 ; α = 0.05

Ensayo de hipótesis

Ho; μ = 5.5 kilos

H1; μ < 5.5 kilos

Regla de decisión:

Si ZR ≥-1.645 No se rechaza Ho

Si ZR < -1.645 Se rechaza Ho

9

6424.0

5.523.5

n

xZ R

R

Justificación y decisión:

Como –9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del 0.05

que las bolsas de detergente industrial pesan en promedio menos de 5.5 kilos.

Solución por el otro método

45.564

)24.0)(645.1(5.5

n

Zx L

L

:

Page 210: Libro de estadistica

209

Regla de decisión:

Si R

x 5.45 No se Rechaza Ho

Si R

x < 5.45 Se rechaza Ho

Como la R

x = 5.23 y este valor es menor que 5.45 por lo tanto se rechaza Ho.

Prueba de Hipótesis Sobre la Media de Una Distribución Normal, Varianza Desconocida

Muestras Pequeñas

Las pruebas sobre una media poblacional µ con 2 desconocida con muestras pequeñas,

debe incluir el uso de la distribución t de Student. La estructura de la prueba es idéntica a la del

caso de σ conocida, con la excepción de que el valor σ en la estadística de prueba se reemplaza

por la estimación de S calculada y la distribución normal estándar se reemplaza con una

distribución t.

Ejemplos:

1. Una empresa fabricante de equipos eléctricos, conoce la cantidad de Kilowatt-hora que

consumen sus productos anualmente. Ellos afirman que una licuadora industrial consume un

promedio de 46 kilowatt-hora al año. Si una muestra aleatoria de 12 establecimientos comerciales

que se incluye en un estudio planeado indica que las licuadoras industriales consumen un

promedio de 42 kilowatt-hora al año con una desviación estándar de11.9 kilowatt-hora, ¿esto

sugiere con un nivel de significancia de 0.05 que las licuadoras industriales consumen, en

promedio, menos de 46 kilowatt-hora anualmente? Suponga que la población de kilowatt-hora es

normal.

Solución:

Datos:

μ = 46 kilowatt-hora ; s = 11.9 kilowatt-hora ; = 42 kilowatt-hora

n = 12 ; α = 0.05

Ensayo de hipótesis

Page 211: Libro de estadistica

210

Ho; μ = 46 kilowatt-hora

H1; μ < 46 kilowatt-hora

Regla de decisión:

Si tR -1.796 No se rechaza Ho

Si tR < -1.796 Se rechaza Ho

Cálculos:

16.1

129.11

4642

ns

Xt R

R

Justificación y decisión:

Como –1.16 > -1.796, por lo tanto no se rechaza Ho y se concluye con un nivel de significancia

del 0.05 que el número promedio de kilowatt-hora que consumen al año las licuadoras no es

significativamente menor que 46.

Solución por el otro método:

83.3912

)9.11)(796.1(46

n

stX L

L

Regla de decisión:

Si Rx 39.83 No se Rechaza Ho

Si Rx 39.83 Se rechaza Ho

Como la Rx 42 y este valor no es menor que 39.83 por lo tanto no se rechaza Ho.

Se puede aprovechar este ejemplo para calcular el valor de P, como el valor de t calculada es de –

1.16, se busca en la tabla y se ve que el área a la izquierda de este valor es de 0.135 con 11 grados

Page 212: Libro de estadistica

211

de libertad, por lo tanto no se rechaza Ho., ya que sería un valor alto para un nivel de

significancia.

3. Un artículo publicado en una revista especializada en materiales, describe los resultados

de pruebas de resistencia a la adhesión de 22 especimenes de aleación U-700. La carga

para la que cada espécimen falla es la siguiente en MPa:

19.8 18.5 17.6 16.7 15.8

15.4 14.1 13.6 11.9 11.4

11.4 8.8 7.5 15.4 15.4

19.5 14.9 12.7 11.9 11.4

10.1 7.9

¿Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supóngase que la carga

donde se presenta la falla tiene una distribución normal, y utilícese α = 0.05. Calcule el valor de

P.

Solución:

Datos:

µ = 10 ; s = 3.55 ; x 13.71 ; n = 22 , α = 0.05

Ensayo de hipótesis

Ho; µ = 10

H1; µ > 10

Regla de decisión:

Si tR 1.721 no se rechaza Ho.

Si tR> 1.721 se rechaza Ho.

Page 213: Libro de estadistica

212

Cálculos:

90.4

2255.3

1071.13

ns

Xt R

R

Justificación y decisión.

Como 4.90 >1.721 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la carga

de falla promedio es mayor que 10Mpa.

Existe otra manera de resolver este ejercicio, tomando la decisión en base al estadístico real, en

este caso la media de la muestra. De la fórmula de la distribución muestral de medias se despeja

la media de la muestra:

30.1122

)55.3)(721.1(10;

n

stx

ns

xt L

LL

L

Regla de decisión:

Si Rx 11.30 No se rechaza Ho

Si Rx 11.30 Se rechaza Ho

Como la media de la muestral es de 13.71 MPa y es mayor al valor de la media muestral límite de

11.30 por lo tanto se rechaza Ho y se llega a la misma conclusión.

Para calcular el valor de P se va a la tabla y se busca en 21 grados de libertad el valor de t = 4.90.

Se observa que el valor mayor de t que se encuentra en la tabla con 21 grados de libertad es de

3.819 el cual le corresponde un área a la derecha de 0.0005, por lo que para el valor de 4.90 el

valor de P es prácticamente cero, y esto apoya la decisión de rechazar Ho.

3. Los pesos en libras de una muestra aleatoria de bebés de seis meses son: 14.6, 12.5, 15.3, 16.1,

14.4, 12.9, 13.7 y 14.9. Haga una prueba con nivel de 5% de significancia para determinar si el

peso promedio de todos los bebés de seis meses es distinto a 14 libras, suponga que sus pesos se

distribuyen normalmente y calcule el valor de P.

Solución:

Datos:

Page 214: Libro de estadistica

213

µ = 14 libras ; s = 1.21 libras ; x 14.3 libras ; n = 8 ; α = 0.05

Ensayo de hipótesis

Ho; µ = 14 libras

H1; µ ≠ 14 libras

Regla de Decisión:

Si –2.365 tR 2.365 No se rechaza Ho

Si tR < -2.365 ó si tR > 2.365 Se rechaza Ho

7012.0

821.1

143.14

ns

Xt R

R

Justificación y decisión:

Como –2.365 0.7012 2.365 por lo tanto, no se rechaza Ho y se concluye con un nivel de

significancia del 0.05 que el peso promedio de todos los bebés de seis meses es de 14 libras.

Solución por el otro método: 01.1598.128

)21.1)(365.2(10 y

n

stx L

L

Regla de decisión:

Si 12.98 Rx 15.01 No se rechaza Ho

Si Rx 12.98 ó Rx 15.01 se rechaza Ho

Como la x 14.3 libras, entonces no se rechaza Ho.

Para calcular el valor de P se busca en la tabla el valor de 0.7012 con 7 grados de libertad. Se

observa que este valor no se encuentra pero se puede interpolar entre los valores de 0.549 y 0.896

con áreas de 0.30 y 0.20 respectivamente. Interpolando linealmente se obtiene el valor de 0.2561.

Page 215: Libro de estadistica

214

Prueba de Hipótesis Sobre la Media de Una Distribución Normal, Varianza Desconocida

(Proporciones)

Ciertamente sospechamos que las pruebas sobre una media poblacional µ con 2

desconocida, debe incluir el uso de la distribución t de Student. La estructura de la prueba es

idéntica a la del caso de σ conocida, con la excepción de que el valor σ en la estadística de

prueba se reemplaza por la estimación de s calculada y la distribución normal estándar se

reemplaza con una distribución t.

1. Una empresa comercializadora de equipos de refrigeración en el oriente del país afirma que en

la actualidad se instalan Sistemas de Aire Acondicionado en 70% de todas las casas que se

construyen en la ciudad de Barcelona. ¿Estaría de acuerdo con esta afirmación si en una

investigación realizada en cuanto a casas nuevas fabricadas en esta ciudad muestra que 8 de 15

tienen instalado Aire Acondicionado? Utilice un nivel de significancia de 0.10.

Solución:

Se trata de una distribución muestral de proporciones.

Datos:

P = 0.70 ; p = 8/15 = 0.5333 ; n = 15 ; α = 0.10

Ensayo de hipótesis

Ho; P = 0.70

H1; P ≠ 0.70

Page 216: Libro de estadistica

215

Regla de Decisión:

Si –1.645 ≤ ZR ≤ 1.645 No se rechaza Ho

Si ZR < -1.645 ó si ZR > 1.645 Se rechaza Ho

41.1

15

)30.0)(70.0(

70.0533.0

n

Pq

PpZR

Justificación y decisión:

Como –1.645 ≤ -1.41 ≤ 1.645 No se rechaza Ho y se concluye con un nivel de significancia de

0.10 que la afirmación del constructor es cierta.

Solución por el otro método:

894.0505.015

)30.0)(70.0(645.170.0 y

n

Pqzpp LL

Regla de decisión:

Si 0.505 ≤ pR ≤ 0.894 No se rechaza Ho

Si pR < 0.505 ó si ZR > 0.894 Se rechaza Ho

Como el valor del estadístico real es de 0.533 por lo tanto no se rechaza Ho y se llega a la misma

conclusión.

2. En una fábrica de semiconductores se producen controladores que se emplean en aplicaciones

de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en

uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre

esta característica del proceso de fabricación con este nivel de calidad, utilizando α = 0.05. El

fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que

cuatro de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad del proceso?

Solución:

Se trata de una distribución muestral de proporciones.

Datos:

P = 0.05 ; p = 4/200 = 0.02 ; n = 200 ; α = 0.05

Ensayo de hipótesis

Ho; P = 0.05

H1; P < 0.05

Page 217: Libro de estadistica

216

Regla de decisión:

Si ZR ≥-1.645 No se rechaza Ho

Si ZR < -1.645 Se rechaza Ho

946.1

200

)95.0)(05.0(

05.002.0

n

Pq

PpZR

Justificación y decisión:

Puesto que –1.946 < -1.645, se rechaza Ho y se concluye con un nivel de significancia del 0.05

que la fracción de artículos defectuosos es menor que 0.05.

Prueba de Hipótesis Sobre Diferencia de Medias de Una Distribución Normal, Varianza

Conocida

1. En una fabrica de pinturas acrílicas el departamento de investigación y desarrollo de productos

está interesado en reducir el tiempo de secado de una pintura de acabado superficial. Se prueban

dos fórmulas de pintura; la fórmula 1 tiene el contenido químico estándar, y la fórmula 2 tiene un

nuevo ingrediente secante que debe reducir el tiempo de secado. De la experiencia se sabe que la

desviación estándar del tiempo de secado es ocho minutos, y esta variabilidad inherente no debe

verse afectada por la adición del nuevo ingrediente. Se pintan diez Piezas con la fórmula 1, y

otros diez con la fórmula 2. Los dos tiempos promedio de secado muéstrales son 121 min. y 112

min. Respectivamente. ¿A qué conclusiones puede llegar el desarrollador del producto sobre la

eficacia del nuevo ingrediente, utilizando α = 0.05?

Solución:

Se trata de una distribución muestral de diferencia de medias con desviación estándar conocida.

Datos:

σ1 = σ2 = 8;

mm112x;mm121x 21

n1 = n2 = 10

α = 0.05

Page 218: Libro de estadistica

217

Ensayo de hipótesis

Ho; μ1 - μ2 = 0

H1; μ1 - μ2 > 0

Se desea rechazar Ho si el nuevo ingrediente disminuye el tiempo promedio de secado, por eso se

pone la diferencia mayor a cero o sea positiva para poder probar que μ2 es menor que μ1.

Regla de decisión:

Si zR ≤ 1.645 no se rechaza Ho.

Si zR > 1.645 se rechaza Ho.

52.2

10

8

10

8

0)112121()()(

22

2

2

2

1

2

1

2121

nn

xxZR

Justificación y decisión:

Puesto que 2.52 >1.645, se rechaza Ho, y se concluye con un nivel de significancia de 0.05 que la

adición del nuevo ingrediente a la pintura si disminuye de manera significativa el tiempo

promedio de secado.

Solución por el otro método

88.510

64

10

64645.10)()(

2

2

1

1

2

12121

nnzxx L

:

Regla de decisión:

Si R

xx )(21

5.88 No se rechaza Ho

SiR

xx )(21

> 5.88 Se rechaza Ho

Puesto que R

xx )(21

= 121-112 = 9 y este número es mayor a 5.88 por lo tanto se rechaza Ho.

Page 219: Libro de estadistica

218

2. En una empresa que se dedica a la fabricación de refrescos, utilizan dos máquinas para llenar

botellas de plástico con un volumen neto de 16.0 onzas. Las distribuciones de los volúmenes de

llenado pueden suponerse normales, con desviaciones estándar σ1= 0.020 y σ2 = 0.025 onzas. Un

miembro del grupo de control de calidad sospecha que el volumen neto de llenado de ambas

máquinas es el mismo, sin importar si éste es o no de 16 onzas. De cada máquina se toma una

muestra aleatoria de 10 botellas. ¿Se encuentra la persona en lo correcto? Utilice α = 0.05

MAQUINA 1 MAQUINA 2

16.03 16.01 16.02 16.03

16.04 15.96 15.97 16.04

16.05 15.98 15.96 16.02

16.05 16.02 16.01 16.01

16.02 15.99 15.99 16.00

Solución:

Se trata de una distribución muestral de diferencia de medias con desviación estándar conocida.

Datos:

σ1 = 0.020 σ2 = 0.025

015.161 x Este dato se obtuvo calculando la media de los datos en la máquina 1.

005.162 x Este dato se obtuvo calculando la media de los datos en la máquina 2.

n1 = n2 = 10

α = 0.05

Ensayo de hipótesis

Ho; μ1 - μ2 = 0

H1; μ1 - μ2 ≠ 0 Si se cae en Ho se podrá probar que el volumen de llenado es el mismo en las dos

máquinas.

Regla de Decisión:

Si –1.96 ≤ ZR ≤ 1.96 No se rechaza Ho

Si ZR < -1.96 ó si ZR > 1.96 Se rechaza Ho

Page 220: Libro de estadistica

219

987.0

10

025.0

10

020.0

0)005.16015.16()()(

22

2

2

2

1

2

1

2121

nn

xxZR

Justificación y decisión:

Como –1.96 0.987 1.96 entonces no se rechaza Ho y se concluye con un nivel de

significancia de 0.05 que las dos máquinas tienen en promedio la misma cantidad de llenado.

Solución por el otro método:

019.0019.010

025.0

10

020.096.10)()(

22

2

2

1

1

2

12121 y

nnzxx L

Regla de decisión:

Si –0-019R

xx )(21

0.019 No se rechaza Ho

Si R

xx )(21

< -0.019 ó R

xx )(21

> 0.019 Se rechaza Ho

Como R

xx )(21

= 16.015 – 16.005 = 0.01, entonces cae en la región de aceptación y no se

rechaza Ho.

3. Existen dos tipos de material apropiados para ser usado por un fabricante de componentes

electrónicos. La tensión de ruptura de ese material es un parámetro importante. Se sabe que σ1 =

σ2 = 1.0 psi. De una muestra aleatoria de tamaño 10 y 12 para cada material respectivamente, se

tiene una media de 162.5 para el material 1 y de 155 para el material 2. La compañía no adoptará

el material 1 a menos que la tensión de ruptura de éste exceda a la del material 2 al menos por 10

psi. Con base a la información contenida en la muestra, ¿la compañía deberá utilizar el material

1? Utilice α = 0.05 para llegar a una decisión.

Solución:

Se trata de una distribución muestral de diferencia de medias con desviación estándar conocida.

Datos:

σ1 = σ2 = 1.0 psi

5.1621 x 1552 x n1= 10 n2= 12 α= 0.05

Page 221: Libro de estadistica

220

Ensayo de hipótesis

Ho; μ1 - μ2 = 10

H1; μ1 - μ2 > 10 Se desea rechazar Ho si la media del material 1 supera a la media del material 2

en por lo menos 10 psi.

Regla de decisión:

Si zR ≤ 1.645 no se rechaza Ho.

Si zR > 1.645 se rechaza Ho.

83.5

12

1

10

1

10)1555.162()()(

22

2

2

2

1

2

1

2121

nn

xxZR

Justificación y decisión:

No existe evidencia suficiente para apoyar el uso del material 1 ya que

–5.83 1.645, por lo tanto no se rechaza Ho.

Solución por el otro método:

70.1012

1

10

1645.110)()(

22

2

2

1

1

2

12121

nnzxx L

Regla de decisión:

Si R

xx )(21

≤10.70 No se rechaza Ho

SiR

xx )(21

> 10.70 Se rechaza Ho

Puesto que R

xx )(21

= 162.5-155 = 7.5 y este número es no es mayor a 10.7 por lo tanto no se

rechaza Ho.

Page 222: Libro de estadistica

221

Prueba de Hipótesis Sobre Diferencia de Proporciones

1. En la fabricación de lentes intraoculares, los cuales se utilizan después de una cirugía de

cataratas, el proceso de pulido es extremadamente importante, por ello se evalúan dos tipos

diferentes de soluciones para pulir. Se pulen 300 lentes con la primera solución y, de éstos, 253

no presentaron defectos inducidos por el pulido. Después se pulen otros 300 lentes con la

segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna razón para creer que

las dos soluciones para pulir son diferentes? Utilice α = 0.01

Solución:

Se trata de una distribución muestral de diferencia de proporciones.

Datos:

p1= 253/300 = 0.8433 ; p2 = 196/300 = 0.6533 ; n1 = n2 = 300

Ensayo de hipótesis:

Ho; P1-P2 = 0

H1; P1-P2 ≠0

Regla de Decisión:

Si –2.575 ZR 2.575 No se rechaza Ho

Si ZR < -2.575 ó si ZR > 2.575 Se rechaza Ho

2

22

1

11

2121 )()(

n

qP

n

qP

PPppZR

En esta fórmula se puede observar que en el denominador se tienen a las proporciones

poblacionales o sea los parámetros, los cuales no se conocen, por lo que en el ensayo de hipótesis

la fórmula para poder calcular la ZR cambia, estimando el parámetro común P de la siguiente

forma:

21

2211

21

21

nn

pnpnPbieno

nn

xxp

Entonces la fórmula de ZR quedaría de la siguiente manera:

Page 223: Libro de estadistica

222

21

2121

11

)()(

nnPq

PPppZR

Se calculará el valor de P:

7483.0300300

196253

21

21

nn

xxp

36.5

300

1

300

1)2517.0)(7483.0(

0)6533.08433.0(

11

)()(

21

2121

nnPq

PPppZR

Justificación y decisión:

Puesto que 5.36 > 2.575, se rechaza la hipótesis nula y se concluye con un nivel de significancia

de 0.01 que los dos fluidos para pulir son diferentes.

2. Se Realizara una consulta entre los residentes de una ciudad y los poblados aledaños con la

finalidad de poder determinar si se debe construir una planta química. La construcción estará

dentro de los límites de la ciudad y por esta razón muchos votantes del distrito consideran que la

propuesta ganara debido a la gran proporción de votantes que favorecen la construcción. Para

determinar si hay una diferencia significativa en la proporción de votantes de la ciudad y votantes

de los pueblos aledaños que apoyan la propuesta, se realiza una encuesta. Si 120 de 200 votantes

de la ciudad favorecen la propuesta y 240 de 500 residentes del distrito también lo hacen, ¿estaría

de acuerdo en que la proporción de votantes de la ciudad que favorecen la propuesta es más alta

que la proporción de votantes del distrito? Utilice un nivel de significancia de 0.025.

Solución:

Se trata de una distribución muestral de diferencia de proporciones.

Datos:

p1 = 120/200 = 0.60 ; p2 = 240/500 = 0.48 ; n1 = 200 ; n2 = 500

Ensayo de hipótesis:

Ho; P1-P2 = 0

H1; P1-P2 > 0

Page 224: Libro de estadistica

223

Regla de decisión:

Si zR 1.96 no se rechaza Ho.

Si zR> 1.96 se rechaza Ho.

Cálculos:

Se calculará el valor de P:

51.0500200

240120

21

21

nn

xxp

9.2

500

1

200

1)49.0)(51.0(

0)48.060.0(

11

)()(

21

2121

nnPq

PPppZ R

Justificación y decisión:

Puesto que 2.9 >1.96, se rechaza la hipótesis nula y se concluye con un nivel de significancia de

0.025 que la proporción de votantes de la ciudad a favor de la propuesta es más alta que la

proporción de votantes del distrito.

Prueba de Hipótesis sobre Varianzas

1. Las puntuaciones en un test de razonamiento abstracto siguen una distribución Normal de

media 35 y varianza 60. Para evaluar un programa de mejora de las capacidades intelectuales, a

101 individuos que están realizando este programa se les pasa el test, obteniéndose una media de

50 puntos y una varianza de 80 ¿Puede asegurarse, a un nivel de confianza del 90%, que el

programa incrementa las diferencias individuales en esta variable?

Solución:

H0 σ2 = 60

H1 σ2 > 60

El estadístico de contraste es:

2

2S)1n(

Sustituyendo en el estadístico obtenemos:

60

80)1100(

Como el contraste es unilateral buscamos en las tablas de la Ji-cuadrado, con 100 grados

de libertad, el valor de la variable que deja por debajo de sí una probabilidad de 0,9, este valor es

118,5.

El valor del estadístico es mayor que el valor crítico, por consiguiente se rechaza la

hipótesis nula. En efecto, la varianza es significativamente mayor lo que indica que ha aumentado

la dispersión de las puntuaciones lo cual significa que se han incrementado las diferencias entre

Page 225: Libro de estadistica

224

los individuos.

2. Los rodamientos esféricos que fabrica una maquina deben de tener un diámetro Uniforme para

ser aptos para su uso. El responsable de la maquina asegura que la varianza es 2 =

0,025.Medidos 50 rodamientos se obtuvo una varianza muestral 2S = 0,0272.¿Es compatible este

resultado con la afirmación previa?

Solución:

Planteamos un contraste de hipótesis:

H0 σ2 = 0,025

H1 σ2 > 0,025

Pues una varianza σ2 inferior a 0,025 no debe ser objeto de nuestra preocupación, ya que supone

menor dispersión y, por tanto mayor uniformidad de la variable diámetro de rodamientos.

Apoyándonos en la distribución χ2 con 49 grados de libertad dada por:

2

2S)1n(

Obtenemos para nuestros datos: 025,0

0272,0)49(

Teniendo en cuenta que, para 49 grados de libertad, 33,662

95,0,49

La desigualdad 54,4 menor que 66,33. Conduce a aceptar la hipótesis nula.

3. El ciclo medio de vida útil de una muestra aleatoria de 10 Bombillos es de 4 000 horas, con

una desviación estándar de 200 hr. Se supone que, en general, el ciclo de vida útil de los

bombillos tiene una distribución normal. Supongamos que antes de que se recolectara la muestra

se estableció la hipótesis de que la desviación estándar de la población no es mayor de σ = 150.

Con base en los resultados muéstrales, esta hipótesis se prueba al nivel de significancia de 1 % de

la siguiente manera:

Solución:

H0 σ2 = 22500

H1 σ2 > 22500

El estadístico de contraste es:

2

2S)1n(

Sustituyendo en el estadístico obtenemos:

0,1622500

40000)110(

Como el contraste es unilateral buscamos en las tablas de la Ji-cuadrado, con 9 grados de

libertad, el valor de la variable que deja por debajo de sí una probabilidad de 0,99, este valor es

21,67. Dado que el estadístico de prueba calculado de 16.0 no excede el valor crítico de 21.67 en

esta prueba de cola superior, la hipótesis nula de que σ≤ azarse al nivel de

significancia de 1%.

Page 226: Libro de estadistica

225

Prueba de Hipótesis para el cociente de Varianzas

Si de dos poblaciones con distribución normal se seleccionan dos muestras aleatorias

independientes de tamaños n1 y n2, se puede comparar la homogeneidad o variabilidad de dichas

poblaciones a través de una prueba de hipótesis para el cociente de varianzas.

Cuando se planteen las hipótesis debe quedar en el numerador la población cuya muestra

tenga mayor varianza. Es decir que la población 1 será la que tenga mayor varianza muestral.

Se puede plantear uno de los siguientes tres tipos de hipótesis:

- Prueba de hipótesis bilateral

H0 : 2

2

2

1 ó H0 : 12

2

2

1

H1 : 2

2

2

1 ó H1 : 12

2

2

1

- Prueba de hipótesis unilateral derecha

H0 : 2

2

2

1 ó H0 : 12

2

2

1

H1 : 2

2

2

1 ó H1 : 12

2

2

1

- Prueba de hipótesis unilateral izquierda

H0 : 2

2

2

1 ó H0 : 12

2

2

1

H1 : 2

2

2

1 ó H1 : 12

2

2

1

El estadístico de trabajo esta representado por la expresión:

)1n,1n(FS)1n(n

S)1n(nT 212

1

2

212

2

2

2

121

Regla de Decisión

Si se ha planteado la hipótesis alternativa como:

H1 : 2

2

2

1 ó H1 : 12

2

2

1 se tiene una prueba de hipótesis bilateral, por lo tanto, el nivel de

significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la

distribución. 2

Z y 2

1Z

pertenecen a una distribución F con (n1 -1) grado de libertad en

el numerador y (n2-1) grado de libertad en el denominador. Si el valor del estadístico de trabajo

Page 227: Libro de estadistica

226

(T) está entre 2

Z y 2

1Z

no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual

implica aceptar H1. Es decir, si 2

Z < T < 2

1Z

no se rechaza H0.

- Si se ha planteado la hipótesis alternativa como:

H1 : 2

2

2

1 ó H1 : 12

2

2

1 , se tiene una prueba de hipótesis unilateral derecha, quedando el

nivel de significancia ( ) en la parte superior de la distribución. Z1- a pertenece a una distribución

F con (n 1 -1) grado de libertad en el numerador y (n 2 -1) grado de libertad en el denominador.

Si el valor de la estadística de trabajo (T) es menor que Z1- a no se rechaza la hipótesis nula, en

caso contrario se rechaza Ho lo cual implica aceptar H1. Es decir, si T < Z1- a no se rechaza Ho.

- Si se ha planteado la hipótesis alternativa como:

H1 : 2

2

2

1 ó H1 : 12

2

2

1 , se tiene una prueba de hipótesis unilateral izquierda, quedando el

nivel de significancia ( ) en la parte inferior de la distribución. Za pertenece a una distribución F

con (n1 -1) grado de libertad en el numerador y (n2 -1) grado de libertad en el denominador. Si el

valor de la estadística de trabajo (T) es mayor que Za no se rechaza la hipótesis nula, en caso

contrario se rechaza Ho lo cual implica aceptar H1. Es decir, si T > Za no se rechaza H0.

Ejemplo

1. Dos fuentes de materias primas están siendo consideradas. Ambas fuentes parecen tener

características similares, pero no se está seguro de su homogeneidad. Una muestra de 10 grupos

de la fuente 1 produce una varianza de 250 y una muestra de 11 grupos de la fuente 2 produce

una varianza de 195. Con base en ésta información se puede concluir que ¿la varianza de la

fuente A es significativamente mayor que la de la fuente B?. Asuma un nivel de confianza del 99

por ciento.

Solución

H 0 : 2

2

2

1

H1 : 2

2

2

1

99,01195S11n250S10n 2

22

2

11

295,1195)9(11

250)10(10

S)1n(n

S)1n(nT

2

1

2

212

2

2

2

121

Con un nivel de confianza del 99 por ciento, en la tabla de la distribución F con 9 grados

de libertad en el numerador y 10 grados de libertad en el denominador, se obtiene un valor para Z

de 4,94. Como puede observarse, el valor del estadístico de trabajo está en la zona de no rechazo

de la hipótesis nula, por lo tanto, con una confiabilidad del 99 por ciento, no se puede rechazar

Page 228: Libro de estadistica

227

que la variabilidad de las dos fuentes de materia prima es igual.

2. Se supone que el ciclo de vida de los bombillos tiene una distribución normal. Probemos la

hipótesis nula de que las muestras se obtuvieron de poblaciones con varianzas iguales, con un

nivel de significancia de 10%, mediante el uso de la distribución F.

Solución

H 0 : 2

2

2

1

H1 : 2

2

2

1

90,0162500S8n40000S10n 2

22

2

11

295,1195)9(11

250)10(10

S)1n(n

S)1n(nT

2

1

2

212

2

2

2

121

Para la prueba al nivel de significancia de 10%, el punto de 5% superior para F y el punto de 5%

inferior para F son los valores críticos.

Dado que la razón F calculada no es ni menor de 0.304 ni mayor de 3.68, se halla en la región de

aceptación de la hipótesis nula. Así, el supuesto de que las varianzas de las dos poblaciones son

iguales no puede rechazarse al nivel de significancia de 10%.

Page 229: Libro de estadistica

228

Ejercicios Propuestos de Prueba de Hipótesis

1. Suponga una variable aleatoria X para designar el peso de un pasajero de avión, que se interesa

en conocer el peso promedio de todos los pasajeros. Como hay limitaciones de tiempo y dinero

para pesarlos a todos, se toma una muestra de 36 pasajeros de la cual se obtiene una media

muestral .lbs160x Suponga además que la distribución de los pasajeros tenga una distribución

normal con desviación estándar de 30, con un nivel de significancia de 0,05. Se puede concluir

que el peso promedio de todos los pasajeros es menor que 170 lbs?

2. El vicepresidente a cargo de las ventas de una corporación afirma que los vendedores tienen un

promedio no mayor de 15 prospectos de ventas por semana y el desearía aumentar esta cifra. Se

seleccionan 36 vendedores al azar para verificar su afirmación y registrar el número de contacto

en una semana, seleccionado la forma aleatoria. De los resultados de la muestra se obtuvo una

media de 17 prospectos y una varianza de 9. ¿Contradicen los hechos la afirmación del

vicepresidente? Use α = 0.005

3. Se desea comprobar si la cantidad de dinero que un estudiante gasta en promedio semanal es mayor

que 87 Bs., seleccionando una muestra al azar de 49 estudiantes y se encuentra que la media es de 85

Bs., teniendo una desviación típica de 7,25 Bs. Con un coeficiente de confianza de 95%

4. Una operación de montaje en una fábrica requiere de un período de entrenamiento de un mes

para que un nuevo empleado alcance la máxima eficiencia. Se sugirió un nuevo método de

entrenamiento, se tomaron dos grupos de 9 empleados cada uno; uno se entrenó con el método

estándar y el otro con el nuevo y se midió el tiempo en minutos que necesito cada empleado para

mostrar el diagnóstico final. Los resultados fueron:

22,160S;26,195S;56,31Y;22,35X 2

Y

2

X . Hay suficiente evidencia para indicar una

diferencia en los promedios para los tiempos de los métodos. Utilice un nivel de confianza de

95%

5. Antonio Pacheco es propietario de un Kiosco de periódicos en el centro de Puerto Cabello. El

negocio ha mejorado hace poco y Antonio piensa que los ingresos diarios son superiores a los

500 Bs. del año pasado. Una muestra de 256 días revela una media de 520 Bs. y una desviación

típica de 80,70 Bs. Al nivel de significación del 1%. ¿Tiene razón Antonio?

6. En un estudio realizado en el año 2009 en la Universidad decía que la gente tardaba 34 horas

de promedio en aprender un nuevo programa informático. ¿Está respaldada esta información al

nivel de 10% si 35 personas emplearan una media de 40,58 horas; con una desviación típica de

19,7 horas?

Page 230: Libro de estadistica

229

7. Cuando un proceso de producción funciona correctamente produce frascos de champú con un

peso promedio de 200 gr. Una muestra aleatoria de una remesa presentó los siguientes pesos:

214; 197; 197; 206; 208; 201; 197; 203; 209. Asumiendo que la distribución de los datos es

normal, pruebe con un nivel de confianza del 95% si el proceso está funcionando correctamente.

8. Un concesionario afirma que los propietarios de sus vehículos usados pueden recorrer una

media de 10000 millas como mínimo sin necesidad de ninguna reparación importante. Con objeto

de determinar el grado de honestidad del concesionario, se eligen 100 clientes y se halla que

recorrieron una media de 9112 millas sin reparaciones, con una desviación típica de 207. Si

resulta que los coches usados de este den una media de 10000 millas como mínimo sin averías,

usted está dispuesto a comprarle su próximo coche. Si quiere estar seguro al 99% de que el

concesionario no miente, ¿cómo podría contrastar su afirmación?

9. Un laboratorio farmacéutico afirma que el antiinflamatorio fabricado por ellos elimina la

inflamación en 14 minutos en los casos corrientes. Con el objeto de comprobar estadísticamente

esta afirmación, elegimos al azar 18 pacientes con inflamaciones varias y tomamos como variable

de respuesta el tiempo transcurrido entre la administración del antiinflamatorio y el momento en

que desaparece la inflamación. Además, nos dicen que la variable tiempo transcurrido entre la

administración del antiinflamatorio y el momento en que desaparece la inflamación sigue una

distribución normal de media 14 y desviación 7. El tiempo medio de respuesta de la muestra fue

de 19 minutos. Se pide comprobar la afirmación del laboratorio a un nivel de significación de

0.05.

10. El gerente de producción de una empresa de cereales está preocupado por el proceso de

sellado de las cajas llenas. Cuando el paquete de cereal que se coloca en la caja está lleno, se

supone que éste se sella de modo que quede hermético. Basándose en la experiencia anterior, se

sabe que uno de cada diez cajas no cumplen con las normas de sellado y deben ser revisados.

Para modificar esta situación, suponga que el gerente instrumenta un sistema de sellado que se

acaba de desarrollar. Después de un período de prueba, el gerente toma una muestra de 200 cajas

que representan la producción diaria en la planta, y encuentra, mediante una inspección, que 11

de ellas deben ser vueltas a sellar. El gerente desea determinar si existe alguna evidencia de que

con el nuevo sistema de sellado, la proporción de paquetes defectuosos ha mejorado. Decida si

puede afirmarse que ha mejorado.

11. Una empresa del ramo alimenticio desea determinar si el lote de una materia prima tiene o no

una varianza poblacional mayor a 15 en su grado de endulzamiento. Se realiza un muestreo de 20

elementos y se obtiene una varianza muestral de 20.98; realizar la prueba de hipótesis con alfa =

0.05.

Page 231: Libro de estadistica

230

12. Un negocio debe pagar horas extra dada la demanda incierta de su producto, por lo cual en

promedio se pagan 50 horas extra a la semana el gerente de recursos humanos considera que

siempre se ha tenido una varianza de 25 en las horas extras demandadas. Si se toma una muestra

de 16 semanas se obtiene una varianza muestral de 28.1. Determine con alfa = 0.10 si la varianza

poblacional de las horas extras demandadas a la semana puede considerarse igual a 25.

13. Se desea estimar la precisión de un instrumento de medición. Al realizar tres mediciones con

el instrumento encontró una varianza muestral de 10.57 unidades. Suponga que lo estándar es que

la desviación de este tipo de instrumento sea de dos unidades, y se ha decidido probar si con los

resultados obtenidos de esta muestra puede refutarse la hipótesis planteada. Usando un nivel de

confianza del 95%.

14. Una empresa consultora desea determinar la variabilidad existente en la opinión pública sobre

el desempeño del Gobierno del Estado; históricamente la varianza ha sido de 2 en los puntos de

calificación que le otorga la ciudadanía al gobierno; en el último muestreo se detecto una

varianza de 3 tomando como referencia rápida 20 personas; ¿hay elementos estadísticos

suficientes para asegurar que la varianza ha AUMENTADO? Realice la prueba de hipótesis para

contestar la pregunta anterior con un alfa = 0.1. Realice:

a) Redacción de la prueba de hipótesis, indicando si debe ser prueba de una o dos colas.

b) Determine mediante el estadístico de prueba ji cuadrada si se acepta o rechaza la hipótesis nula

y cuál sería la consecuencia del resultado obtenido para la pregunta.

15. Una empresa desea concursar para ganar un contrato con el gobierno como proveedor de

concreto; uno de los requisitos es la resistencia a la compresión del concreto a los 28 días de

haberse preparado la mezcla. La empresa ganadora dice que mantiene excelentes controles de

calidad en su concreto y como tal hay una varianza muy baja en resistencias a la compresión, del

orden de 16 kgf2/cm

4; pero al hacerle en un laboratorio unas pruebas de resistencia se detecta una

varianza mas elevada de 25 kgf2/cm

4 ¿hay evidencia estadística suficiente para considerar que el

proveedor está mintiendo y en realidad la desviación estándar es DIFERENTE a 16 kgf2/cm

4?

a) Redacción de la prueba de hipótesis, indicando si debe ser prueba de una o dos colas para

responder la pregunta.

b) Determine mediante el estadístico de prueba ji cuadrada si se acepta o rechaza la hipótesis nula

y cuál sería la consecuencia del resultado obtenido para la pregunta.

Page 232: Libro de estadistica

231

DISTRIBUCIONES BIDIMENSIONALES

VARIABLES ESTADÍSTICAS BIDIMENSIONALES

En numerosas ocasiones interesa estudiar simultáneamente dos (o más) caracteres de una

población. En el caso de dos (o más) variables estudiadas conjuntamente se habla de variable

bidimensional (multidimensional); si se trata de dos caracteres cualitativos, de par de atributos.

Si de una cierta población se estudian dos caracteres simultáneamente se obtienen dos series de

datos.

Individuos A B C ……….

Carácter X x1 x2 x3 ……….

Carácter Y y1 y2 y3 ……….

El problema a estudiar consiste en averiguar si existe relación entre dos fenómenos,

representados por las variables X e Y.

La lista de pares de datos correspondientes a cada individuo de la población (repetidos o

no), es lo que llamamos variable estadística bidimensional.

Ejemplos

1. A cada uno de los reclutas de un reemplazo se les talla y pesa. Se trata de dos variables

cuantitativas.

Xi (talla en m) 1,70 1,70 1,69 1,68 ……

Yi (peso en Kg.) 67 75 70 66 ……

En este ejemplo se quiere ver o estudiar como varía el peso con la altura.

2. Entre los empleados de una empresa se ha realizado una encuesta sobre el consumo de tabaco,

que ha arrojado los siguientes resultados:

Habito

Sexo

Fumadores No Fumadores Total filas

Varones

Mujeres

49

43

64

37

113

80

Total Columnas 92 101 193

En este ejemplo se quiere ver o estudiar como varía el consumo de tabaco con el sexo.

Nota. En este tema nos limitaremos al estudio de caracteres cuantitativos discretos, puesto que si

el carácter es continúo o discreto agrupado en intervalos, se trabajará con las marcas de clase.

Page 233: Libro de estadistica

232

DISTRIBUCIONES DE FRECUENCIAS

Se disponen las frecuencias en una tabla de doble entrada donde las xi y la yj están

ordenadas en forma creciente. Recibe el nombre de tabla de frecuencias o tabla de correlación.

Si hay pares que se repiten se agrupan siendo nij la frecuencia absoluta del par (xi, yj).

Las sumas

nij = ni , frecuencia absoluta de xi. j

nij = n’j , frecuencia absoluta de yj i

Se llaman frecuencias absolutas marginales de las variables X e Y respectivamente.

nij = N=número total de pares. j y

Quedando la siguiente tabla de doble entrada:

X

Y

x1 x2 ....... xk Frecuencias absolutas

marginales de Y

y1 n11 n21 ..... nk1 n’1

y2 n12 n22 ...... nk2 n’2

...... ..... .... .... ... ....

.

yr

n1r n2r ... nkr n’r

Frecuencias absolutas

marginales de X

n1 n2 .. nk nij = N

i j

En la práctica algunas de las nij pueden ser cero. En tal caso la casilla correspondiente se

dejará en blanco.

Ejemplo 3. Dada la distribución bidimensional:

X 1 2 1 2 3 2 2 2 3 1

Y 3 5 2 3 5 4 3 5 5 3

Page 234: Libro de estadistica

233

La tabla correspondiente es:

X

Y

1 2

3

Frecuencias absolutas marginales de y

2 1 1

3 2 2 4

4 1 1

5 2 2 4

Frecuencias absolutas marginales de X 3 5 2 N=10

Al estudiar una variable bidimensional se obtienen varias distribuciones

unidimensionales, según se consideren las filas o las columnas de la tabla en estudio.

Las distribuciones unidimensionales del total de los individuos de la población, respecto a

cada una de las características reciben el nombre de distribuciones marginales.

Distribución marginal de la Y:

Y

Frecuencias absolutas marginal de Y

y1

y2

.

.

yr

n’1

n’2

.

.

n’r

Análogamente la distribución marginal de la X

Ejemplo 4. Obtener la distribución marginal de la variable X.

X Frecuencias absolutas marginal de X

1

2

3

3

5

2

Si en la tabla de correlación consideramos la primera columna y una columna intermedia,

la correspondiente a yj, se obtiene una distribución unidimensional que llamaremos distribución

Page 235: Libro de estadistica

234

condicionada de la variable X por la modalidad yj de la variable Y.

X

Frecuencias absolutas condicionadas por yj

x1

x2

.

.

xk

n1j

n2j

.

.

nkj

Análogamente se define la distribución condicionada de la variable Y por la modalidad xi de la

variable X.

Ejemplo 5.

Obtener la tabla de la distribución condicionada de la variable Y por la modalidad x2.

Y

Frecuencias absolutas condicionadas por x2

2

3

4

5

0

2

1

2

REPRESENTACIONES GRÁFICAS

Consideremos la distribución:

x1 x2 ..... xN

y1 y2 ....... yN

Los pares de valores observados (xi , yj) pueden estar repetidos y pueden ser representados

en unos ejes coordenados, tal como son mostrados a continuación.

Page 236: Libro de estadistica

235

y

( xi , yj )

x

El conjunto de puntos que resulta se llama diagrama de dispersión o nube de puntos de la

distribución bidimensional.

Cuando el número de datos es grande (se usa una tabla de doble entrada) los datos se

representan con un diagrama de dispersión reticulado de tal manera que la visión de la nube de

puntos indique realmente cómo es la distribución.

En estos casos también se suele usar un diagrama de barras sobre un sistema cartesiano de

tres dimensiones (estereogramas).

Ejemplo 6.

Hacer el diagrama de dispersión de la distribución del ejemplo 3.

.

.

.

.

.

.

.

.

.

.

0 1 2 3

PARÁMETROS ESTADISTICOS DE LA V. A. BIDIMENSIONAL

Considerando las distribuciones marginales, como son unidimensionales es posible

calcular los siguientes parámetros:

Page 237: Libro de estadistica

236

a) Medias o Medias Marginales ( X , Y )

N

nxx

ii

N

nyy

ii

Donde N = ni = n’j es el numero total de pares

Nota. En una distribución bidimensional al punto (x, y) se le llama centro de gravedad de la

distribución.

b) Varianzas )Sy S(2

yy22

xx2

Se define: Varianza marginal de la variable X

2

2

i

2

ix

2x

2 )x(N

x

N

)xx(S

Análogamente la varianza marginal de la variable Y.

2

2

i

2

iy

2y

2 )y(N

y

N

)yy(S

De ellas (extrayendo la raíz cuadrada) se obtienen las correspondientes desviaciones típicas.

c) Desviaciones típicas ( x( sx),y( sy) )

Serán las desviaciones típicas de X e Y

2

222

xx xN

xi

N

xxifi

N

xxiS

2

222

yy yN

yi

N

yyifi

N

yyiS

Ejercicio 1. Calcula las medias marginales y las varianzas de la v.e. del ejemplo 3.

Solución x = 19/10 =1,9 ; y =38/10 = 3,8 ; Sx2

= 4,1-(1,9)2

= 0,49 ; Sy2

= 15,6 - 14,44 = 1.16.

d) Covarianza (

xy (Sxy)

Page 238: Libro de estadistica

237

Para las variables estadísticas bidimensionales se define la “covarianza ’’ como la media

aritmética de los productos de las desviaciones respecto de la media de cada una de las variables

componentes. Es decir:

yx

N

yixi

N

yyi)xxi(S xyxy

Se demuestra que:

yxMN

yxS xy

ii

xy

Propiedad que facilita el cálculo de la covarianza

Ejercicio 2. Calcular la covarianza de la distribución del ejemplo 3.

Solución: Sxy = 2 6 12 8 20 30

10

- [(1,9) · (3,89)] = 0,58.

REGRESIÓN LINEAL

Al considerar los dos caracteres de una variable bidimensional puede ocurrir.

- Que haya una dependencia funcional entre ellos, de tal manera que a cada valor le corresponda

un único valor del otro. Ejemplo: la temperatura a la que calentamos una barra de hierro y la

longitud alcanzada.

-Que haya una dependencia estadística o correlativa, de tal manera que los valores sigan unas

pautas similares. Por ejemplo el número de horas de estudio y las notas obtenidas.

- Que se de una independencia entre los caracteres. Por ejemplo la estatura y las calificaciones en

Matemáticas.

El estudio de la relación entre dos caracteres de una variable estadística bidimensional es

el objeto de la regresión lineal.

La nube de puntos de una distribución bidimensional nos da una primera idea de la

relación existente entre los datos de la misma. Cuando la nube de puntos del diagrama de

Page 239: Libro de estadistica

238

dispersión permita deducir algún tipo de dependencia entre las dos variables X, Y,

concentrándose los puntos alrededor de una cierta línea (línea de regresión) se plantean dos

cuestiones:

a) Definir la línea.

b) Medir el nivel de aproximación de dicha línea.

Sí la línea es una recta, el problema es un caso típico de regresión lineal.

Rectas de regresión.

Se llama recta de regresión a aquella que mejor se ajusta a la nube de puntos.

El procedimiento más usado, para hallar dicha recta, es el los mínimos cuadrados.

Se calcula la recta:

y = ax + b, de tal manera que: S = [yi - (a xi + b )2

sea mínima

.

. . .

. .

. .

. .

. .

El cálculo de a y b incluye conocimientos que no se dan en este nivel (derivación

parcial...), por lo que sólo daremos el resultado:

Se verifica:

x2

xy

S

Sa ; x

S

Syb

x2

xy Luego se puede escribir:

xS

Syx

S

Sy

x2

xy

x2

xy ; o lo que es lo mismo: )xx(

S

Syy

x2

xy

Esta es la ecuación de la recta de regresión de Y sobre X. Sirve para hacer estimaciones

o predicciones de los valores de Y conocidos los de X.

Análogamente la recta de regresión de X sobre Y tiene por ecuación: )yy(S

Sxx

y2

xy en

definitiva se puede escribir lo siguiente:

Page 240: Libro de estadistica

239

Y Y xy

x2

X X ( Variable Y en función de X)

X X xy

y2

Y Y ( Variable X en función de Y)

A los factores y

2

xy

xyx

2

xy

yxS

Smy

S

Sm se les llama los coeficientes de regresión.

Ejercicio 3. Hallar las rectas de regresión para la distribución del ejemplo 3.

Solución: recta de regresión de Y sobre X y – 3,8 = 1,18 (x- 1,9)

recta de regresión de X sobre Y x – 1,9 = 0,5 ( y – 3,8 ).

Nota. Veamos algunas propiedades del coeficiente de regresión que facilitan los cálculos de

estos, pues permiten hacer un cambio de variable.

Propiedades del coeficiente de regresión:

1) Si se suma o resta una constante a todos los valores de X o de Y el coeficiente de regresión no

varia.

2) Si se multiplican todos los valores de X por una constante, el coeficiente de regresión queda

multiplicado por esa constante.

Si se multiplican todos los valores de y por una constante, el coeficiente de regresión queda

multiplicado por esa constante.

Ejemplo 7. Si se consideramos la tabla

1980 430000

1983 450000

1986 475000

1989 500000

Si hacemos X’ = X 1980

3 Y’ = Y 450000

1000

Se obtiene:

Page 241: Libro de estadistica

240

0 -20

1 0

2 25

3 50

Par la variable X’ ,Y’ es más fácil el cálculo del coeficiente de regresión y la relación entre éste y

el de XY es:

m’yx = 3

1000

mxy

b) Correlación lineal.

Se entiende por correlación la dependencia que existe entre las variables de una

distribución., cuando ésta es, en cierta forma, lineal se habla de correlación lineal. Cuando no

existe tal dependencia se dice que las variables están incorreladas.

Si bien la covarianza permite obtener conclusiones sobre la existencia y tipo de

correlación, para medirla de una forma cuantitativa, se utiliza un parámetro que permite más

seguridad en las conclusiones. Se trata del coeficiente de correlación lineal, o de Pearson, el cual

se define así:

El signo es + si la covarianza es positiva y - si es negativa.

R = xyyx

yx

xym.m

S.S

S

Propiedades de r

a) -1≤ r ≤1

b) Si r es positivo la correlación es directa, es decir, al aumentar una variable también aumenta la

otra (coeficiente de regresión positivo). En este caso las pendientes de las rectas de regresión son

positivas.

. .

. .

. .

. .

. .

.

Page 242: Libro de estadistica

241

Si r es negativo la correlación es inversa, es decir, al aumentar una variable disminuye la otra. En

este caso las pendientes de la rectas de regresión son negativas.

. .

. .

. .

.

c) Si r2 = 1, es decir, r igual a 1 o a -1, las dos rectas de regresión coinciden y la nube de puntos

está contenida en la recta (correlación perfecta). Hay dependencia funcional entre las variables.

d) Si r = 0 las rectas de regresión son perpendiculares entre sí y paralelas a los ejes. Las variables

son incorreladas.

Para los demás valores de r la dependencia es tanto más fuerte cuanto más próximo esté a 1 o a -

1. Será más débil cuando se aproxime a 0:

Para la correlación directa:

Si 0,75 r 1 correlación muy alta.

Si 0,40 r 0,75 correlación baja

Si r < 0,40 la correlación es casi despreciable.

Ejercicio 4. Hallar el coeficiente de correlación lineal para la distribución del ejemplo 3.

Solución: r = + ( , ).( , )118 0 5 = 0,76. Se trata de una correlación directa alta.

Problemas resueltos:

Al estudiar dos variables, las tablas de frecuencias serán del tipo:

x y xy x x y y (x x )2 (y y )

2

5 15 75 0,2 0,8 0,04 0,64

7 18 126 2,2 3,8 4,84 14,44

2 10 20 -2,8 -4,2 7,84 17,64

1 8 8 -3,8 -6,2 14,44 38,44

9 20 180 4,2 5,8 17,64 33,64

=24 =71 =409 =44,8 =104,8

Medias o medias marginales ( X , Y )

Page 243: Libro de estadistica

242

X xi

N

xi fiN

Y yi

N

yi fiN

2,145

208101815

8,45

91275

Y

X

Desviaciones típicas ( x( sx),y( sy) )

x sx

xi x 2

N

fi xi x

2

N

xi 2N

x 2

y sy

yi y 2

N

fi yi y

2

N

yi2N

y 2

578,496,202'145

40064100324225

993,296,88'45

81144925

22

2

22

2

yN

yis

xN

xis

xx

xx

Covarianza ( xy (Sxy)

xy

(xi x ) yi y N

xi yiN

x y

64,132,148,45

18082012675

xy

Coeficiente de correlación lineal de Pearson.

yx

xyr 995,0

578,4993,2

64,13

yx

xyr

Existe correlación directa. (r = +0,995)

Rectas de regresión

Si el coeficiente de correlación es próximo a +1 o -1, se puede intentar calcular la recta

que se ajusta a la nube de puntos. Dicha recta recibe el nombre de recta de regresión y permite

estimar el valor (desconocido) de una de las variables, conociendo el valor de la otra variable.

La ecuación de la recta de regresión será:

Page 244: Libro de estadistica

243

Y Y xy

x2

X X ( Variable Y en función de X)

X X xy

y2

Y Y ( Variable X en función de Y)

43,4650,0)2,14(96,20

64,138,4

89,652,1)8,4(8,96

13,64=14,2-Y

YXYX

XYX

2. Una asociación dedicada a la protección de la infancia decide estudiar la relación entre la

mortalidad infantil en cada país y el número de camas de hospitales por cada mil habitantes.

Datos

x 50 100 70 60 120 180 200 250 30 90

y 5 2 2,5 3,75 4 1 1,25 0,75 7 3

Donde x es el nº de camas por mil habitantes e y el tanto por ciento de mortalidad.

Se pide calcular las rectas de regresión y el coeficiente de correlación lineal.

¿Si se dispusiese de 175 camas por mil habitantes que tanto por ciento de mortalidad se debería

esperar? ¿La estimación es confiable? Razona la respuesta.

Solución:

Para facilitar los cálculos de los parámetros se utiliza la siguiente tabla:

xi yi xi2 yi

2 x i yi

50 5 2500 25 250

100 2 10000 4 200

70 2,5 4900 6,25 170

60 3,75 3600 14,0625 225

120 4 14400 16 480

180 1 32400 1 180

200 1,25 40000 1,5625 250

250 0,75 62500 0,5625 187,5

30 7 900 49 210

90 3 8100 9 270

= 1150 30,25 179300 126,4375 2422,5

Page 245: Libro de estadistica

244

x = 115 ; y = 3,025% ; Sx = 17930 13225 68,59

Sy = 12 64375 9 150625, , = 1 , Sxy= 242 25 115 3 025, ( )( , ) = -105,625

Las rectas de regresión serán por tanto:

y - 3,025 = -0,022449 (x - 115)

x - 115 = -30,2053 (y - 3,025)

El coeficiente de correlación lineal:

r = 105 625

68 59 187

,

( , )( , ) = - 0,8235 Es una correlación inversa alta.

Para la estimación que nos piden utilizaremos la recta de regresión de Y sobre X.

y = 3,025 - 0,022449(175- 115) = 1,6783 que sería fiable por ser alto el coeficiente de

correlación.

3. Dada la distribución bidimensional:

X 1 2 1 2 3 2 2 2 3 1

Y 3 5 2 3 5 4 3 5 5 3

Encuentre el valor del coeficiente de correlación lineal usando una tabla de correlación.

Solución.

Se usa la siguiente tabla de doble entrada que facilita los cálculos:

X

Y

1 2

3 n’j nj’yj n’jyj2 nijxiyj

2 1 1 2 4 2

3 2 2 4 12 36 18

4 1 1 4 16 8

5 2 2 4 20 100 50

ni 3 5 2 10 =38 =15

6

=78

nixi 3 10 6 =19

nixi2 3 20 18 =41

nijxiyj 7 40 30 =78

Page 246: Libro de estadistica

245

De aquí se tiene:

x = 19/10 = 1,9 ; y = 38/10 = 3,8 ; Sx2

= 4,1 - (1,9)2

= 0,49, Sx = 0,7

Sy2

=15,6 - (3,8)2

= 1,16, Sy = 1,077; Sxy = 7,8 - (1,9)(3,8) = 0,58.

Luego r = 0 58

0 7 1 077

,

( , )( , ) = 0,769

Problemas propuestos

1. Las tallas y los pesos de 10 personas vienen recogidos en la siguiente tabla:

talla (Cm.) 160 165 170 180 185 190 192 175 182 172

pesos (Kg.) 58 61 65 73 80 85 83 68 74 67

Estimar el peso promedio de una persona que mida 168 cm.

2. El número de licencias de caza, en miles, y el número de votantes a un determinado partido en

6 comunidades autónomas, en decenas de miles, está expresado en la siguiente tabla:

Nº de licencias (X) 103 26 3 7 26 5

Nº de votantes (Y) 206 26 27 14 24 12

Determinar:

a) Media y varianza de las variables X e Y.

b) Coeficiente de correlación, interpretando su valor.

c) En el caso de que exista correlación: si en una determinada comunidad existen 50 decenas de

millar de votantes, ¿cuántas licencias de caza, en miles, se puede estimar que existen.

3. Las distancias medias de los 19 planetas al Sol son:

1.

Merc

2.

Ven.

3.

Tie.

4.

Ma.

5.

Ast.

6.

Jup.

7.

Sat.

8.

Ur.

9.

Nep.

10.

Plu

0,39 0,72 1 1,52 2,65 5,2 9,54 19,19 30,07 39,52

(Se ha tomado como unidad la distancia entre la Tierra y el Sol, a lo que se llama unidad

astronómica (u.a.). El quinto lugar está ocupado por los asteroides que, para estos efectos, son

considerados como un planeta más).

Page 247: Libro de estadistica

246

Representar la nube de puntos correspondiente, trazar la recta de regresión y calcular el

coeficiente de correlación.

Si hubiera un nuevo planeta más allá de Plutón, ¿a qué distancia en u.a. estaría del Sol?. ¿Sería

“confiable” esta medida?

4. Observaciones realizadas con estudiantes de Matemáticas, sobre el efecto del paso del tiempo

en los conocimientos adquiridos, arrojan los siguientes resultados:

1 día ..................... 90 % de permanencia de conocimientos.

2 días .................... 75 % “ “

3 días .................... 42 % “ “

4 días .................... 30 % “ “

5 días .................... 21 % “ “

Tomando los días transcurridos (X) y el tanto por ciento (Y) como variables de una

distribución dimensional, halla la recta de regresión de Y sobre X y estima, si existe una

correlación fuerte, el tanto por ciento de conocimientos que permanecerán a los ocho días.

Organiza los cálculos y explica el resultado.

Page 248: Libro de estadistica

247

Bibliografía

Meyer. P.L. Probabilidades y Aplicaciones Estadísticas. Addison-Wesley

Iberoamericana. México 1986.

Santalo, L.A. Probabilidades e Inferencia Estadística. Monografía Nro. 11, Serie De

Matemematica. (Editado Por La OEA 1970).

Arley, A y Buch, R. Introducción a La Teoría de la Probabilidad y La Estadística. Alhambra,

Madrid 1968.

Cramer,H. Elementos de la Teoría de Probabilidad y Aplicaciones.Aguilar, Madrid

1963.

Dixon W Y Massey F.J. Introducción al Análisis Estadístico. Mc Graw Hill

1970.

Krief, A., Levy, S. Cálculo de Probabilidades. Problemas. Pirámide. 1978.

Jose H. Chourio. Estatística I, Estatística II, Editorial. Biosfera Caracas 1987

David Salama. Estadística Metodología y Aplicaciones, Tipografía Principios, Caracas 1992.

Casas Sánchez, J.M., García Pérez, C. y Otros. Problemas De Estadística. Descriptiva,

Probabilidad E Inferencia. Editorial Pirámide 1998.

M.R. Spiegel. Probabilidad Y Estadística. Schaum. Mc Graw-Hill.

Navegadores de La Internet.

López. Rafael, Cálculo de Probabilidades e Inferencia Estadística con Tópicos de Econometria.

Universidad Católica Andrés Bello. Editorial Texto Caracas 1996.

Page 249: Libro de estadistica

248

ANEXOS

Page 250: Libro de estadistica

249

DISTRIBUCIONES

PARAMETRO CONDICION ESTADISTICO

INTERV. de CONFIANZA COMENTARIO

x 2

x =

Conocidas

nx

x

x

nZx x

21

Estadístico N (0,1)

x 2

x =

Desconocidas

ns

x

x

x

n

stx xn 1

21

Estadístico con distribución

t (n-1)

2

x

--------------------- 2

2)1(

x

xsn

2

2)1(

2

2

)2

1)(1(

2 )1(;

)1(

n

x

n

x snsn

Estadístico con distribución

χ2(n-1)

x - y

Dos poblaciones

normales

independiente 2

x ;2

y

conocidas

y

y

x

x

yx

nn

yx

22

)(

y

y

x

x

nnZyx

22

21

Estadístico N(0,1)

x - y

2

x ;2

y

desconocidas

pero iguales 2

x =2

y =2

yx

p

yx

nns

yx

11

)(

yx

p

2nn

21 n

1

n

1styx yx

2nn

S)1n(S)1n(S

yx

2

yy

2

xx

p

Estadístico con distribución t con

..2 lgnn yx

x - y

2

x ;2

y

desconocidas

Muestras

grandes

y

y

x

x

yx

n

s

n

s

yx

22

)(

y

y

x

x

n

s

n

sZyx

22

21

50)nn( yx

Estadístico aproximadamente N(0,1)

x - y

2

x ;2

y

Desconocidas

Muestras

Pequeñas

y

y

x

x

yx

n

s

n

s

yx

22

)(

y

2

y

x

2

xv

21 n

s

n

styx

2

1n

n

S

1n

nS

n

S

nS

V

y

2

y

2

y

x

2

x

2

x

2

y

2

y

x

2

x

V = g.l. de una t-student

2

2

y

x

X,Y Poblaciones

Normales 2

x ;2

y

Desconocidas

2

2

2

2

y

y

x

x

s

s

1n

2),1n(

2

x

2

x

1n

21),1n(

2

x

2

x

x

y

x

y

F

s

;F

s

Estadístico con distribución

)1(

)1(

x

y

n

nF

P Proporción de

una Binomial

X Binomial (n;p)

Muestras

grandes n

pp

pp

)1(

n

)p1(pZp

21

Page 251: Libro de estadistica

250

Distribución Chi-cuadrado

Si ,........,, 21 nXXX son v.a. que siguen una distribución normal tipificada N (0,1),

entonces X= ........ + 222

21 nXXX sigue una distribución n

2 .

; E X n Var X n( ) ( ) 2

Distribución t de Student

Si X y Z son v.a. independientes, donde Z sigue una dist. Normal N(0, 1), y X una n

2 ,

entonces, la v.a. TX

Y n

/ sigue una distribución tn

2)( ; 0)(

n

nTVarTE

Distribución F de Snedecor

Si X1 y X2 son v.a. independientes, con distribución Ji-cuadrado con n y m grados de

libertad respectivamente, entonces FX n

X m 1

2

/

/ sigue una distribución F con n y m grados de

libertad.

DISTRIBUCIONES MUESTRALES

Se supondrá muestreo aleatorio simple y población normal. Si X 1 , ,........,X Xn2 es una muestra

aleatoria de una población con media y varianza 2

Media muestral con varianza conocida

),( ~ 2

nNX

)( )(

2

nXVarXE

Varianza muestral nS

n

2

2

~ 1

2 . 2

4222 )1(2

)( n

1-n)(

n

nSVarSE

Media muestral con varianza desconocida

)(1S

Xn

~ tn-1

Si nXX ,...,1 es una m.a de una población con media x y varianza x2 y Y Ym1, ... , es otra

m.a. de otra población con media y y varianza y2

Diferencia de medias muéstrales con varianza conocidas y muestras independientes

Page 252: Libro de estadistica

251

),(22

yx ~ mn

yxNYX

Diferencia de medias muéstrales con varianzas desconocidas pero iguales y muestras

independientes

2-+22

t~

11

2

)(mn

yx

yx

mnmn

mSnS

YX

Diferencia de medias muéstrales, muestras relacionadas

n=m, Di=Xi-Yi y Sd su desviación típica

))(

(1d

yx

S

YXn

~ tn-1

Cociente de varianzas muéstrales

)1(),1(22

22

~ )1(/

)1(/

mn

yy

xx FmSm

nSn

ESTIMACION

Intervalos de Confianza a nivel 1-:

Para la media de una población normal ( 2 conocida)

nzX

nzX

21

21

,

Para la media de una población normal ( 2 desconocida)

1,

11

21

1

21 n

StX

n

StX nn

Para la proporción en una población Bernoulli

n

PPzP

n

PPzP

)1(,

)1(

21

21

Para la varianza de una población normal ( y 2 desconocidas)

Page 253: Libro de estadistica

252

2

12/

2

212/1

2

,

nn

nSnS

Para la diferencia de medias de poblaciones independientes (varianzas conocidas)

mn

zYXmn

zYXyxyx

22

21

22

21

,

Para la diferencia de medias de poblaciones independientes (varianzas desconocidas pero

iguales)

mnmn

mSnStYX

mnmn

mSnStYX

yx

mn

yx

mn

11

2,

11

2

22

2

21

22

2

21

Para la diferencia de medias con muestras relacionadas.

n = m, Di = Xi-Yi y Sd su desviación típica

1,

1

2

1

21

2

1

21 n

StYX

n

StYX d

nd

n

Para la diferencia de proporciones.

m

)y

P-(1y

P

n

)x

P-(1x

Pz

yP

xP,

m

)y

P-(1y

P

n

)x

P-(1x

Pz

yP

xP

/21/21

Para el cociente entre varianzas de dos poblaciones normales

)1),(1(2

2

)1),(1(2

2

22-1

1

)1/(

)1/( ,

1

)1/(

)1/(

mny

x

mny

x

fmmS

nnS

fmmS

nnS

CONTRASTES DE HIPOTESIS

Page 254: Libro de estadistica

253

Estadísticos de contraste y regiones de rechazo a nivel :

Para la media ( 2 conocida)

a) Bilateral 2/112

0 :

zTTR

n

XT

b) Unilateral derecho

11

2

0 : zTTR

n

XT

c) Unilateral izquierdo

11

2

0 : zTTR

n

XT

Para la media de una población normal ( 2 desconocida)

a) Bilateral 12/112

0 :

1

ntTTR

n

S

XT

b) Unilateral derecho 1112

0 :

1

ntTTR

n

S

XT

c) Unilateral izquierdo 1112

0 :

ntTTR

n

S

XT

Para la proporción en una población Bernoulli

a) Bilateral 2/11

00

0 : )1(

zTTR

n

pp

pPT

b) Unilateral derecho

11

00

0 : )1(

zTTR

n

pp

pPT

c) Unilateral izquierdo

11

00

0 : )1(

zTTR

n

pp

pPT

Para la varianza de una población normal

Page 255: Libro de estadistica

254

a) Bilateral ó : 212/

212/112

0

2

nn TTTRnS

T

b) Unilateral derecho : 21112

0

2

nTTRnS

T

c) Unilateral izquierdo : 2112

0

2

nTTRnS

T

Sobre la diferencia de medias con muestras independientes y varianzas conocidas

a) Bilateral 2/1122

0 :

zTTR

mn

dYXT

yx

b) Unilateral derecho

11

22

0 T : zTR

mn

dYXT

yx

c) Unilateral izquierdo

11

22

0 T : zTR

mn

dYXT

yx

Sobre la diferencia de medias con muestras independientes y varianzas desconocidas pero

iguales

a) Bilateral 22/1122

0 : 11

2

mn

ymx

tTTRdYX

T

mnmn

SnS

b) Unilateral derecho 21122

0 T : 11

2

mn

ymx

tTRdYX

T

mnmn

SnS

c) Unilateral izquierdo 21122

0 T : 11

2

mn

ymx

tTRdYX

T

mnmn

SnS

Sobre la diferencia de medias con muestras relacionadas (datos apareados)

00 :H dyx

Page 256: Libro de estadistica

255

a) Bilateral 12/110 :

1

n

d

tTTR

n

S

dYXT

b) Unilateral derecho 1110 T :

1

n

d

tTR

n

S

dYXT

c) Unilateral izquierdo 1110 T :

1

n

d

tTR

n

S

dYXT

Sobre el cociente de varianzas

a) Bilateral ó : r

1

)1/(

)1/(1,12/1,12/11

02

2

mnmn

y

x fTfTTRmmS

nnST

b) Unilateral derecho : r

1

)1/(

)1/(1,111

02

2

mn

y

x fTTRmmS

nnST

c) Unilateral izquierdo : r

1

)1/(

)1/(1,11

02

2

mn

y

x fTTRmmS

nnST

Sobre la diferencia de proporciones en poblaciones Bernoulli

a) Bilateral 2/11

0 :

)1()1(

zTTR

m

yP

yP

n

xP

xP

dPPT

yx

b) Unilateral derecho

11

0T :

)1()1(zTR

m

yP

yP

n

xP

xP

dPPT

yx

c) Unilateral izquierdo

11

0 :

)1()1(zTTR

m

yP

yP

n

xP

xP

dPPT

yx

Regresión lineal

Page 257: Libro de estadistica

256

Distribuciones muéstrales de los estadísticos

~2)s-(n

))(

,(~ˆ

),(~ˆ

2

22

2

r

2

222

2

2

n

x

x

x

ns

sxNa

nsNb

~)(

ˆ

2

2

222

2

2

2

n

x

xr

n

x

r

t

ns

sxs

t

ns

s

Intervalos de confianza para a nivel 1-

ˆ ,ˆ2

2

22/12

2

22/1

x

rn

x

rn

ns

st

ns

st

Intervalos de confianza para a nivel 1-

2

222

22/12

222

22/1

)( ,

)(

x

xr

n

x

xr

nns

sxst

ns

sxst

Contrastes sobre y

ˆ

2

2

0

x

r

ns

sT

)(

ˆ

2

222

0

x

xr

ns

sxsT

a) Bilateral 22/11 : ntTTR

b) Unilateral derecho 211 : ntTTR

c) Unilateral izquierdo 211 : ntTTR

Contrastes sobre el coeficiente de correlación. 22

~)1(

2

n

xy

xyt

r

nrT

a) Bilateral 22/11 : ntTTR

b) Unilateral derecho 211 : ntTTR

c) Unilateral izquierdo 211 : ntTTR

Intervalo de confianza para la media de Y cuando X=x0

))(1

(ˆ ,))(1

(ˆ2

2

02

02

2

02

22/10 22/1

x

r

x

rnns

xx

nsty

ns

xx

nsty

n

Page 258: Libro de estadistica

257

Intervalo de confianza para la predicción cuando X=x0

))(

(ˆ ,))(1

1(ˆ 2

2

02

22/102

2

02

0

11

22/1

x

rn

x

rns

xxsty

ns

xx

nsty

nn

Page 259: Libro de estadistica

258

TABLAS ESTADISTICAS

PARAMETRO CONDICION ESTADISTICO

INTERV. de CONFIANZA COMENTARIO

x 2

x =

Conocidas

nx

x

x

nZx x

21

Estadístico N (0,1)

x 2

x =

Desconocidas

ns

x

x

x

n

stx xn 1

21

Estadístico con distribución

t (n-1)

2

x

--------------------- 2

2)1(

x

xsn

2

2)1(

2

2

)2

1)(1(

2 )1(;

)1(

n

x

n

x snsn

Estadístico con distribución

χ2(n-1)

x - y

Dos poblaciones

normales

independiente 2

x ;2

y

conocidas

y

y

x

x

yx

nn

yx

22

)(

y

y

x

x

nnZyx

22

21

Estadístico N(0,1)

x - y

2

x ;2

y

desconocidas

pero iguales 2

x =2

y =2

yx

p

yx

nns

yx

11

)(

yx

p

2nn

21 n

1

n

1styx yx

2nn

S)1n(S)1n(S

yx

2

yy

2

xx

p

Estadístico con distribución t con

..2 lgnn yx

x - y

2

x ;2

y

desconocidas

Muestras

grandes

y

y

x

x

yx

n

s

n

s

yx

22

)(

y

y

x

x

n

s

n

sZyx

22

21

50)nn( yx

Estadístico aproximadamente N(0,1)

x - y

2

x ;2

y

Desconocidas

Muestras

Pequeñas

y

y

x

x

yx

n

s

n

s

yx

22

)(

y

2

y

x

2

xv

21 n

s

n

styx

2

1n

n

S

1n

nS

n

S

nS

V

y

2

y

2

y

x

2

x

2

x

2

y

2

y

x

2

x

V = g.l. de una t-student

2

2

y

x

X,Y Poblaciones

Normales 2

x ;2

y

Desconocidas

2

2

2

2

y

y

x

x

s

s

1n

2),1n(

2

x

2

x

1n

21),1n(

2

x

2

x

x

y

x

y

F

s

;F

s

Estadístico con distribución

)1(

)1(

x

y

n

nF

P Proporción de

una Binomial

X Binomial (n;p)

Muestras

grandes n

pp

pp

)1(

n

)p1(pZp

21

Page 260: Libro de estadistica

259

Probabilidades BINOMIALES.

n= 5

0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99

0 0,951 0,774 0,590 0,328 0,237 0,168 0,078 0,031 0,010 0,002 0,001 0,000 0,000 0,000 0,000

1 0,999 0,977 0,919 0,737 0,633 0,528 0,337 0,188 0,087 0,031 0,016 0,007 0,000 0,000 0,000

2 1,000 0,999 0,991 0,942 0,896 0,837 0,683 0,500 0,317 0,163 0,104 0,058 0,009 0,001 0,000

3 1,000 1,000 1,000 0,993 0,984 0,969 0,913 0,813 0,663 0,472 0,367 0,263 0,081 0,023 0,001

4 1,000 1,000 1,000 1,000 0,999 0,998 0,990 0,969 0,922 0,832 0,763 0,672 0,410 0,226 0,049

n= 10

0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99

0 0,904 0,599 0,349 0,107 0,056 0,028 0,006 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000

1 0,996 0,914 0,736 0,376 0,244 0,149 0,046 0,011 0,002 0,000 0,000 0,000 0,000 0,000 0,000

2 1,000 0,988 0,930 0,678 0,526 0,383 0,167 0,055 0,012 0,002 0,000 0,000 0,000 0,000 0,000

3 1,000 0,999 0,987 0,879 0,776 0,650 0,382 0,172 0,055 0,011 0,004 0,001 0,000 0,000 0,000

4 1,000 1,000 0,998 0,967 0,922 0,850 0,633 0,377 0,166 0,047 0,020 0,006 0,000 0,000 0,000

5 1,000 1,000 1,000 0,994 0,980 0,953 0,834 0,623 0,367 0,150 0,078 0,033 0,002 0,000 0,000

6 1,000 1,000 1,000 0,999 0,996 0,989 0,945 0,828 0,618 0,350 0,224 0,121 0,013 0,001 0,000

7 1,000 1,000 1,000 1,000 1,000 0,998 0,988 0,945 0,833 0,617 0,474 0,322 0,070 0,012 0,000

8 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,989 0,954 0,851 0,756 0,624 0,264 0,086 0,004

9 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,994 0,972 0,944 0,893 0,651 0,401 0,096

n= 15

0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99

0 0,860 0,463 0,206 0,035 0,013 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

1 0,990 0,829 0,549 0,167 0,080 0,035 0,005 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

2 1,000 0,964 0,816 0,398 0,236 0,127 0,027 0,004 0,000 0,000 0,000 0,000 0,000 0,000 0,000

3 1,000 0,995 0,944 0,648 0,461 0,297 0,091 0,018 0,002 0,000 0,000 0,000 0,000 0,000 0,000

4 1,000 0,999 0,987 0,836 0,686 0,515 0,217 0,059 0,009 0,001 0,000 0,000 0,000 0,000 0,000

5 1,000 1,000 0,998 0,939 0,852 0,722 0,403 0,151 0,034 0,004 0,001 0,000 0,000 0,000 0,000

6 1,000 1,000 1,000 0,982 0,943 0,869 0,610 0,304 0,095 0,015 0,004 0,001 0,000 0,000 0,000

7 1,000 1,000 1,000 0,996 0,983 0,950 0,787 0,500 0,213 0,050 0,017 0,004 0,000 0,000 0,000

8 1,000 1,000 1,000 0,999 0,996 0,985 0,905 0,696 0,390 0,131 0,057 0,018 0,000 0,000 0,000

9 1,000 1,000 1,000 1,000 0,999 0,996 0,966 0,849 0,597 0,278 0,148 0,061 0,002 0,000 0,000

10 1,000 1,000 1,000 1,000 1,000 0,999 0,991 0,941 0,783 0,485 0,314 0,164 0,013 0,001 0,000

11 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,982 0,909 0,703 0,539 0,352 0,056 0,005 0,000

12 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,973 0,873 0,764 0,602 0,184 0,036 0,000

13 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,995 0,965 0,920 0,833 0,451 0,171 0,010

14 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,995 0,987 0,965 0,794 0,537 0,140

n= 20

0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99

0 0,818 0,358 0,122 0,012 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

1 0,983 0,736 0,392 0,069 0,024 0,008 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

2 0,999 0,925 0,677 0,206 0,091 0,035 0,004 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

3 1,000 0,984 0,867 0,411 0,225 0,107 0,016 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000

4 1,000 0,997 0,957 0,630 0,415 0,238 0,051 0,006 0,000 0,000 0,000 0,000 0,000 0,000 0,000

5 1,000 1,000 0,989 0,804 0,617 0,416 0,126 0,021 0,002 0,000 0,000 0,000 0,000 0,000 0,000

6 1,000 1,000 0,998 0,913 0,786 0,608 0,250 0,058 0,006 0,000 0,000 0,000 0,000 0,000 0,000

7 1,000 1,000 1,000 0,968 0,898 0,772 0,416 0,132 0,021 0,001 0,000 0,000 0,000 0,000 0,000

8 1,000 1,000 1,000 0,990 0,959 0,887 0,596 0,252 0,057 0,005 0,001 0,000 0,000 0,000 0,000

9 1,000 1,000 1,000 0,997 0,986 0,952 0,755 0,412 0,128 0,017 0,004 0,001 0,000 0,000 0,000

Page 261: Libro de estadistica

260 10 1,000 1,000 1,000 0,999 0,996 0,983 0,872 0,588 0,245 0,048 0,014 0,003 0,000 0,000 0,000

11 1,000 1,000 1,000 1,000 0,999 0,995 0,943 0,748 0,404 0,113 0,041 0,010 0,000 0,000 0,000

12 1,000 1,000 1,000 1,000 1,000 0,999 0,979 0,868 0,584 0,228 0,102 0,032 0,000 0,000 0,000

13 1,000 1,000 1,000 1,000 1,000 1,000 0,994 0,942 0,750 0,392 0,214 0,087 0,002 0,000 0,000

14 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,979 0,874 0,584 0,383 0,196 0,011 0,000 0,000

15 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,994 0,949 0,762 0,585 0,370 0,043 0,003 0,000

16 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,984 0,893 0,775 0,589 0,133 0,016 0,000

17 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,965 0,909 0,794 0,323 0,075 0,001

18 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,992 0,976 0,931 0,608 0,264 0,017

19 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,997 0,988 0,878 0,642 0,182

Probabilidades BINOMIALES.

n= 25

0,01 0,05 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,75 0,80 0,90 0,95 0,99

0 0,778 0,277 0,072 0,004 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

1 0,974 0,642 0,271 0,027 0,007 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

2 0,998 0,873 0,537 0,098 0,032 0,009 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

3 1,000 0,966 0,764 0,234 0,096 0,033 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

4 1,000 0,993 0,902 0,421 0,214 0,090 0,009 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

5 1,000 0,999 0,967 0,617 0,378 0,193 0,029 0,002 0,000 0,000 0,000 0,000 0,000 0,000 0,000

6 1,000 1,000 0,991 0,780 0,561 0,341 0,074 0,007 0,000 0,000 0,000 0,000 0,000 0,000 0,000

7 1,000 1,000 0,998 0,891 0,727 0,512 0,154 0,022 0,001 0,000 0,000 0,000 0,000 0,000 0,000

8 1,000 1,000 1,000 0,953 0,851 0,677 0,274 0,054 0,004 0,000 0,000 0,000 0,000 0,000 0,000

9 1,000 1,000 1,000 0,983 0,929 0,811 0,425 0,115 0,013 0,000 0,000 0,000 0,000 0,000 0,000

10 1,000 1,000 1,000 0,994 0,970 0,902 0,586 0,212 0,034 0,002 0,000 0,000 0,000 0,000 0,000

11 1,000 1,000 1,000 0,998 0,989 0,956 0,732 0,345 0,078 0,006 0,001 0,000 0,000 0,000 0,000

12 1,000 1,000 1,000 1,000 0,997 0,983 0,846 0,500 0,154 0,017 0,003 0,000 0,000 0,000 0,000

13 1,000 1,000 1,000 1,000 0,999 0,994 0,922 0,655 0,268 0,044 0,011 0,002 0,000 0,000 0,000

14 1,000 1,000 1,000 1,000 1,000 0,998 0,966 0,788 0,414 0,098 0,030 0,006 0,000 0,000 0,000

15 1,000 1,000 1,000 1,000 1,000 1,000 0,987 0,885 0,575 0,189 0,071 0,017 0,000 0,000 0,000

16 1,000 1,000 1,000 1,000 1,000 1,000 0,996 0,946 0,726 0,323 0,149 0,047 0,000 0,000 0,000

17 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,978 0,846 0,488 0,273 0,109 0,002 0,000 0,000

18 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,993 0,926 0,659 0,439 0,220 0,009 0,000 0,000

19 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,971 0,807 0,622 0,383 0,033 0,001 0,000

20 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 0,910 0,786 0,579 0,098 0,007 0,000

21 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,967 0,904 0,766 0,236 0,034 0,000

22 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,991 0,968 0,902 0,463 0,127 0,002

23 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 0,993 0,973 0,729 0,358 0,026

24 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,996 0,928 0,723 0,222

Page 262: Libro de estadistica

261

Probabilidades de POISSON (acumuladas)

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

0 0,905 0,819 0,741 0,670 0,607 0,549 0,497 0,449 0,407 0,368

1 0,995 0,982 0,963 0,938 0,910 0,878 0,844 0,809 0,772 0,736

2 1,000 0,999 0,996 0,992 0,986 0,977 0,966 0,953 0,937 0,920

3 1,000 1,000 1,000 0,999 0,998 0,997 0,994 0,991 0,987 0,981

4 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,999 0,998 0,996

5 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999

6 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000

2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 15,0 20,0

0 0,135 0,05 0,018 0,007 0,002 0,000 0,000 0,000 0,000 0,000 0,000

1 0,406 0,199 0,092 0,04 0,017 0,007 0,003 0,001 0,000 0,000 0,000

2 0,677 0,423 0,238 0,125 0,062 0,030 0,014 0,006 0,003 0,000 0,000

3 0,857 0,647 0,433 0,265 0,151 0,082 0,042 0,021 0,010 0,000 0,000

4 0,947 0,815 0,629 0,44 0,285 0,173 0,100 0,055 0,029 0,000 0,000

5 0,983 0,916 0,785 0,616 0,446 0,301 0,191 0,116 0,067 0,003 0,000

6 0,995 0,966 0,889 0,762 0,606 0,450 0,313 0,207 0,130 0,008 0,000

7 0,999 0,988 0,949 0,867 0,744 0,599 0,453 0,324 0,220 0,018 0,000

8 1 0,996 0,979 0,932 0,847 0,729 0,593 0,456 0,333 0,037 0,002

9 1 0,999 0,992 0,968 0,916 0,83 0,717 0,587 0,458 0,070 0,005

10 1 1 0,997 0,986 0,957 0,901 0,816 0,706 0,583 0,118 0,011

11 1 1 0,999 0,995 0,98 0,947 0,888 0,803 0,697 0,185 0,021

12 1 1 1 0,998 0,991 0,973 0,936 0,876 0,792 0,268 0,039

13 1 1 1 0,999 0,996 0,987 0,966 0,926 0,864 0,363 0,066

14 1 1 1 1 0,999 0,994 0,983 0,959 0,917 0,466 0,105

15 1 1 1 1 0,999 0,998 0,992 0,978 0,951 0,568 0,157

16 1 1 1 1 1 0,999 0,996 0,989 0,973 0,664 0,221

17 1 1 1 1 1 1 0,998 0,995 0,986 0,749 0,297

18 1 1 1 1 1 1 0,999 0,998 0,993 0,819 0,381

19 1 1 1 1 1 1 1 0,999 0,997 0,875 0,470

20 1 1 1 1 1 1 1 1 0,998 0,917 0,559

21 1 1 1 1 1 1 1 1 0,999 0,947 0,644

22 1 1 1 1 1 1 1 1 1 0,967 0,721

23 1 1 1 1 1 1 1 1 1 0,981 0,787

24 1 1 1 1 1 1 1 1 1 0,989 0,843

25 1 1 1 1 1 1 1 1 1 0,994 0,888

26 1 1 1 1 1 1 1 1 1 0,997 0,922

27 1 1 1 1 1 1 1 1 1 0,998 0,948

28 1 1 1 1 1 1 1 1 1 0,999 0,966

29 1 1 1 1 1 1 1 1 1 1 0,978

30 1 1 1 1 1 1 1 1 1 1 0,987

31 1 1 1 1 1 1 1 1 1 1 0,992

32 1 1 1 1 1 1 1 1 1 1 0,995

33 1 1 1 1 1 1 1 1 1 1 0,997

34 1 1 1 1 1 1 1 1 1 1 0,999

35 1 1 1 1 1 1 1 1 1 1 0,999

36 1 1 1 1 1 1 1 1 1 1 1

Page 263: Libro de estadistica

262

DISTRIBUCION NORMAL

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549

0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319

1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441

1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545

1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633

1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706

1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857

2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890

2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916

2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936

2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952

2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964

2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974

2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981

2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986

3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993

3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995

3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997

3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998

Page 264: Libro de estadistica

263

DISTRIBUCION NORMAL

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549

0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015

1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177

1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319

1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441

1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545

1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633

1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706

1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817

2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857

2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890

2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916

2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936

2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952

2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964

2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974

2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981

2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986

3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990

3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993

3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995

3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997

3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998

Page 265: Libro de estadistica

264

1 2 3 4 5 6 7 8 9 10

10 0,100 6,314 2,92 2,3534 2,1318 2,015 1,9432 1,8946 1,8595 1,8331 1,8125

20 0,050 12,706 4,3027 3,1824 2,7765 2,5706 2,4469 2,3646 2,306 2,2622 2,2281

40 0,025 25,452 6,2054 4,1765 3,4954 3,1634 2,9687 2,8412 2,7515 2,685 2,6338

50 0,020 31,821 6,9645 4,5407 3,7469 3,3649 3,1427 2,9979 2,8965 2,8214 2,7638

100 0,010 63,656 9,925 5,8408 4,6041 4,0321 3,7074 3,4995 3,3554 3,2498 3,1693

200 0,005 127,321 14,089 7,4532 5,5975 4,7733 4,3168 4,0294 3,8325 3,6896 3,5814

1000 0,001 636,578 31,6 12,924 8,6101 6,8685 5,9587 5,4081 5,0414 4,7809 4,5868

2000 0,001 1273,155 44,703 16,326 10,305 7,9756 6,7882 6,0815 5,617 5,2911 5,0489

10000 0,000 6370,544 100,14 28,014 15,534 11,176 9,0804 7,8883 7,12 6,5938 6,2119

20000 0,000 12664,795 141,26 35,316 18,515 12,89 10,263 8,7824 7,851 7,2177 6,7614

100000 0,000 63476,563 314,71 60,797 27,716 17,881 13,56 11,176 9,7603 8,8289 8,1584

200000 0,000 126953,125 457,76 76,294 33,379 20,564 15,199 12,517 10,729 9,6112 8,7917

1000000 0,000 625000,000 915,53 133,51 47,684 28,61 20,266 15,497 13,113 11,921 10,729

2000000 0,000 2500000,000 1220,7 152,59 57,22 38,147 23,842 19,073 14,305 13,113 11,921

gl -->

11 12 13 14 15 16 17 18 19 20

10 0,100 1,796 1,7823 1,7709 1,7613 1,7531 1,7459 1,7396 1,7341 1,7291 1,7247

20 0,050 2,201 2,1788 2,1604 2,1448 2,1315 2,1199 2,1098 2,1009 2,093 2,086

40 0,025 2,593 2,56 2,5326 2,5096 2,4899 2,4729 2,4581 2,445 2,4334 2,4231

50 0,020 2,718 2,681 2,6503 2,6245 2,6025 2,5835 2,5669 2,5524 2,5395 2,528

100 0,010 3,106 3,0545 3,0123 2,9768 2,9467 2,9208 2,8982 2,8784 2,8609 2,8453

200 0,005 3,497 3,4284 3,3725 3,3257 3,286 3,252 3,2224 3,1966 3,1737 3,1534

1000 0,001 4,437 4,3178 4,2209 4,1403 4,0728 4,0149 3,9651 3,9217 3,8833 3,8496

2000 0,001 4,863 4,7166 4,5972 4,4995 4,4168 4,3464 4,2858 4,2332 4,1869 4,1461

10000 0,000 5,923 5,695 5,5134 5,3644 5,2387 5,1339 5,0431 4,9663 4,8988 4,8382

20000 0,000 6,407 6,1467 5,9279 5,7556 5,6066 5,4855 5,3784 5,2899 5,2061 5,1409

100000 0,000 7,637 7,2643 6,9663 6,7055 6,5193 6,333 6,184 6,0722 5,9605 5,8487

200000 0,000 8,196 7,7486 7,4506 7,1526 6,929 6,7055 6,5565 6,4075 6,2585 6,184

1000000 0,000 9,537 8,9407 8,6427 8,3447 7,7486 7,7486 7,4506 7,1526 7,1526 6,8545

2000000 0,000 10,729 9,5367 9,5367 8,9407 8,3447 8,3447 8,3447 7,7486 7,7486 7,1526

gl -->

21 22 23 24 25 26 27 28 29 30

10 0,100 1,721 1,7171 1,7139 1,7109 1,7081 1,7056 1,7033 1,7011 1,6991 1,6973

20 0,050 2,080 2,0739 2,0687 2,0639 2,0595 2,0555 2,0518 2,0484 2,0452 2,0423

40 0,025 2,414 2,4055 2,3979 2,391 2,3846 2,3788 2,3734 2,3685 2,3638 2,3596

50 0,020 2,518 2,5083 2,4999 2,4922 2,4851 2,4786 2,4727 2,4671 2,462 2,4573

100 0,010 2,831 2,8188 2,8073 2,797 2,7874 2,7787 2,7707 2,7633 2,7564 2,75

200 0,005 3,135 3,1188 3,104 3,0905 3,0782 3,0669 3,0565 3,047 3,038 3,0298

1000 0,001 3,819 3,7922 3,7676 3,7454 3,7251 3,7067 3,6895 3,6739 3,6595 3,646

2000 0,001 4,109 4,0769 4,0475 4,0207 3,9965 3,9744 3,954 3,9348 3,9177 3,9017

10000 0,000 4,785 4,7358 4,6939 4,6543 4,6194 4,5868 4,5565 4,5309 4,5053 4,482

20000 0,000 5,076 5,0198 4,9733 4,9267 4,8848 4,8475 4,8149 4,7823 4,7544 4,7311

Page 266: Libro de estadistica

265

100000 0,000 5,774 5,6997 5,6252 5,5693 5,5134 5,4576 5,4203 5,3644 5,3272 5,2899

200000 0,000 6,072 5,9977 5,9232 5,8487 5,7742 5,7369 5,6624 5,6252 5,5879 5,5507

1000000 0,000 6,855 6,7055 6,5565 6,5565 6,5565 6,2585 6,2585 6,2585 6,2585 6,1095

2000000 0,000 7,153 7,1526 7,1526 7,1526 6,5565 6,5565 6,5565 6,5565 6,5565 6,5565

gl -->

40 50 60 70 80 90 100 125 150 175

10 0,100 1,684 1,6759 1,6706 1,6669 1,6641 1,662 1,6602 1,6571 1,6551 1,6536

20 0,050 2,021 2,0086 2,0003 1,9944 1,9901 1,9867 1,984 1,9791 1,9759 1,9736

40 0,025 2,329 2,3109 2,299 2,2906 2,2844 2,2795 2,2757 2,2687 2,2641 2,2608

50 0,020 2,423 2,4033 2,3901 2,3808 2,3739 2,3685 2,3642 2,3566 2,3515 2,3478

100 0,010 2,704 2,6778 2,6603 2,6479 2,6387 2,6316 2,6259 2,6157 2,609 2,6042

200 0,005 2,971 2,937 2,9146 2,8987 2,887 2,8779 2,8707 2,8577 2,8492 2,8431

1000 0,001 3,551 3,496 3,4602 3,435 3,4164 3,4019 3,3905 3,3701 3,3565 3,3469

2000 0,001 3,788 3,723 3,6808 3,6508 3,6287 3,6118 3,5984 3,5742 3,5582 3,5472

10000 0,000 4,321 4,2282 4,1688 4,1269 4,0955 4,0722 4,0536 4,0198 3,9977 3,9814

20000 0,000 4,545 4,4378 4,3702 4,3213 4,2887 4,2608 4,2398 4,2003 4,177 4,1584

100000 0,000 5,048 4,9174 4,8243 4,7684 4,7125 4,6752 4,6566 4,6007 4,5728 4,5449

200000 0,000 5,253 5,1036 5,0291 4,9546 4,8988 4,8429 4,8243 4,7684 4,7311 4,7125

1000000 0,000 5,811 5,6624 5,5134 5,3644 5,3644 5,2154 5,2154 5,2154 5,0664 5,0664

2000000 0,000 5,960 5,9605 5,6624 5,6624 5,3644 5,3644 5,3644 5,3644 5,3644 5,3644

gl -->

200 225 250 275 300 325 350 375 400 450

10 0,100 1,653 1,6517 1,651 1,6504 1,6499 1,6496 1,6492 1,6489 1,6487 1,6482

20 0,050 1,972 1,9706 1,9695 1,9686 1,9679 1,9673 1,9668 1,9663 1,9659 1,9652

40 0,025 2,258 2,2565 2,255 2,2537 2,2527 2,2518 2,2511 2,2504 2,2499 2,2489

50 0,020 2,345 2,343 2,3414 2,34 2,3388 2,3379 2,337 2,3363 2,3357 2,3347

100 0,010 2,601 2,5979 2,5956 2,5938 2,5923 2,591 2,5899 2,589 2,5882 2,5868

200 0,005 2,838 2,835 2,8322 2,8299 2,8279 2,8263 2,8249 2,8237 2,8227 2,821

1000 0,001 3,340 3,3343 3,3299 3,3263 3,3232 3,3207 3,3186 3,3167 3,3151 3,3123

2000 0,001 3,539 3,532 3,5268 3,5227 3,5192 3,5163 3,5137 3,5114 3,5093 3,5064

10000 0,000 3,970 3,9616 3,9546 3,9488 3,9442 3,9395 3,936 3,9325 3,9302 3,9255

20000 0,000 4,144 4,1351 4,1281 4,1211 4,1164 4,1118 4,1071 4,1025 4,1001 4,0955

100000 0,000 4,526 4,5262 4,5076 4,5076 4,489 4,489 4,489 4,4797 4,4703 4,4703

200000 0,000 4,694 4,6752 4,6566 4,6566 4,6566 4,638 4,638 4,6194 4,6194 4,6194

1000000 0,000 5,066 5,0664 5,0664 5,0664 5,0664 4,9919 4,9919 4,9919 4,9174 4,9174

2000000 0,000 5,364 5,3644 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664

gl -->

500 550 600 650 700 750 800 1000 2000 3000

10 0,100 1,648 1,6476 1,6474 1,6472 1,647 1,6469 1,6468 1,6464 1,6456 1,6454

20 0,050 1,965 1,9643 1,9639 1,9636 1,9634 1,9631 1,9629 1,9623 1,9612 1,9608

40 0,025 2,248 2,2476 2,247 2,2466 2,2462 2,2459 2,2456 2,2448 2,2431 2,2425

50 0,020 2,334 2,3331 2,3326 2,3321 2,3317 2,3313 2,331 2,3301 2,3282 2,3276

100 0,010 2,586 2,5848 2,5841 2,5834 2,5829 2,5824 2,582 2,5807 2,5783 2,5775

200 0,005 2,820 2,8184 2,8175 2,8167 2,816 2,8154 2,8148 2,8133 2,8102 2,8091

1000 0,001 3,310 3,3082 3,3068 3,3056 3,3044 3,3036 3,3027 3,3002 3,2954 3,2938

Page 267: Libro de estadistica

266

2000 0,001 3,504 3,5018 3,5 3,4983 3,4971 3,496 3,4951 3,4922 3,4863 3,4846

10000 0,000 3,922 3,9197 3,9162 3,915 3,9127 3,9116 3,9104 3,9069 3,8987 3,8953

20000 0,000 4,091 4,0885 4,0862 4,0838 4,0815 4,0792 4,0792 4,0745 4,0652 4,0606

100000 0,000 4,461 4,461 4,4517 4,4517 4,4517 4,4517 4,4517 4,4424 4,4331 4,4238

200000 0,000 4,619 4,6194 4,6194 4,6007 4,6007 4,6007 4,6007 4,5821 4,5821 4,5821

1000000 0,000 4,917 4,9174 4,9174 4,9174 4,9174 4,9174 4,9174 4,9174 4,9174 4,9174

2000000 0,000 5,066 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664 5,0664

Page 268: Libro de estadistica

267

Valores críticos de la distribución t (cola superior)

gl 0,10 0,05 0,025 0,01 0,005 0,001 0,0005

1 3,078 6,314 12,706 31,821 63,657 318,309 636,619

2 1,886 2,920 4,303 6,965 9,925 22,327 31,599

3 1,638 2,353 3,182 4,541 5,841 10,215 12,924

4 1,533 2,132 2,776 3,747 4,604 7,173 8,610

5 1,476 2,015 2,571 3,365 4,032 5,893 6,869

6 1,440 1,943 2,447 3,143 3,707 5,208 5,959

7 1,415 1,895 2,365 2,998 3,499 4,785 5,408

8 1,397 1,860 2,306 2,896 3,355 4,501 5,041

9 1,383 1,833 2,262 2,821 3,250 4,297 4,781

10 1,372 1,812 2,228 2,764 3,169 4,144 4,587

11 1,363 1,796 2,201 2,718 3,106 4,025 4,437

12 1,356 1,782 2,179 2,681 3,055 3,930 4,318

13 1,350 1,771 2,160 2,650 3,012 3,852 4,221

14 1,345 1,761 2,145 2,624 2,977 3,787 4,140

15 1,341 1,753 2,131 2,602 2,947 3,733 4,073

16 1,337 1,746 2,120 2,583 2,921 3,686 4,015

17 1,333 1,740 2,110 2,567 2,898 3,646 3,965

18 1,330 1,734 2,101 2,552 2,878 3,610 3,922

19 1,328 1,729 2,093 2,539 2,861 3,579 3,883

20 1,325 1,725 2,086 2,528 2,845 3,552 3,850

21 1,323 1,721 2,080 2,518 2,831 3,527 3,819

22 1,321 1,717 2,074 2,508 2,819 3,505 3,792

23 1,319 1,714 2,069 2,500 2,807 3,485 3,768

24 1,318 1,711 2,064 2,492 2,797 3,467 3,745

25 1,316 1,708 2,060 2,485 2,787 3,450 3,725

26 1,315 1,706 2,056 2,479 2,779 3,435 3,707

27 1,314 1,703 2,052 2,473 2,771 3,421 3,690

28 1,313 1,701 2,048 2,467 2,763 3,408 3,674

29 1,311 1,699 2,045 2,462 2,756 3,396 3,659

30 1,310 1,697 2,042 2,457 2,750 3,385 3,646

32 1,309 1,694 2,037 2,449 2,738 3,365 3,622

34 1,307 1,691 2,032 2,441 2,728 3,348 3,601

36 1,306 1,688 2,028 2,434 2,719 3,333 3,582

38 1,304 1,686 2,024 2,429 2,712 3,319 3,566

40 1,303 1,684 2,021 2,423 2,704 3,307 3,551

50 1,299 1,676 2,009 2,403 2,678 3,261 3,496

60 1,296 1,671 2,000 2,390 2,660 3,232 3,460

120 1,289 1,658 1,980 2,358 2,617 3,160 3,373

inf 1,282 1,645 1,960 2,326 2,576 3,090 3,291

Page 269: Libro de estadistica

268

alfa = 0,0500 grados de libertad del numerador

1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 248,02 252,20 253,04 254,30

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,45 19,48 19,49 19,50

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,66 8,57 8,55 8,53

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,80 5,69 5,66 5,63

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,56 4,43 4,41 4,37

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 3,87 3,74 3,71 3,67

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,44 3,30 3,27 3,23

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,15 3,01 2,97 2,93

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 2,94 2,79 2,76 2,71

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,77 2,62 2,59 2,54

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,65 2,49 2,46 2,41

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,54 2,38 2,35 2,30

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,46 2,30 2,26 2,21

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,39 2,22 2,19 2,13

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,33 2,16 2,12 2,07

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,28 2,11 2,07 2,01

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,23 2,06 2,02 1,96

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,19 2,02 1,98 1,92

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,16 1,98 1,94 1,88

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,12 1,95 1,91 1,84

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,10 1,92 1,88 1,81

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,07 1,89 1,85 1,78

23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,05 1,86 1,82 1,76

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,03 1,84 1,80 1,73

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,01 1,82 1,78 1,71

26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 1,99 1,80 1,76 1,69

27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 1,97 1,79 1,74 1,67

28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 1,96 1,77 1,73 1,65

29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 1,94 1,75 1,71 1,64

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 1,93 1,74 1,70 1,62

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 1,84 1,64 1,59 1,51

50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,78 1,58 1,52 1,44

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,75 1,53 1,48 1,39

70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,72 1,50 1,45 1,35

80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,70 1,48 1,43 1,33

90 3,95 3,10 2,71 2,47 2,32 2,20 2,11 2,04 1,99 1,94 1,69 1,46 1,41 1,30

100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,68 1,45 1,39 1,28

200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88 1,62 1,39 1,32 1,19

300 3,87 3,03 2,63 2,40 2,24 2,13 2,04 1,97 1,91 1,86 1,61 1,36 1,30 1,15

400 3,86 3,02 2,63 2,39 2,24 2,12 2,03 1,96 1,90 1,85 1,60 1,35 1,28 1,13

500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85 1,59 1,35 1,28 1,12

600 3,86 3,01 2,62 2,39 2,23 2,11 2,02 1,95 1,90 1,85 1,59 1,34 1,27 1,11

700 3,85 3,01 2,62 2,38 2,23 2,11 2,02 1,95 1,89 1,84 1,59 1,34 1,27 1,10

800 3,85 3,01 2,62 2,38 2,23 2,11 2,02 1,95 1,89 1,84 1,58 1,34 1,26 1,09

900 3,85 3,01 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,58 1,33 1,26 1,09

1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,58 1,33 1,26 1,08

1500 3,85 3,00 2,61 2,38 2,22 2,10 2,02 1,94 1,89 1,84 1,58 1,33 1,25 1,07

Page 270: Libro de estadistica

269 2000 3,85 3,00 2,61 2,38 2,22 2,10 2,01 1,94 1,88 1,84 1,58 1,32 1,25 1,06

10000 3,84 3,00 2,61 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,57 1,32 1,25 1,03

alfa = 0,0250 grados de libertad del numerador

1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 647,79 799,48 864,15 899,60 921,83 937,11 948,20 956,64 963,28 968,63 993,08 1009,79 1013,16 1018,23

2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,45 39,48 39,49 39,50

3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,17 13,99 13,96 13,90

4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,56 8,36 8,32 8,26

5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,33 6,12 6,08 6,02

6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,17 4,96 4,92 4,85

7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,47 4,25 4,21 4,14

8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,00 3,78 3,74 3,67

9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,67 3,45 3,40 3,33

10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,42 3,20 3,15 3,08

11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,23 3,00 2,96 2,88

12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,07 2,85 2,80 2,73

13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 2,95 2,72 2,67 2,60

14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 2,84 2,61 2,56 2,49

15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,76 2,52 2,47 2,40

16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,68 2,45 2,40 2,32

17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,62 2,38 2,33 2,25

18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,56 2,32 2,27 2,19

19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,51 2,27 2,22 2,13

20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,46 2,22 2,17 2,09

21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,42 2,18 2,13 2,04

22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,39 2,14 2,09 2,00

23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,36 2,11 2,06 1,97

24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,33 2,08 2,02 1,94

25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,30 2,05 2,00 1,91

26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,28 2,03 1,97 1,88

27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,25 2,00 1,94 1,85

28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,23 1,98 1,92 1,83

29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,21 1,96 1,90 1,81

30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,20 1,94 1,88 1,79

40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,07 1,80 1,74 1,64

50 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 1,99 1,72 1,66 1,55

60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 1,94 1,67 1,60 1,48

70 5,25 3,89 3,31 2,97 2,75 2,59 2,47 2,38 2,30 2,24 1,91 1,63 1,56 1,44

80 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 1,88 1,60 1,53 1,40

90 5,20 3,84 3,26 2,93 2,71 2,55 2,43 2,34 2,26 2,19 1,86 1,58 1,50 1,37

100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 1,85 1,56 1,48 1,35

200 5,10 3,76 3,18 2,85 2,63 2,47 2,35 2,26 2,18 2,11 1,78 1,47 1,39 1,23

300 5,07 3,73 3,16 2,83 2,61 2,45 2,33 2,23 2,16 2,09 1,75 1,45 1,36 1,18

400 5,06 3,72 3,15 2,82 2,60 2,44 2,32 2,22 2,15 2,08 1,74 1,43 1,35 1,16

500 5,05 3,72 3,14 2,81 2,59 2,43 2,31 2,22 2,14 2,07 1,74 1,42 1,34 1,14

600 5,05 3,71 3,14 2,81 2,59 2,43 2,31 2,21 2,13 2,07 1,73 1,42 1,33 1,13

700 5,05 3,71 3,13 2,80 2,58 2,43 2,31 2,21 2,13 2,07 1,73 1,41 1,32 1,12

Page 271: Libro de estadistica

270 800 5,04 3,71 3,13 2,80 2,58 2,42 2,30 2,21 2,13 2,06 1,73 1,41 1,32 1,11

900 5,04 3,70 3,13 2,80 2,58 2,42 2,30 2,21 2,13 2,06 1,72 1,41 1,32 1,10

1000 5,04 3,70 3,13 2,80 2,58 2,42 2,30 2,20 2,13 2,06 1,72 1,41 1,32 1,10

1500 5,03 3,70 3,12 2,79 2,57 2,42 2,30 2,20 2,12 2,06 1,72 1,40 1,31 1,08

2000 5,03 3,70 3,12 2,79 2,57 2,41 2,29 2,20 2,12 2,05 1,72 1,40 1,31 1,07

10000 5,03 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,71 1,39 1,30 1,04

alfa = 0,0100 grados de libertad del numerador

1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 4052,18 4999,34 5403,53 5624,26 5763,96 5858,95 5928,33 5980,95 6022,40 6055,925 6208,662 6312,970 6333,925 6365,590

2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,397 99,448 99,484 99,491 99,499

3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,228 26,690 26,316 26,241 26,126

4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,546 14,019 13,652 13,577 13,464

5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,051 9,553 9,202 9,130 9,022

6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,874 7,396 7,057 6,987 6,881

7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,620 6,155 5,824 5,755 5,651

8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,814 5,359 5,032 4,963 4,860

9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,257 4,808 4,483 4,415 4,312

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,849 4,405 4,082 4,014 3,910

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,539 4,099 3,776 3,708 3,604

12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,296 3,858 3,535 3,467 3,362

13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,100 3,665 3,341 3,272 3,166

14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,939 3,505 3,181 3,112 3,005

15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,805 3,372 3,047 2,977 2,870

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,691 3,259 2,933 2,863 2,754

17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,593 3,162 2,835 2,764 2,654

18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,508 3,077 2,749 2,678 2,567

19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,434 3,003 2,674 2,602 2,490

20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,368 2,938 2,608 2,535 2,422

21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,310 2,880 2,548 2,476 2,361

22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,258 2,827 2,495 2,422 2,307

23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,211 2,780 2,447 2,373 2,257

24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,168 2,738 2,403 2,329 2,212

25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,129 2,699 2,364 2,289 2,171

26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,094 2,664 2,327 2,252 2,133

27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,062 2,632 2,294 2,218 2,098

28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,032 2,602 2,263 2,187 2,065

29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,005 2,574 2,234 2,158 2,035

30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,979 2,549 2,208 2,131 2,008

40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,801 2,369 2,019 1,938 1,806

50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,698 2,265 1,909 1,825 1,685

60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,632 2,198 1,836 1,749 1,602

70 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,585 2,150 1,785 1,695 1,542

80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,551 2,115 1,746 1,655 1,496

90 6,93 4,85 4,01 3,53 3,23 3,01 2,84 2,72 2,61 2,524 2,088 1,716 1,623 1,459

100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,503 2,067 1,692 1,598 1,429

200 6,76 4,71 3,88 3,41 3,11 2,89 2,73 2,60 2,50 2,411 1,971 1,583 1,481 1,281

300 6,72 4,68 3,85 3,38 3,08 2,86 2,70 2,57 2,47 2,380 1,940 1,547 1,441 1,223

Page 272: Libro de estadistica

271 400 6,70 4,66 3,83 3,37 3,06 2,85 2,68 2,56 2,45 2,365 1,925 1,528 1,421 1,190

500 6,69 4,65 3,82 3,36 3,05 2,84 2,68 2,55 2,44 2,356 1,915 1,517 1,408 1,168

600 6,68 4,64 3,81 3,35 3,05 2,83 2,67 2,54 2,44 2,351 1,909 1,510 1,400 1,153

700 6,67 4,64 3,81 3,35 3,04 2,83 2,66 2,54 2,43 2,346 1,905 1,505 1,394 1,141

800 6,67 4,63 3,81 3,34 3,04 2,82 2,66 2,53 2,43 2,343 1,901 1,501 1,390 1,132

900 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43 2,341 1,899 1,498 1,386 1,124

1000 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43 2,339 1,897 1,495 1,383 1,118

1500 6,65 4,62 3,79 3,33 3,03 2,81 2,65 2,52 2,42 2,333 1,891 1,488 1,375 1,097

2000 6,65 4,62 3,79 3,33 3,03 2,81 2,65 2,52 2,42 2,330 1,888 1,484 1,371 1,085

10000 6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,323 1,880 1,475 1,361 1,048

alfa = 0,0050 grados de libertad del numerador

1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 16212,46 19997,36 21614,13 22500,75 23055,82 23439,53 23715,20 23923,81 24091,45 24221,84 24836,51 25253,74 25339,42 25466,08

2 198,50 199,01 199,16 199,24 199,30 199,33 199,36 199,38 199,39 199,39 199,45 199,48 199,48 199,51

3 55,55 49,80 47,47 46,20 45,39 44,84 44,43 44,13 43,88 43,68 42,78 42,15 42,02 41,83

4 31,33 26,28 24,26 23,15 22,46 21,98 21,62 21,35 21,14 20,97 20,17 19,61 19,50 19,33

5 22,78 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 12,90 12,40 12,30 12,15

6 18,63 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 9,59 9,12 9,03 8,88

7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 7,75 7,31 7,22 7,08

8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 6,61 6,18 6,09 5,95

9 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,54 6,42 5,83 5,41 5,32 5,19

10 12,83 9,43 8,08 7,34 6,87 6,54 6,30 6,12 5,97 5,85 5,27 4,86 4,77 4,64

11 12,23 8,91 7,60 6,88 6,42 6,10 5,86 5,68 5,54 5,42 4,86 4,45 4,36 4,23

12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,53 4,12 4,04 3,91

13 11,37 8,19 6,93 6,23 5,79 5,48 5,25 5,08 4,94 4,82 4,27 3,87 3,78 3,65

14 11,06 7,92 6,68 6,00 5,56 5,26 5,03 4,86 4,72 4,60 4,06 3,66 3,57 3,44

15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 3,88 3,48 3,39 3,26

16 10,58 7,51 6,30 5,64 5,21 4,91 4,69 4,52 4,38 4,27 3,73 3,33 3,25 3,11

17 10,38 7,35 6,16 5,50 5,07 4,78 4,56 4,39 4,25 4,14 3,61 3,21 3,12 2,99

18 10,22 7,21 6,03 5,37 4,96 4,66 4,44 4,28 4,14 4,03 3,50 3,10 3,01 2,87

19 10,07 7,09 5,92 5,27 4,85 4,56 4,34 4,18 4,04 3,93 3,40 3,00 2,91 2,78

20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,32 2,92 2,83 2,69

21 9,83 6,89 5,73 5,09 4,68 4,39 4,18 4,01 3,88 3,77 3,24 2,84 2,75 2,62

22 9,73 6,81 5,65 5,02 4,61 4,32 4,11 3,94 3,81 3,70 3,18 2,77 2,69 2,55

23 9,63 6,73 5,58 4,95 4,54 4,26 4,05 3,88 3,75 3,64 3,12 2,71 2,62 2,49

24 9,55 6,66 5,52 4,89 4,49 4,20 3,99 3,83 3,69 3,59 3,06 2,66 2,57 2,43

25 9,48 6,60 5,46 4,84 4,43 4,15 3,94 3,78 3,64 3,54 3,01 2,61 2,52 2,38

26 9,41 6,54 5,41 4,79 4,38 4,10 3,89 3,73 3,60 3,49 2,97 2,56 2,47 2,33

27 9,34 6,49 5,36 4,74 4,34 4,06 3,85 3,69 3,56 3,45 2,93 2,52 2,43 2,29

28 9,28 6,44 5,32 4,70 4,30 4,02 3,81 3,65 3,52 3,41 2,89 2,48 2,39 2,25

29 9,23 6,40 5,28 4,66 4,26 3,98 3,77 3,61 3,48 3,38 2,86 2,45 2,36 2,21

30 9,18 6,35 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 2,82 2,42 2,32 2,18

40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 2,60 2,18 2,09 1,93

50 8,63 5,90 4,83 4,23 3,85 3,58 3,38 3,22 3,09 2,99 2,47 2,05 1,95 1,79

60 8,49 5,79 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,39 1,96 1,86 1,69

70 8,40 5,72 4,66 4,08 3,70 3,43 3,23 3,08 2,95 2,85 2,33 1,90 1,80 1,62

80 8,33 5,67 4,61 4,03 3,65 3,39 3,19 3,03 2,91 2,80 2,29 1,85 1,75 1,57

Page 273: Libro de estadistica

272 90 8,28 5,62 4,57 3,99 3,62 3,35 3,15 3,00 2,87 2,77 2,25 1,82 1,71 1,52

100 8,24 5,59 4,54 3,96 3,59 3,33 3,13 2,97 2,85 2,74 2,23 1,79 1,68 1,49

200 8,06 5,44 4,41 3,84 3,47 3,21 3,01 2,86 2,73 2,63 2,11 1,66 1,54 1,32

300 8,00 5,39 4,36 3,80 3,43 3,17 2,97 2,82 2,69 2,59 2,07 1,62 1,50 1,25

400 7,97 5,37 4,34 3,78 3,41 3,15 2,95 2,80 2,68 2,57 2,06 1,60 1,47 1,21

500 7,95 5,35 4,33 3,76 3,40 3,14 2,94 2,79 2,66 2,56 2,04 1,58 1,46 1,19

600 7,94 5,35 4,32 3,76 3,39 3,13 2,93 2,78 2,66 2,56 2,04 1,58 1,45 1,17

700 7,93 5,34 4,32 3,75 3,38 3,12 2,93 2,78 2,65 2,55 2,03 1,57 1,44 1,16

800 7,92 5,33 4,31 3,75 3,38 3,12 2,92 2,77 2,65 2,55 2,03 1,56 1,44 1,15

900 7,92 5,33 4,31 3,74 3,38 3,12 2,92 2,77 2,65 2,54 2,02 1,56 1,43 1,14

1000 7,91 5,33 4,30 3,74 3,37 3,11 2,92 2,77 2,64 2,54 2,02 1,56 1,43 1,13

1500 7,90 5,32 4,30 3,73 3,37 3,11 2,91 2,76 2,64 2,53 2,01 1,55 1,42 1,11

2000 7,90 5,31 4,29 3,73 3,36 3,10 2,91 2,76 2,63 2,53 2,01 1,55 1,42 1,09

10000 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,75 2,62 2,52 2,00 1,54 1,40 1,05

alfa = 0,0010 grados de libertad del numerador

1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 405311,58 499725,34 540256,50 562667,85 576496,12 586032,87 593185,42 597953,80 602245,33 605583,19 620841,98 631332,40 633239,75 636577,61

2 998,38 998,84 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31 999,31

3 167,06 148,49 141,10 137,08 134,58 132,83 131,61 130,62 129,86 129,22 126,43 124,45 124,07 123,46

4 74,13 61,25 56,17 53,43 51,72 50,52 49,65 49,00 48,47 48,05 46,10 44,75 44,47 44,05

5 47,18 37,12 33,20 31,08 29,75 28,83 28,17 27,65 27,24 26,91 25,39 24,33 24,11 23,79

6 35,51 27,00 23,71 21,92 20,80 20,03 19,46 19,03 18,69 18,41 17,12 16,21 16,03 15,75

7 29,25 21,69 18,77 17,20 16,21 15,52 15,02 14,63 14,33 14,08 12,93 12,12 11,95 11,70

8 25,41 18,49 15,83 14,39 13,48 12,86 12,40 12,05 11,77 11,54 10,48 9,73 9,57 9,34

9 22,86 16,39 13,90 12,56 11,71 11,13 10,70 10,37 10,11 9,89 8,90 8,19 8,04 7,82

10 21,04 14,90 12,55 11,28 10,48 9,93 9,52 9,20 8,96 8,75 7,80 7,12 6,98 6,76

11 19,69 13,81 11,56 10,35 9,58 9,05 8,65 8,35 8,12 7,92 7,01 6,35 6,21 6,00

12 18,64 12,97 10,80 9,63 8,89 8,38 8,00 7,71 7,48 7,29 6,40 5,76 5,63 5,42

13 17,82 12,31 10,21 9,07 8,35 7,86 7,49 7,21 6,98 6,80 5,93 5,30 5,17 4,97

14 17,14 11,78 9,73 8,62 7,92 7,44 7,08 6,80 6,58 6,40 5,56 4,94 4,81 4,61

15 16,59 11,34 9,34 8,25 7,57 7,09 6,74 6,47 6,26 6,08 5,25 4,64 4,51 4,31

16 16,12 10,97 9,01 7,94 7,27 6,80 6,46 6,20 5,98 5,81 4,99 4,39 4,26 4,06

17 15,72 10,66 8,73 7,68 7,02 6,56 6,22 5,96 5,75 5,58 4,78 4,18 4,05 3,85

18 15,38 10,39 8,49 7,46 6,81 6,35 6,02 5,76 5,56 5,39 4,59 4,00 3,87 3,67

19 15,08 10,16 8,28 7,27 6,62 6,18 5,85 5,59 5,39 5,22 4,43 3,84 3,71 3,52

20 14,82 9,95 8,10 7,10 6,46 6,02 5,69 5,44 5,24 5,08 4,29 3,70 3,58 3,38

21 14,59 9,77 7,94 6,95 6,32 5,88 5,56 5,31 5,11 4,95 4,17 3,58 3,46 3,26

22 14,38 9,61 7,80 6,81 6,19 5,76 5,44 5,19 4,99 4,83 4,06 3,48 3,35 3,15

23 14,20 9,47 7,67 6,70 6,08 5,65 5,33 5,09 4,89 4,73 3,96 3,38 3,25 3,06

24 14,03 9,34 7,55 6,59 5,98 5,55 5,24 4,99 4,80 4,64 3,87 3,29 3,17 2,97

25 13,88 9,22 7,45 6,49 5,89 5,46 5,15 4,91 4,71 4,56 3,79 3,22 3,09 2,89

26 13,74 9,12 7,36 6,41 5,80 5,38 5,07 4,83 4,64 4,48 3,72 3,15 3,02 2,82

27 13,61 9,02 7,27 6,33 5,73 5,31 5,00 4,76 4,57 4,41 3,66 3,08 2,96 2,76

28 13,50 8,93 7,19 6,25 5,66 5,24 4,93 4,69 4,50 4,35 3,60 3,02 2,90 2,70

29 13,39 8,85 7,12 6,19 5,59 5,18 4,87 4,64 4,45 4,29 3,54 2,97 2,84 2,64

30 13,29 8,77 7,05 6,12 5,53 5,12 4,82 4,58 4,39 4,24 3,49 2,92 2,79 2,59

40 12,61 8,25 6,59 5,70 5,13 4,73 4,44 4,21 4,02 3,87 3,15 2,57 2,44 2,23

Page 274: Libro de estadistica

273 50 12,22 7,96 6,34 5,46 4,90 4,51 4,22 4,00 3,82 3,67 2,95 2,38 2,25 2,03

60 11,97 7,77 6,17 5,31 4,76 4,37 4,09 3,86 3,69 3,54 2,83 2,25 2,12 1,89

70 11,80 7,64 6,06 5,20 4,66 4,28 3,99 3,77 3,60 3,45 2,74 2,16 2,03 1,80

80 11,67 7,54 5,97 5,12 4,58 4,20 3,92 3,70 3,53 3,39 2,68 2,10 1,96 1,72

90 11,57 7,47 5,91 5,06 4,53 4,15 3,87 3,65 3,48 3,34 2,63 2,05 1,91 1,66

100 11,50 7,41 5,86 5,02 4,48 4,11 3,83 3,61 3,44 3,30 2,59 2,01 1,87 1,62

200 11,15 7,15 5,63 4,81 4,29 3,92 3,65 3,43 3,26 3,12 2,42 1,83 1,68 1,39

300 11,04 7,07 5,56 4,75 4,22 3,86 3,59 3,38 3,21 3,07 2,37 1,78 1,62 1,31

400 10,99 7,03 5,53 4,71 4,19 3,83 3,56 3,35 3,18 3,04 2,34 1,75 1,59 1,26

500 10,96 7,00 5,51 4,69 4,18 3,81 3,54 3,33 3,16 3,02 2,33 1,73 1,57 1,23

600 10,93 6,99 5,49 4,68 4,16 3,80 3,53 3,32 3,15 3,01 2,32 1,72 1,56 1,21

700 10,92 6,98 5,48 4,67 4,15 3,79 3,52 3,31 3,14 3,00 2,31 1,71 1,55 1,19

800 10,91 6,97 5,47 4,66 4,15 3,79 3,52 3,31 3,14 3,00 2,30 1,70 1,54 1,18

900 10,90 6,96 5,47 4,66 4,14 3,78 3,51 3,30 3,13 2,99 2,30 1,70 1,54 1,17

1000 10,89 6,96 5,46 4,65 4,14 3,78 3,51 3,30 3,13 2,99 2,30 1,69 1,53 1,16

1500 10,87 6,94 5,45 4,64 4,13 3,77 3,50 3,29 3,12 2,98 2,29 1,68 1,52 1,13

2000 10,86 6,93 5,44 4,64 4,12 3,76 3,49 3,28 3,11 2,97 2,28 1,68 1,51 1,11

10000 10,83 6,91 5,43 4,62 4,11 3,75 3,48 3,27 3,10 2,96 2,27 1,66 1,50 1,06

alfa = 0,0005 grados de libertad del numerador

1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 1621246,34 1998901,37 2159118,65 2250671,39 2304077,15 2342224,12 2372741,70 2391815,19 2410888,67 2422332,76 2483367,92 2525329,59 2532958,98 2548217,77

2 1998,62 1998,62 1998,62 1998,62 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48 2000,48

3 266,59 236,56 224,68 218,28 214,20 211,41 209,31 207,80 206,64 205,59 201,05 197,91 197,32 196,39

4 106,23 87,43 80,09 76,14 73,63 71,92 70,66 69,70 68,95 68,34 65,54 63,56 63,18 62,57

5 63,62 49,78 44,41 41,53 39,73 38,48 37,56 36,86 36,31 35,86 33,80 32,36 32,06 31,62

6 46,07 34,79 30,46 28,11 26,64 25,63 24,89 24,32 23,88 23,52 21,83 20,65 20,41 20,05

7 36,99 27,20 23,46 21,44 20,17 19,30 18,66 18,17 17,78 17,47 16,00 14,97 14,76 14,44

8 31,56 22,75 19,39 17,58 16,44 15,66 15,08 14,64 14,29 14,01 12,69 11,75 11,56 11,26

9 27,99 19,86 16,77 15,10 14,06 13,34 12,81 12,40 12,07 11,82 10,59 9,72 9,54 9,27

10 25,49 17,87 14,97 13,41 12,42 11,75 11,25 10,87 10,56 10,32 9,16 8,34 8,17 7,91

11 23,65 16,41 13,65 12,18 11,24 10,60 10,13 9,76 9,48 9,24 8,14 7,35 7,19 6,93

12 22,24 15,30 12,66 11,25 10,35 9,74 9,28 8,93 8,66 8,43 7,37 6,61 6,45 6,21

13 21,14 14,43 11,89 10,52 9,66 9,07 8,63 8,29 8,03 7,81 6,78 6,04 5,88 5,64

14 20,24 13,73 11,27 9,95 9,11 8,53 8,11 7,78 7,52 7,31 6,31 5,58 5,43 5,19

15 19,51 13,16 10,76 9,48 8,66 8,10 7,68 7,37 7,11 6,90 5,93 5,21 5,06 4,83

16 18,89 12,69 10,34 9,08 8,29 7,74 7,33 7,02 6,77 6,57 5,61 4,91 4,76 4,53

17 18,37 12,29 9,99 8,75 7,97 7,43 7,04 6,73 6,49 6,29 5,34 4,65 4,50 4,27

18 17,92 11,94 9,69 8,47 7,71 7,18 6,78 6,48 6,24 6,05 5,12 4,43 4,28 4,06

19 17,53 11,65 9,42 8,23 7,48 6,95 6,57 6,27 6,03 5,84 4,92 4,24 4,10 3,87

20 17,19 11,39 9,19 8,02 7,27 6,76 6,38 6,09 5,85 5,66 4,75 4,08 3,93 3,71

21 16,89 11,16 8,99 7,83 7,10 6,59 6,21 5,92 5,69 5,50 4,60 3,93 3,79 3,56

22 16,62 10,95 8,82 7,67 6,94 6,44 6,07 5,78 5,55 5,36 4,47 3,81 3,66 3,44

23 16,38 10,77 8,66 7,52 6,80 6,30 5,94 5,65 5,43 5,24 4,36 3,69 3,55 3,32

24 16,17 10,61 8,51 7,39 6,68 6,18 5,82 5,54 5,31 5,13 4,25 3,59 3,45 3,22

25 15,97 10,46 8,39 7,27 6,56 6,07 5,71 5,43 5,21 5,03 4,16 3,50 3,36 3,13

26 15,80 10,33 8,27 7,16 6,46 5,98 5,62 5,34 5,12 4,94 4,07 3,42 3,27 3,05

27 15,63 10,21 8,16 7,06 6,37 5,89 5,53 5,26 5,03 4,86 3,99 3,34 3,20 2,97

Page 275: Libro de estadistica

274 28 15,48 10,10 8,07 6,97 6,28 5,81 5,45 5,18 4,96 4,78 3,92 3,27 3,13 2,90

29 15,35 9,99 7,98 6,89 6,21 5,73 5,38 5,11 4,89 4,71 3,86 3,21 3,06 2,84

30 15,22 9,90 7,89 6,82 6,14 5,66 5,31 5,04 4,82 4,65 3,80 3,15 3,01 2,78

40 14,35 9,25 7,33 6,30 5,64 5,19 4,85 4,59 4,38 4,21 3,39 2,75 2,60 2,37

50 13,86 8,88 7,01 6,01 5,37 4,93 4,60 4,34 4,14 3,97 3,16 2,52 2,37 2,13

60 13,55 8,65 6,81 5,82 5,20 4,76 4,44 4,19 3,98 3,82 3,02 2,38 2,23 1,98

70 13,33 8,49 6,67 5,70 5,08 4,64 4,32 4,08 3,88 3,71 2,92 2,28 2,13 1,87

80 13,17 8,37 6,57 5,60 4,99 4,56 4,24 4,00 3,80 3,64 2,85 2,20 2,05 1,79

90 13,05 8,28 6,49 5,53 4,92 4,50 4,18 3,94 3,74 3,58 2,79 2,15 1,99 1,72

100 12,95 8,21 6,43 5,48 4,87 4,45 4,13 3,89 3,69 3,53 2,75 2,10 1,95 1,67

200 12,52 7,90 6,16 5,23 4,64 4,23 3,92 3,68 3,49 3,33 2,55 1,90 1,74 1,43

300 12,38 7,80 6,08 5,15 4,56 4,15 3,85 3,61 3,42 3,27 2,49 1,84 1,67 1,33

400 12,32 7,75 6,04 5,11 4,53 4,12 3,82 3,58 3,39 3,24 2,46 1,81 1,64 1,28

500 12,28 7,72 6,01 5,09 4,51 4,10 3,80 3,56 3,37 3,22 2,45 1,79 1,62 1,25

600 12,25 7,70 5,99 5,07 4,49 4,08 3,78 3,55 3,36 3,20 2,43 1,78 1,60 1,22

700 12,23 7,68 5,98 5,06 4,48 4,08 3,77 3,54 3,35 3,20 2,43 1,77 1,59 1,21

800 12,22 7,67 5,97 5,06 4,47 4,07 3,77 3,53 3,34 3,19 2,42 1,76 1,58 1,19

900 12,21 7,67 5,97 5,05 4,47 4,06 3,76 3,53 3,34 3,18 2,41 1,75 1,58 1,18

1000 12,19 7,66 5,96 5,04 4,46 4,06 3,76 3,52 3,33 3,18 2,41 1,75 1,57 1,17

1500 12,17 7,64 5,94 5,03 4,45 4,04 3,74 3,51 3,32 3,17 2,40 1,74 1,56 1,14

2000 12,15 7,63 5,93 5,02 4,44 4,04 3,74 3,50 3,31 3,16 2,39 1,73 1,55 1,12

10000 12,12 7,61 5,92 5,00 4,43 4,02 3,72 3,49 3,30 3,15 2,38 1,72 1,54 1,07

alfa = 0,0001 grados de libertad del numerador

1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0 20,0 60,0 100,0 10000,0

1 40527343,75 49804687,50 54199218,75 56152343,75 57617187,50 58593750,00 59570312,50 59570312,50 60546875,00 60546875,00 62011718,75 63476562,50 63476562,50 63476562,50

2 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58 10013,58

3 784,17 694,77 659,38 640,75 627,71 620,26 614,67 609,08 605,36 603,50 588,60 581,15 577,42 575,56

4 241,68 197,91 181,14 171,83 166,24 162,05 159,26 156,93 155,53 154,13 147,61 142,96 142,03 140,63

5 124,80 97,09 86,38 80,56 76,83 74,51 72,64 71,25 70,08 69,27 65,19 62,28 61,70 60,89

6 82,42 61,58 53,67 49,42 46,74 44,94 43,54 42,55 41,73 41,09 38,07 35,91 35,51 34,81

7 62,17 45,17 38,65 35,22 33,06 31,55 30,50 29,63 28,99 28,46 25,96 24,24 23,87 23,34

8 50,70 35,97 30,44 27,47 25,64 24,36 23,43 22,70 22,15 21,68 19,56 18,04 17,72 17,26

9 43,48 30,33 25,41 22,76 21,10 19,97 19,15 18,51 17,99 17,58 15,69 14,32 14,04 13,62

10 38,59 26,54 22,03 19,63 18,13 17,08 16,33 15,75 15,28 14,90 13,15 11,90 11,64 11,25

11 35,04 23,87 19,66 17,42 16,02 15,05 14,35 13,80 13,37 13,02 11,39 10,22 9,98 9,60

12 32,42 21,86 17,90 15,79 14,46 13,56 12,89 12,38 11,98 11,64 10,10 8,99 8,76 8,41

13 30,38 20,31 16,56 14,55 13,29 12,43 11,79 11,31 10,91 10,60 9,12 8,06 7,84 7,50

14 28,75 19,09 15,48 13,58 12,37 11,54 10,93 10,46 10,08 9,79 8,37 7,34 7,12 6,80

15 27,44 18,10 14,64 12,78 11,63 10,82 10,23 9,78 9,42 9,13 7,76 6,76 6,56 6,23

16 26,37 17,30 13,93 12,14 11,02 10,23 9,66 9,23 8,88 8,60 7,26 6,29 6,09 5,77

17 25,44 16,62 13,34 11,60 10,51 9,75 9,19 8,77 8,43 8,15 6,85 5,90 5,70 5,39

18 24,65 16,04 12,85 11,15 10,07 9,34 8,79 8,37 8,05 7,78 6,50 5,57 5,37 5,07

19 23,98 15,54 12,42 10,75 9,71 8,99 8,45 8,05 7,72 7,46 6,21 5,29 5,09 4,79

20 23,40 15,12 12,05 10,42 9,39 8,68 8,16 7,76 7,44 7,18 5,95 5,05 4,85 4,55

21 22,88 14,74 11,73 10,12 9,11 8,41 7,90 7,51 7,20 6,94 5,73 4,83 4,64 4,35

22 22,44 14,41 11,44 9,86 8,87 8,18 7,68 7,29 6,98 6,73 5,53 4,65 4,46 4,17

23 22,03 14,12 11,19 9,63 8,65 7,97 7,48 7,09 6,79 6,54 5,36 4,49 4,30 4,00

Page 276: Libro de estadistica

275 24 21,65 13,85 10,96 9,42 8,45 7,79 7,30 6,92 6,62 6,37 5,21 4,34 4,15 3,86

25 21,33 13,62 10,76 9,24 8,29 7,63 7,14 6,77 6,47 6,22 5,07 4,21 4,02 3,73

26 21,04 13,40 10,58 9,07 8,13 7,47 6,99 6,62 6,33 6,09 4,95 4,09 3,90 3,61

27 20,78 13,21 10,41 8,92 7,99 7,34 6,86 6,50 6,21 5,97 4,83 3,98 3,80 3,51

28 20,52 13,03 10,26 8,78 7,86 7,22 6,74 6,38 6,09 5,86 4,73 3,89 3,70 3,41

29 20,30 12,86 10,12 8,66 7,74 7,10 6,64 6,28 5,99 5,76 4,64 3,80 3,61 3,33

30 20,10 12,72 10,00 8,54 7,63 7,00 6,54 6,18 5,90 5,66 4,55 3,72 3,53 3,24

40 18,67 11,70 9,13 7,76 6,90 6,30 5,86 5,53 5,26 5,03 3,98 3,16 2,98 2,69

50 17,88 11,13 8,65 7,33 6,50 5,92 5,50 5,17 4,91 4,69 3,66 2,86 2,68 2,38

60 17,37 10,78 8,35 7,06 6,25 5,68 5,27 4,95 4,69 4,48 3,47 2,67 2,49 2,19

70 17,03 10,54 8,15 6,88 6,08 5,52 5,11 4,79 4,54 4,33 3,33 2,54 2,36 2,05

80 16,78 10,35 8,00 6,74 5,95 5,40 4,99 4,68 4,43 4,23 3,24 2,45 2,26 1,94

90 16,59 10,22 7,88 6,64 5,85 5,31 4,91 4,60 4,35 4,15 3,16 2,37 2,18 1,86

100 16,43 10,11 7,79 6,56 5,78 5,24 4,84 4,53 4,29 4,08 3,10 2,32 2,13 1,80

200 15,76 9,65 7,40 6,21 5,45 4,93 4,54 4,25 4,01 3,81 2,85 2,06 1,87 1,50

300 15,56 9,50 7,28 6,09 5,35 4,83 4,45 4,15 3,92 3,72 2,77 1,98 1,78 1,39

400 15,45 9,43 7,22 6,04 5,30 4,78 4,40 4,11 3,87 3,68 2,73 1,94 1,74 1,33

500 15,38 9,38 7,18 6,01 5,27 4,75 4,38 4,08 3,85 3,66 2,71 1,92 1,71 1,29

600 15,34 9,35 7,16 5,98 5,25 4,74 4,36 4,07 3,83 3,64 2,69 1,90 1,70 1,26

700 15,31 9,34 7,14 5,97 5,23 4,72 4,35 4,05 3,82 3,63 2,68 1,89 1,69 1,24

800 15,29 9,32 7,12 5,96 5,22 4,71 4,33 4,04 3,81 3,62 2,68 1,88 1,68 1,22

900 15,27 9,31 7,12 5,95 5,21 4,70 4,33 4,04 3,80 3,61 2,67 1,88 1,67 1,21

1000 15,26 9,30 7,11 5,94 5,21 4,70 4,32 4,03 3,80 3,61 2,66 1,87 1,66 1,20

1500 15,22 9,27 7,08 5,92 5,19 4,68 4,30 4,01 3,78 3,59 2,65 1,86 1,65 1,16

2000 15,20 9,26 7,07 5,91 5,18 4,67 4,29 4,00 3,77 3,58 2,64 1,85 1,64 1,14

10000 15,15 9,22 7,04 5,88 5,16 4,65 4,27 3,98 3,75 3,56 2,62 1,83 1,62 1,08