1
IDENTIFICACIÓN DE LA ASIGNATURA
Sigla : EXT – 108
Nombre de la Asignatura : Probabilidad y Estadística
Horas Técnicas : 15 Horas
Horas Practicas : 45 Horas
Pre-requisitos : Elementos de aritmética, calculo I, Calculo II,
Matemática Superior.
Carrera : Ingeniería de Sistemas, electrónica, redes y
telecomunicaciones, informática, sistemas, y
mecánica automotriz.
I. OBJETIVOS DE LA ASIGNATURA
El estudiante adquiere herramientas que le brindaran la capacidad de recolectar, organizar y analizar datos, para poder determinar conclusiones válidas y tomar decisiones razonables basadas en tal análisis. Valora los métodos y técnicas estadísticas generales y propias del campo de la especialidad en el aprendizaje del profesional en formación. Resume e interpreta la información contenida en un conjunto de datos observados.
II. PLAN TEMÁTICO
Para lograr el objetivo general de la materia, el contenido está estructurado en 7 temas, que son los siguientes:
TEMA CONTENIDO DE LA MATERIA Horas Teóricas
Horas Prácticas
# de Clases
Unidad I Datos y distribución de frecuencias 3 6 3
Unidad II Medidas de tendencia central, medidas de dispersión
2 3 2
Unidad III Dispersión final y medidas de forma 2 3 2
Unidad IV Regresión y Correlación lineal 2 3 2
Unidad V Elementos de probabilidad 2 4 2
Unidad VI Variables aleatorias y funciones de probabilidad
2 6 2
Unidad VII Distribuciones de probabilidades 3 4 2
Unidad VIII Teoría de muestreo 2 4 2
2
Las clases restantes se toman para la defensa del proyecto final y las evaluaciones
correspondientes.
PLAN TEMATICO
Unidad Temas
I Datos y Distribución de frecuencia
Presentación de la materia y las actividades
Conceptos Básicos
Elaboración y tabulación de encuestas
Procesamiento de datos
Cuadro de distribución de frecuencias (CDF)
Gráficos y interpretaciones
II Medidas de tendencia Central, medidas de dispersión
Determinar matemáticamente y explicar las medidas de tendencia central
Media , Mediana , Moda
Fractales
Interpretación de todas las medidas de tendencia central
Utilidades de las medidas de dispersión y como se determinan matemáticamente con sus respectivas interpretaciones
III Dispersión final y medidas de formas
Primer examen parcial
Medidas de formas , Utilidad y interpretación
IV Regresión y correlación lineal
Regresión y correlación Línea
Defensa de proyectos
Examen final
V Elementos de probabilidad
Presentación de la materia
Definiciones básicas
Tipos de probabilidad
Reglas de probabilidad
Teorema de bayes
VI Variables aleatorias y funciones de probabilidad
Interpretación de variables aleatorias
Función de probabilidades
Distribución normal
VII Distribuciones de probabilidades
Distribución Binominal
Distribución de Poisson
Distribución Normal
VIII Teorema de muestreo
Tipos de muestreo
Calculo para determinar el tamaño de la muestra
3
III. ORIENTACIONES PARA LA ORGANIZACIÓN DEL TRABAJO DE APRENDIZAJE
DURANTE EL DESARROLLO DE LA MATERIA
El objetivo principal del presente material, es brindar las herramientas y facilitar a los estudiantes de manera didáctica, su formación académica en el área de Estadística. Siendo la Estadística, una disciplina practica en todas las áreas, se ha procurado ilustrar los conceptos con problemas y ejercicios aplicables en distintos campos, como ingeniería, economía, administración, etc. Cada una de las unidades se caracteriza por ser presentadas en aspecto sencillo y práctico, que facilitaran el aprendizaje y el análisis que enriquecerán el aprendizaje y conocimientos de los estudiantes. Así también es importante indicar que la combinación de teoría y práctica, serán de vital importancia para el aprendizaje y la aplicación de la Probabilidad y Estadística. Esperando sea de su máximo aprovechamiento y deseándoles muchos éxitos siempre a su disposición. A continuación se presentan algunas normas básicas de comportamiento y recomendaciones,
a tomar en cuenta:
a) El proceso de aprendizaje durante toda la materia es “integral”.-
La misión de la UTEPSA es “lograr que cada estudiante desarrolle una experiencia académica
de calidad, excelencia, con valores, responsabilidad social, innovación, competitividad, y
habilidades emprendedoras”. Por esto no te sorprendas si además de ser evaluado en
contenidos propios de la materia, el docente evalúa también aspectos como puntualidad, pro
actividad, ortografía, etc. Nunca pierdas de vista que lo se te exige es por tu propio beneficio.
b) Asistencia y puntualidad.-
Asistir a clases y hacerlo de manera puntual, es una manera de demostrar que somos
responsables:
Tu asistencia es importante en TODAS las clases. Por si surgiera un caso de fuerza mayor,
en el reglamento de la Universidad se contemplan tres faltas por módulo (Art. 13 Inc. B y C
del Reglamento Estudiantil UPTESA). Si sobrepasas esta cantidad de faltas PERDERAS
EL DERECHO A TOMAR LA EVALUACIÓN FINAL de la materia. Se considera “asistencia”
estar al inicio, durante y al final de la clase.
Esfuérzate por estar en la clase a la hora de inicio. Se dará un margen de 10 minutos de
tolerancia. después de estos, podrás entrar tan pronto como el docente considere que tu
ingreso no será una distracción para la clase o después de la hora de descanso, de esta
manera no perjudicaremos el avance de la clase distrayendo a los compañeros.
Si te retiras de la clase antes de que esta termine, tampoco registraras asistencia completa.
4
Ten especial cuidado con la asistencia y la puntualidad los días de evaluación.
Normalmente la fecha de pruebas, es comunicada con varios días de antelación, esto te
permite programarlos como ocasiones a las que tienes que darles una espacial atención.
Si confirmas la materia el 2do o 3er día de clases, ya tienes acumuladas automáticamente
las faltas de los días que no has asistido. Favor tómalo en cuenta.
c) Comportamiento en clases.-
Los estudiantes y los docentes, evitamos beber y comer en el aula. De ninguna manera
podemos fumar dentro de esta.
A fin de evitar interrupciones, los celulares se apagarán al entrar al aula o se pondrán en
modo silencioso para atender llamadas o mensajes SOLO en caso de emergencia.
Cualquier falta de respeto a los compañeros, al docente, al personal de apoyo o al
personal administrativo, será severamente sancionada de acuerdo al reglamento
de la Universidad. En todo caso confiamos en que todos respetaremos las normas
de conducta adecuadas
V OBJETIVOS Y ACTIVIDADES DE CADA TEMA
Unidad 1. DATOS Y DISTRIBUCION DE FRECUENCIAS
A. Objetivos:
Al concluir el tema debe ser capaz de:
Lograr que el estudiante comprenda la importancia y uso de la ciencia Estadística en las
actividades cotidianas.
Motivar a los estudiantes a la investigación y la comprensión de los diferentes términos
usados en la estadística
Lograr que el estudiante adquiera la habilidad para organizar y agrupar los datos
desordenados representar y determinar el número de categorías para reunir e interpretar la
información, realizando prácticas después de haber resuelto como actividad dinámica en
clases cuatro ejercicios de distribución de frecuencias completo.
Lograr que el estudiante identifique sin problemas entre variables estadísticas cualitativas,
cuantitativas continuas y cuantitativas discretas que se utilizan en Estadística
Reconocer la necesidad de tomar muestras y valorar la representatividad de éstas.
Comprender el concepto de encuestas e identificar sus fases.
B. Actividades de aprendizaje:
PROBLEMA ABP
5
1.-Un nuevo aditivo para la gasolina ha sido aprobado para 50 carros y el promedio de consumo en kilómetros por litro se da en la siguiente tabla: 8.5 9.6 8.7 7.1 7.9 6.9 8.6 7.4 8.9 10.1 6.9 9.4 5.7 9.2 8 6.4 9.7 10.4 6.8 7.8 5.7 7.5 8.8 10.3 9.3 6.9 8.1 7.9 6.3 8.5 9 10.2 8.4 8.3 9.2 9.3 7.4 6.1 5.8 9.6 9.8 8.5 9.7 8.8 6.9 10.1 7.2 6.9 8.4 7.4 8.2 9.6 6.7 8.3 7.3 a) Construir una tabla completa de distribución de frecuencias b) Interpreta: fr 4, fi3 , FI+2, FR4 – c) Graficar: c1) Grafico de sector por porcentual
c2) Histograma y polígono probabilístico.
2.-Para predecir acerca del número de mostradores de servicio que serán necesarios en las tiendas que se construirán en el futuro, una cadena de supermercados quería obtener información sobre el tiempo (en minutos) requeridos para atender a los clientes. Para obtener información acerca de la distribución de los tiempos de atención a los clientes, se obtuvo una muestra de 60 clientes y se anotó el tiempo empleados en atender a cada uno de ellos.
3.6 1.9 2.1 0.3 0.8 0.2 1.0 1.4 1.8 1.6 1.1 1.8 1.1 0.5 1.2 0.6 1.1 0.8 1.7 1.4 0.2 1.3 3.1 2.3 2.3 1.8 4.5 0.9 0.7 0.6 2.8 2.5 1.1 0.4 1.2 0.4 1.3 0.8 1.3 1.1 1.2 0.8 1.0 0.9 0.7 3.1 1.7 1.1 2.2 1.6 1.9 5.2 0.5 1.8 0.3 1.1 0.6 0.7 1.7 2.1 a) Construir una tabla completa de distribución de frecuencias b) Interpreta: fr 2, fi1 , FI+3, FR4 – c) Graficar : c1) Grafico de sector probabilístico. c2) Histograma y polígono porcentual
3.- La vida útil en horas de las herramientas cortantes de un proceso industrial son:
90.6 19.3 78.5 25 32.5 89.7 132.2 14.9 127.3 100 78.3
34.7 99 50,6 35.7 69.8 71.4 85.1 69.3 76.9 12.8 144.9
115.7 83.2 89.5 91.6 58.9 62.4 61.7 69.2 17.8 49.7 11.6
27.4 93.6 132.5 140.8 91.2 73.2 89.3 45.6 71.4 13.7 34.5
56.8 89.7 38.7 34.9 17.4 72.8 34.5 87.5 90.2 32.4 45.9
a) Construir una tabla completa de distribución de frecuencias b) Interpreta: fr 4, fi3 , FI+2, FR3 – c) Realizar: c1) Grafico de sector
c2) Histograma y polígono porcentual
6
4.-Los siguientes datos muestran la cantidad de minutos que un grupo de clientes se demoraron para ser atendidos el 15 de diciembre del 2013 en las instalaciones del Banco Económico1. Realice un estudio que nos muestre un panorama general de lo que pasó ese día.
8 12 15 11 10 20
13 19 25 13 32 16
20 15 34 19 20 18
15 17 30 25 21 19
18 18 34 20 24 12
19 15 20 30 25 18 a) Construir una tabla completa de distribución de frecuencias b) Interpreta: fr 4, fi3 , FI+2, FR3 – c) Realizar: c1) Grafico de sector
c2) Histograma y polígono porcentual 5.-Complete la siguiente tabla de Distribución de Frecuencias y construya las 6 ojivas.
Tabla III - 1 “Edades de los profesores del Colegio Rio Nuevo”
# Int LimInf Li
LimSup Ls
Front Inf Fi
Front Sup Fs Xi fi fr fr%
Fi(-) Fr(-) Fr%(-) Fi(+) Fr(+)
Fr%(+)
1 30
15 5 100
36
15
15%
30
20
90
97
8
3
Fuente: Elaboración propia con los datos del Colegio. (Enero/2014)
1 Estos datos no son reales, ni reflejan las condiciones de atención del Banco Económico, la única razón por la que se pone el nombre es para familiarizar al estudiante con el tema.
7
Unidad 2MEDIDAS DE TENDENCIA CENTRAL A. Objetivos:
Identificar las medidas de tendencia central más utilizadas.
Calcular las medidas de tendencia central.
Interpretar las medidas de tendencia central.
Aplicar un Software para determinar estas medias. B. Actividades de aprendizaje:
Del mismo modo que los gráficos pueden mejorar la presentación de los datos, las descripciones numéricas también tiene gran valor. Una característica importante de un conjunto de datos es su tendencia central, las medidas de tendencia central determinan que tan agrupados se encuentran los datos alrededor de un valor fijo. Entre estas tenemos:
media (aritmética)
media geométrica
media cuadrática
media armónica
mediana
moda
fractiles (cuartiles, deciles y percentiles) PROBLEMAS ABP
1.- La siguiente tabla muestran los gastos en seguridad de miles de dólares, sobre la cumbre del clima desarrollada en Bolivia
Li Ls Fi
0 8 15
8 16 20
16 24 10
24 32 8
32 40 2
40 48 1
48 56 3
56 64 1
2. Usted tiene los datos de ventas de las últimas 6 semanas. ¿Cuál es el promedio de ventas semanales?
1356 1456 1409 1567 1321 1564 3. Los siguientes datos muestran las cantidades de pollos que pueden freír por hora 3 máquinas, usted debe comprar una. ¿Cuál compraría? Máquina (Pollón) 35 56 34 38 40
8
Máquina (Fritón) 40 40 45 39 40 Máquina (Úlmnan) 29 38 38 40 45 4.-Fundación INFOCAL, por concepto tío cursos de capacitación, genera mensualmente los
siguientes ingresó,
5 4 16 19 6
12 20 15 2 3
18 12 15 25 9
11 3 12 12 10
a. Elabore una tabla de distribución de frecuencias del mismo ancho. b. Determine la media aritmética, la moda y la mediana de estas observaciones.
5.-Complete la siguiente tabla de distribución de frecuencias y determine la media, la
Moda y la mediana.
CUADRO DE DISTRIBUCION DE FRECUENCIAS
# l Intervalos
Fronteras
MC=x f FI(-) fr % FR (-)
% Fi Fs
1 11 14 10.5 14.5 12.5 1 1 5 5
2 15 18 14.5 18.5 16.5 2 10 15
3 19 18.5 22.5 0 0 15
4 23 26.5 12 60 75
5 27 30.5 20 95
6 31 34 30.5 34.5 32.5 1 20 5 100
6.- Los siguientes datos muestran la cantidad de prendas compradas por una muestra aleatoria de 8 personas en el Mercado “7 calles” ubicada en el centro de la Ciudad de santa Cruz de la Sierra, Bolivia. Indique de las 8. ¿Cuál es el promedio que se gastó en compras?
12 14 10 7 5 12 30 26
9
7.-. En un puerto se controla diariamente la entrada de pesqueros según su tonelaje, resultando para un cierto día los siguientes datos:
Peso (Tn) 0 - 25 25 - 50 50 - 70 70 – 100 100 - 500
No. De barcos 5 17 30 25 3
Se pide:
a) El peso medio de los barcos que entran en el puerto diariamente. b) La moda
8. Calcular los cuartiles en la siguiente distribución de una variable continua:
Li – Ls fi Fi
0 – 2 3 – 5 6 – 8 9 –11 12 – 14
10 12 12 10 7
10 22 34 44 51
51
9.- Consultados 350 matrimonios sobre la edad de la esposa, se confecciona la siguiente tabla: Edad esposa Nº matrimonios 15-19 23
20-24 28 25-29 76 30-34 54 35-39 60 40-44 42 45-49 27
Calcular: Media, Mediana y Moda
10.- Los datos siguientes representan en centímetros las longitudes de 50 artículos producidos por una maquina:
4,15 4,80 5,15 5,33 5,57 5,74 6,02 6,66 6,98 7,30 4,27 4,86 5,27 5,39 5,63 5,86 6,04 6,66 7,10 7,38 4,62 4,92 5,27 5,45 5,63 5,86 6,10 6,75 7,14 7,54 4,68 4,98 5,33 5,51 5,63 5,86 6,33 6,92 7,22 7,70 4,68 5,15 5,33 5,51 5,63 6,02 6,66 6,98 7,22 7,72
Obtenga: a) Construya una tabla de frecuencia para los datos. b) Encuentre el promedio
10
c) La mediana d) La moda e) El primer cuartil f) El tercer cuartil g) El percentil 10 h) El percentil 9
Unidad 3 MEDIDAS DE DISPERSION A. Objetivos:
OBJETIVOS
Identificar las medidas de dispersión más aplicadas.
Calcular las medidas de dispersión.
Interpretar las medidas de dispersión.
Aplicar un Software para determinar estas medidas B. Actividades de aprendizaje:
PROBLEMAS ABP Ejemplo # 1
Industria PIL, realiza diariamente un control de la calidad de temperatura en ºC con que llega la leche a la planta procesadora, las mediciones de las últimas tres horas, ya tabuladas, se muestran a continuación:
a.-Complete la tabla de distribución de frecuencias. b.- Determine la desviación típica, la varianza y el coeficiente de variación.
Ejemplo # 2
BANCO BISA, ha sacado al mercado un nuevo tipo de préstamo a una tasa de interés accesible. La cantidad de dinero prestada, en miles de dólares, así como la cantidad de clientes que han hecho los préstamos se detallan a continuación:
Intervalos de temperatura
Frecuencia
05 – 09 4
10 – 14 12
15 – 19 25
20 – 24 32
25 – 29 11
30 - 34 12
Monto de los Nº de clientes
11
a.-Complete la tabla de distribución de frecuencias. b.-Determine la desviación típica, la varianza y el coeficiente de variación.
Ejemplo # 3
En dos empresas petroleras se realizó un estudio del número de accidentes que se dan por no usar ropa y accesorios de seguridad. Se quiere saber en cuál de ellas está mejor controlada la seguridad y por qué.
Ejemplo # 4
El gerente de marketing de TIENDAS LEVI`S – SANTA CRUZ, analiza las ventas en dos de sus sucursales. Indíquele Ud. en cuál de ellas las ventas son más homogéneas y permiten hacer una planificación a futuro con objeto de ampliar la tienda. (Los datos representan las ventas en cientos de dólares mensuales)
Ejemplo # 5
A continuación presentamos los datos de una muestra de la tasa de producción diaria de escobas de una empresa en el TORNO:
17, 21, 18, 27, 17, 21, 20, 22, 18, 23
préstamos
01 – 30 95
31 – 60 114
61 – 90 10
91 - 120 1
TRANS_REDES 8 7 6 5 9 9 6 4 7 5
PETROBAS 12 5 12 6 9 6 4 5 3 4
SUCURSAL1 42 40 46 45 39 39 38 44 51
SUCURSAL2 42 53 52 37 51 46 44 53 52
12
El gerente de producción de la empresa siente que una desviación estándar de más de 4 escobas diarias indica variaciones de tasas de producción inaceptables. ¿Deberá preocuparse el gerente por las tasas de producción de la empresa?
Ejemplo # 6
El número de cheques cobrados diariamente en una sucursal del BANCO NACIONAL DE BOLIVIA durante el mes anterior tuvo la siguiente distribución de frecuencias:
El director de operaciones del banco, sabe que una desviación media en el cobro de cheques mayor a 200 ocasiona problemas de personal y organización en la sucursal. ¿Deberá preocuparse por la cantidad de empleados que va a ocupar el siguiente mes?
Ejemplo # 7
FERROTODO analiza el desempeño de 3 de sus vendedores, se ha calificado la coherencia en torno a los objetivos de venta establecidos. La calificaciones mostradas son las de los últimos 5 meses:
LINDA KYLIE ANN
88 76 104
68 88 88
89 90 118
92 86 88
103 79 123
Cuál de las vendedoras ha sido más coherente.
Ejemplo # 8
Dos obreros del mismo trabajo muestran los siguientes resultados en un periodo determinado en
minutos.
CLASE fi
0 – 199 10
200 – 399 13
400 – 599 17
600 – 799 42
800 - 999 18
13
Calcular:
a) ¿Cuál es el más regular en el desarrollo de su trabajo?
b) ¿Cuál es el más rápido en terminar el trabajo?
Ejemplo # 10
Supongamos que en acucioso empleado de SAGUAPAC, realiza una muestra de 60 usuarios
del servicio, sobre los reclamos en los 2 últimos años por esas personas, con los siguientes
resultados:
Número de reclamos Números de usuarios
0 1 2 3 4 5 6 7
26 10 8 6 4 3 2 1
Se pide hallar:
a) El promedio de reclamos b) La varianza y su desviación típica c) El coeficiente de variación
Ejemplo # 11 Las alturas de los jugadores de un equipo de baloncesto vienen dada por la tabla. Calcular la desviación típica y la desviación media.
Altura n° de
Jugadores
(1.70, 1.75) 1
Medidas Obreros
A B
Tiempo promedio para el desarrollo de su trabajo 42 35
Desviación típica 8 6
14
(1.75, 1.80) 3
(1.80, 1.85) 4
(1.85, 1.90) 8
(1.90, 1.95) 5
(1.95, 2.00) 2
Ejemplo # 12 Calcular la desviación media de una distribución estadística que viene dada por la siguiente
tabla: Calcular la desviación típica y la desviación media.
ᶠᵢ
(10, 15) 3
(15, 20) 5
(20, 25) 7
(25, 30) 4
(30, 35) 2
Ejemplo # 13 Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de andar por primera vez: Calcular la desviación típica y la desviación media
Meses Niños
9 1
10 4
11 9
12 16
13 11
14 8
15 1
Ejemplo # 14 La asistencia de espectadores a las 4 salas de un cine un determinado día fue de 200, 500, 300, y 1000 personas: 1. Calcular la dispersión del número de asistente 2. Calcular el coeficiente de variación 3. Si el día del espectador acuden 50 personas más a cada sala ¿Que efecto tendría sobre la dispersión? Ejemplo # 15
15
El promedio de exportación semanal de flores de la corporación “A" fue de 4420 kilos con una desviación estándar de 620: en tanto que la corporación “B” fue de 4230 kilos con una desviación estándar de 620: En que comparación hubo mayor variabilidad Ejemplo # 16 En un juego de tiro en blanco con escopeta de perdigones por dos participantes a un tablero, obtiene el siguiente registro después de 15 disparos cada uno. Determinar el Coeficiente de variación para ambos casos.
Ejemplo # 17 Se ha preguntado a las alumnas y a los alumnos de una clase de cuarto por el tiempo que tardan en llegar desde su casa hasta el instituto. Las respuestas se recogen en esta tabla:
Tiempo en minutos 0,5 5,10 10,15 15,2 20,25
Número de alumnos 10 6 9 3 2
Calcular a) La media b) La desviación típica c) El coeficiente de variación
Disparo f
1 0
2 7
3 7
4 1
5 0
Disparo Fi
1 6
2 3
3 0
4 3
5 3
16
Unidad 4 DENSIDAD Y CONCENTRACIÓN DE DATOS (Medidas de Forma) A. Objetivos:
Identificar las medidas de forma.
Calcular las medidas de forma.
Interpretar geométricamente las medidas de forma. B. Actividades de aprendizaje:
PROBLEMAS ABP Ejemplo #1 La puntuación que han obtenido 50 personas que se presentaron para ocupar un puesto en la plantilla de una empresa, ha sido la siguiente: Puntuación Nº personas 14-17 3
18-19 6 22-25 11 26-29 15 30-33 8 34-37 7
Puntuación media y puntuación más frecuente
Coeficiente de asimetría de Pearson y significado
¿Qué tipo de Kurtosis presenta la distribución?
Ejemplo #2 Se hizo una encuesta a un grupo de estudiantes sobre sus edades. Obteniendo los siguientes
resultados. Calcular la Kurtosis
EDADES fi
26 – 37 38 – 49 50 – 61 62 – 73 74 – 85 86 - 97
3 4 5 5 3 2
Ejemplo #3
Un encargado de compras ha obtenido muestras de lámparas incandescentes de 2 proveedores.
Envía estas muestras a un laboratorio donde se realizan pruebas respecto :i la vida útil, con los
siguientes resultados:
17
A. Indique el coeficiente de asimetría para cada proveedor.
B. Indique el coeficiente de Kurtosis para cada proveedor.
Ejemplo # 4 Industrias PIL, realiza diariamente un control de la calidad de la temperatura en ºC con que llega la leche a la planta procesadora, las mediciones de las últimas tres horas, ya tabuladas, se muestran a continuación:
a) Determine la media o promedio b) Calcule la moda c) Calcule la mediana d) .Calcule e interprete la Kurtosis
Ejemplo #5 En los últimos 40 días se tomaron los siguientes datos que representan la duración en meses de 4 botas industriales.
Li Ls fi
3,1 3,9 6
3,9 4,7 10
4,7 5,5 5
5,5 6,3 9
6,3 7,1 8
Duración de vida útil en Horas
Muestra de
Proveedor A
Proveedor
B
700 - 899 10 3
900-1099 16 42
1100-1299 26 12
1300-1499 8 3
Intervalos de temperatura
frecuencia
05-09 4
10-14 12
15-19 25
20-24 32
25-29 11
30-34 12
18
7,1 7,9 1
7,9 8,7 1
A=0.8
a) Determine la media o promedio b) Calcule la moda c) Calcule la mediana d) .Calcule e interprete la Kurtosis
Ejemplo #6 El departamento de personal realiza una investigación sobre los salarios expresados en dólares
que reciben semanalmente los trabajadores.
Li MC fi
119 125 6
131 137 6
143 149 8
155 161 10
167 173 10
179 185 6
191 197 9
a) Determine la media o promedio b) Calcule la moda c) Calcule la mediana d) .Calcule e interprete la Kurtosis
Ejemplo #7 La vida útil en horas de las herramientas cortantes de un proceso industrial es:
Li Ls MC fi
11,6 30,6 5,8 9
30,6 49,6 15,3 10
49,6 68,6 24,8 7
68,6 87,6 34,3 11
87,6 106,6 43,8 12
106,6 125,6 53,3 0
125,6 144,6 62,8 6
19
a) Determine la media o promedio b) Calcule la moda c) Calcule la mediana d) .Calcule e interprete la Kurtosis
Ejemplo #8
En los últimos 40 días se tomaron los siguientes datos que representan la duración en años de tres bombas de combustibles similares
a) Determine la media o promedio b) Calcule la moda c) Calcule la mediana d) .Calcule e interprete la Kurtosis
Ejemplo #9
El diario El Deber realiza un estudio un estudio acerca del tiempo que tardan imprimir la portada
a colores de la revista Para Ellas impresa los días sábados, para esto se analizaron 60 portadas
diferentes, los tiempos de impresión fueron:
Li Ls fi
0.88 1.24 11
1.24 1.60 6
1.60 1.96 18
1.96 2.32 11
2.32 2.68 1
2.68 3.04 6
3.04 3.40 7
60
li ls mc fi FI+ MC*fi
0,1 1,1 0,6 11 11 6,6
1,1 2,1 1,6 8 19 12,8
2,1 3,1 2,6 4 23 10,4
3,1 4,1 3,6 3 26 10,8
4,1 5,1 4,6 4 30 18,4
5,1 6,1 5,6 9 39 50,4
6,1 7,1 6,6 1 40 6,6
40
116
a) Determine la media o promedio b) Calcule la moda c) Calcule la mediana d) .Calcule e interprete la Kurtosis
20
Unidad 5 REGRESION Y CORRELACION A. Objetivos:
Identificar los diferentes métodos de ajuste.
Aplicar método de mínimos cuadrado
Determinar pronósticos en base a datos históricos.
Interpretar el grado de correlación entre dos variables.
Analizar los resultados mediante el coeficiente de correlación y sus aplicaciones
B. Actividades de aprendizaje:
PROBLEMAS ABP
1.-EL gerente de una cadena de heladerías SAVORY quiere estudiar el efecto de la temperatura
ambiente sobre las ventas de la temporada de calor. Se selecciona una muestra aleatoria de 10
días y los resultados se dan en la siguiente tabla:
Temperatura(Co) 17 21 23 24 27 28 29 31 32 33
Ventas por heladería(en cientos de dólares )
15 17 18 20 24 22 27 29 31 31
a) Encuentre un diagrama de dispersión
b) En la supuesto de una relación lineal encontrar los coeficientes de la regresión A y B
c) Interprete el significado de la pendiente B en este problema
d) Prediga las ventas por heladería, por día cuanto la temperatura es de 36o
e) Calcule el coeficiente de determinación r2 e interprete su significado en este problema
2.-Una economista que trabaja en el rubro de automóviles desea medir la relación del precio de
compra de los automóviles nuevos en función al ingreso familiar. Se selecciona una muestra
aleatoria de 9 personas que compraron autos nuevos con los resultados de la siguiente tabla:
Ingreso familiar(miles de dólares)
10.2 14.4 16.3 20.0 24.3 11.6 32.8 9.4 26.7
Precio de compra (miles de dólares)
3.6 4.1 3.9 5.2 5.1 3.9 7.8 3.4 9.1
a) Encuentre un diagrama de dispersión
b) En la supuesto de una relación lineal encontrar los coeficientes de la regresión A y B
c) Interprete el significado de la pendiente B en este problema
d) Prediga las el precio de compra de un vehículo, si el ingreso familiar es de 35,6
21
e) Calcule el coeficiente de determinación r2 e interprete su significado en este problema
f) 3.-Una organización de estudio de consumidores desea determinar la relación entre el
precio de una pila para radio de transmisores en función al número de horas de duración
de la pila. Se compró una muestra de 11 pilas con los resultados dados en la siguiente
tabla:
Precio(dólar) 24 32 49 39 69 69 89 119 79 35
Duración(horas) 5.4 4.8 6.3 7.2 6.3 7.4 6.8 13.1 9.2 6.0
a) Encuentre la curva de ajuste lineal
b) Calcule el coeficiente de correlación r.
c) ¿Hay relación lineal entre las variables? Demuestre su respuesta.
4.-En un estudio técnico económico se dispone de la siguiente información histórica de ventas
de BATERIAS TOYO, en miles de unidades, de fabricación Boliviana:
Año 1993 1994 1995 1996 1997 1998 1999 2000 2001
Ventas 12 14 15 13 16 19 18 20 22
Se desea efectuar la proyección de las ventas para los próximos tres años.
5.-El gerente de personal de la CRE considera que puede haber una relación entre el
ausentismo y la edad y querría usar la edad de un empleado para predecir el número de días de
ausencia durante un año calendario. Se selecciona una muestra aleatoria de 11 empleados, con
los resultados en la siguiente tabla:
Ausencia 15 13 6 10 18 9 7 14 11 5 8
edad 27 24 61 37 23 46 54 39 36 64 40
a) Encuentre la curva de ajuste lineal b) Si un trabajador ha faltado durante 10 días. Qué edad podría tener c) Cuantos días de ausencia se pronosticara un trabajador de 54 años
6.- El personal técnico operativo que solicita ingreso a una empresa manufacturera, es sometido
a un proceso de evaluación (conocimientos, experiencia, etc.).
Utilizado una escala de valoración entre 0 – 20; dos meses después de su ingreso realiza un
curso de capacitación avanzada calificada de 0 – 5.
Tal como lo muestra la tabla de 14 funcionarios al azar.
Empleado 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Evaluación 12 10 13 8 7 11 11 14 12 14 9 10 10 13
Capacitación 3.9 4.2 4.2 3.8 3.8 3.8 4.3 4.4 4.5 4.4 3.9 3.7 4.3 3.6
Se pide : a) Determinar el diagrama de descripción
b) En el supuesto de una relación lineal utilice el método de los mínimos cuadrados para
calcular los coeficientes de regresión AyB
c) ¿Cuántos días estimara la entrega a partir del momento en que el embarque esté listo
para su carga de un embarque de 1000 kilómetros?
22
d) Determine e interprete el coeficiente de correlación y determinación
e) Determine e interprete el error estándar de estimación
f) Interprete la siguiente de la pendiente B.
7.-Un análisis toma una muestra aleatoria de 19 embarques recientes por camión realizados por
una empresa y registra la distancia en kilómetros y el tiempo de entrega al medio día más
cercano a partir del momento en que el embarque estuvo listo para su carga. Las observaciones
muéstreles de distancia de acarreo y tiempo de entrega de 10 embarques aleatoriamente
seleccionados se muestra en la siguiente tabla.
Embarque muestreado
1 2 3 4 5 6 7 8 9 10
Distancia(en KM)
825 215 1070 550 480 920 1350 325 670 1215
Tiempo de entrega en días
3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
Se pide:
a) Determinar el diagrama de dispersión
b) En el supuesto de una relación lineal utilice el método de los mínimos cuadrados para
calcular los coeficientes de regresión de A y B
c) ¿Cuántos días estimaría la entrega a partir del momento en que el embarque está listo
para su carga de un embarque de 1000 kilómetros?
d) Determine e interprete el coeficiente de correlación y determinación
8.-En la tabla se presentan datos que relacionan el número de semanas de experiencia en un
trabajo de instalación de cables de componentes electrónicos en miniatura, el número de
componentes que se rechazaron la semana anterior para doce trabajadores seleccionados al
azar.
Trabajador muestreado
1 2 3 4 5 6 7 8 9 10 11 12
Distancia(en KM) (x)
7 9 6 14 8 12 10 4 2 11 1 8
Tiempo de entrega en días (y)
26 20 28 16 23 18 24 26 38 22 32 25
Se pide:
a) Determinar el diagrama de dispersión
b) En el supuesto de una relación lineal utilice el método de los mínimos cuadrados para
calcular los coeficientes de regresión de A y B
c) ¿Cuántos días estimaría la entrega a partir del momento en que el embarque está listo
para su carga de un embarque de 1000 kilómetros?
d) Determine e interprete el coeficiente de correlación y determinación
23
Unidad 6
Elementos de probabilidad OBJETIVOS
Interpretar las definiciones básicas de los elementos de probabilidad. Identifica el tipo de evento definido en el mismo espacio muestral. Reconocer la importancia de la aplicación del Teorema de Bayes. Desarrollar habilidades para resolver problemas de probabilidades.
B. Actividades de aprendizaje:
PROBLEMAS ABP 1.- Es secretario de un sindicato, redacto un alista de demandas salariales que se presentará al gerente de la empresa. Para darse una idea del grado de apoyo que existe entre los trabajadores con respecto a su propuesta, hizo un sondeo aleatorio entre los dos grupos principales de trabajadores los maquinistas (M) y los inspectores (I). Tomó 30 trabajadores de cada grupo con los resultados siguientes
Opinión sobre el paquete M I
Apoyo fuerte 9 10
Apoyo leve 11 3
Indecisos 2 2
Levemente opuestos 4 8
Fuertemente opuestos 4 7
30 30
a) ¿Cuál es la posibilidad de que un maquinista, seleccionado al azar del grupo sondeado
apoye levemente el paquete?
b) ¿Cuál es la probabilidad de que un inspector, seleccionado al azar del grupo sondeado,
esté indeciso con respeto al paquete?
c) ¿Cuál es la probabilidad de que un trabajador (maquinista o inspector), seleccionado al
azar del grupo sondeado, apoye el paquete, ya sea fuerte o levemente?
d) ¿Qué tipos de estimación de probabilidad son estos?
2.-A continuación tenemos una distribución de frecuencias de las comisiones anuales por ventas tomada de un estudio de 300 vendedores promedio.
Comisión anual Frecuencia
0 – 5,000 15
5,000 – 10,000 25
10,000 – 15,000 35
15,000 – 20,000 125
20,000 – 25,000 70
25,000 o más 30
Basándose en esta información, Cual es la probabilidad de que un vendedor promedio obtenga una comisión de a) entre 5,000 y 10,000; b) menor de 15,000; c) más de 20,000, y d) entre 15,000 y 20,000.
24
3.- En cierta cuidad, la probabilidad que una familia tenga televisión por cable es de 0.85, y que disponga de Internet en su casa es de 0.60 y que tengan ambos servicios es de 0.50. a) Graficar en un diagrama de VENN los eventos descritos b) ¿Cuál es la probabilidad que una familia tenga al menos uno de estos artefactos? 4.- Un estudiante se presenta a dos universidades A y B. El estima la probabilidad que sea admitido en la universidad A en 0.8; a la universidad B en 0.75, en al menos una de ellas en 0.95. a) ¿Cuál es la probabilidad que ingrese a ambas universidades? b) ¿Cuál es la probabilidad de que solo ingrese a la universidad A, pero no a B? 5.- Un inspector de SAGUAPAC, tiene asignada la tarea de comprar la eficiencia de dos estaciones de bombeo. Cada estación es susceptible de dos tipos de falla: fallas en las bombas y fallas por fugas. Cuando una de éstas ( o ambas), se presentan, la estación debe quedar fuera de servicio. Los datos disponibles indican que prevalecen las siguientes probabilidades:
Estación P(falla en bombeo) P(fuga) P(ambas)
1 2
0.07 0.09
0.10 0.12
0.00 0.06
¿Cuál estación tiene la mayor probabilidad de quedar fuera de servicio? 6.-En una ciudad se publican tres revistas: A, B y C. Realizada una encuesta, se estima que de la población adulta: el 20% lee A, 30% lee B, 25% lee C; 10% lee A y B, 8% lee A y C y 12% lee B y C; además 3% lee las tres revistas. Se elige aleatoriamente una persona adulta, calcular la probabilidad que lea al menos una de estas revistas. 7.- Al lanzar dos dados y sumar los dos resultados posibles, cuál es la probabilidad de obtener: a) Un total de siete puntos en el primer lanzamiento, seguido de 11 en el segundo b) Un tres en el primer lanzamiento y un número par en el segundo c) Un total de 12 en el segundo lanzamiento dado que en el primero salió un total de 10
d) Salga un total de 5 en el segundo lanzamiento dado que en el primero fue también un total de 5
8.- ¿Cuál es la probabilidad de que al elegir con reemplazo dos cartas, al azar y una cada vez, de un mazo de barajas: a) Salga una carta roja en la primera extracción y una negra en la segunda b) Salga una carta par en la primera extracción y una impar en la segunda c) Salga una figura en la segunda extracción, dado que la primera carta fue roja d) Salga un As en la segunda extracción, dado que la primera carta fue una figura
25
Unidad 7 Distribuciones de probabilidad importantes para V.A.D V.A.C OBJETIVOS
identificar los componentes de la teoría combinatoria.
Identificar las distribuciones de probabilidades más importantes para VAD.
Resolver las distribuciones de probabilidades más importantes de VAD.
B. Actividades de aprendizaje:
PROBLEMAS ABP DISTRIBUCION DE PROBABILIDAD BINOMIAL
1. La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores ya la han leído. Un grupo de 4 amigos son aficionados a la lectura:
a. ¿Cuál es la probabilidad de que en el grupo hayan leído la novela 2 personas? b. ¿Y cómo máximo 2?
2. Un agente de seguros vende pólizas a cinco personas de la misma edad y que disfrutan de buena salud. Según las tablas actuales, la probabilidad de que una persona en estas condiciones viva 30 años o más es 2/3. Hállese la probabilidad de que, transcurridos 30 años, vivan:
a. Las cinco personas b. Al menos tres personas c. Exactamente dos personas
3. Se lanza una moneda cuatro veces. Calcular la probabilidad de que salgan más caras que cruces
4. Si de seis a siete de la tarde se admite que un número de teléfono de cada cinco está comunicando, ¿cuál es la probabilidad de que, cuando se marquen 10 números de teléfono elegidos al azar, sólo comuniquen dos?
5. La probabilidad de que un hombre acierte en el blanco es 1/4. Si dispara 10 veces: a. ¿Cuál es la probabilidad de que acierte exactamente en tres ocasiones? b. ¿Cuál es la probabilidad de que acierte por lo menos en una ocasión?
6. En unas pruebas de alcoholemia se ha observado que el 5% de los conductores controlados dan positivo en la prueba y que el 10% de los conductores controlados no llevan puesto el cinturón de seguridad. También se ha observado que las dos infracciones son independientes. Un guardia de tráfico para cinco conductores al azar. Si tenemos en cuenta que el número de conductores es suficientemente importante como para estimar que la proporción de infractores no varía al hacer la selección
a. Determinar la probabilidad de que exactamente tres conductores hayan cometido alguna de las dos infracciones
b. Determine la probabilidad de que al menos uno de los conductores controlados haya cometido alguna de las dos infracciones
7. La probabilidad de que un artículo producido por una fábrica sea defectuoso es p = 0.02. Se envió un cargamento de 10.000 artículos a unos almacenes. Hallar el número esperado de artículos defectuosos, la varianza y la desviación típica
8. En una urna hay 30 bolas, 10 rojas y el resto blancas. Se elige una bola al azar y se anota si es roja; el proceso se repite, devolviendo la bola, 10 veces. Calcular la media y la desviación típica
26
DISTRIBUCION DE PROBABILIDAD POISSON 1. Supongamos que la probabilidad de tener una unidad defectuosa en una línea de ensamblaje es de 0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes: a. ¿cuál es la probabilidad de que entre diez unidades dos se encuentren defectuosas? b. ¿y de que a lo sumo dos se encuentren defectuosas? c. ¿cuál es la probabilidad de que por lo menos una se encuentre defectuosa? 2. El gerente de un restaurante que sólo da servicio mediante reservas sabe, por experiencia, que el 20% de las personas que reservan una mesa no asistirán. Si el restaurante acepta 25 reservas pero sólo dispone de 20 mesas, ¿cuál es la probabilidad de que a todas las personas que asistan al restaurante se les asigne una mesa? 3. Una empresa electrónica observa que el número de componentes que fallan antes de cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos fallos es ocho, a. ¿cuál es la probabilidad de que falle un componente en 25 horas? b. ¿y de que fallen no más de dos componentes en 50 horas? c. ¿cuál es la probabilidad de que fallen por lo menos diez en 125 horas? 4. Cada muestra de aire tiene 10% de posibilidades de contener una molécula rara particular. Suponga que las muestras son independientes con respecto a la presencia de la molécula rara. Encuentre la probabilidad de que en las siguientes 18 muestras, exactamente 2 contengan la molécula rara. 5. Un lote contiene 100 piezas de un proveedor de tubería local y 200 unidades de un proveedor de tubería del estado vecino. Si se seleccionan cuatro piezas al azar y sin reemplazo, a. ¿Cuál es la probabilidad de que todas sean del proveedor local? b. ¿Cuál es la probabilidad de que dos o más piezas de la muestra sean del proveedor local? c. ¿Cuál es la probabilidad de que al menos una pieza de la muestra sea del proveedor local? 6. Supongamos que el número de imperfecciones en un alambre delgado de cobre sigue una distribución Poisson con una media de 2.3 imperfecciones por milímetro. a. Determine la probabilidad de 2 imperfecciones en un milímetro de alambre. b. Determine la probabilidad de 10 imperfecciones en 5 milímetros de alambre. c. Determine la probabilidad de al menos una imperfección en 2mm de alambre 7. La contaminación constituye un problema en la fabricación de discos de almacenamiento óptico. El número de partículas de contaminación que ocurre en un disco óptico tiene una distribución de Poisson y el número promedio de partículas por centímetro cuadrado de superficie del disco es 0.1. El área de un disco bajo estudio es 100 centímetros cuadrados. a. Encuentre la probabilidad de que ocurran 12 partículas en el área del disco bajo estudio. b. La probabilidad de que ocurran cero partículas en el área del disco bajo estudio. c. Determine la probabilidad de que 12 o menos partículas ocurran en el área del disco bajo estudio.
8.-supogamos que un libro de 585 páginas contiene 41 errores de ortografía distribuidos aleatoriamente. Cuál es la probabilidad que en diez páginas seleccionadas al azar:
a) Ninguna página tenga errores.
b) Hayas 23 páginas con errores.
27
DISTRIBUCION DE PROBABILIDAD NORMAL
1.-Dado la variable aleatoria X tiene una distribución normal con media de 6.4 y desviación tipia de 2.3, encontrar:
a) P(4< X <5)=
b) P(X> 2)=
c) P(X≤ 2)=
2.-Las esturas de 1000 estudiantes están distribuidas normalmente con una medida de 174 centímetros y una desviación estándar de 6.9 centímetros ¿qué porcentaje de estudiantes:
a) Miden menos de 160cm.
b) Entre 171 y 182cm.
c) Mayor o igual a 188cm.
3.-Un súper mercado almacena 30kg de queso fundido cada semana. Si la demanda semanal de queso fundido esta normalmente distribuida con una medida de 24 kg una desviación estándar de 5 kg. Determinar la probabilidad de queso en un semana cualquiera.
4.-Los gastos mensuales de comida de familias de cuatro miembros promedian $us 420 con una
desviación estándar de $us 80. Suponiendo que los gastos mensuales de comida se distribuyen
normalmente.
a) ¿Qué porcentaje de estos gastos son inferiores a $us 360?
b) ¿Qué porcentaje de estos gastos están entre $us 260 y $us 360?
c) ¿Qué porcentaje de estos gastos están entre $us 260 y $us 460?
d) ¿Qué porcentaje de estos gastos son superiores a $us 360?
5.- La media de los pesos de 500 estudiantes de un colegio es 70 Kg y la desviación típica 3 Kg.
Suponiendo que los pesos se distribuyen normalmente, hallar cuantos estudiantes pesan:
a) Entre 60 Kg y 75 Kg
b) Más de 90 Kg
c) Menos de 64 Kg
6.- Se supone que los resultados de un examen siguen una distribución normal con una media
78 y desviación típica 36. Se pide:
a) ¿Cuál es la probabilidad de que una persona que se presenta el examen obtenga una
calificación superior a 72?
b) Si se sabe que la calificación de un estudiante es mayor que 72. ¿Cuál es la probabilidad
de que su calificación sea, de hecho, superior a 84?
28
UNIDAD 8
Muestreo
Teoría del muestreo.
OBJETIVOS
Reconocer los diferentes tipos de muestreos probabilísticas.
Reconocer los diferentes tipos de muestreos no probabilísticas.
Calcular el tamaño de la muestra para población finita e infinita.
Resolver problemas de aplicación a la economía.
B. Actividades de aprendizaje:
PROBLEMAS PARA RESOLVER EN CLASES
1.-Una ganadería tiene 3000 vacas. Sequiereextraerunamuestrade120.Explica cómo se obtiene la muestra:
a) Mediante muestreo aleatorio simple.
b) Mediante muestreo aleatorio sistemático.
2.-Unaganadería tiene 2000 vacas. Son de distintas razas: 853 de, 512deB, 321 deC,204 deDy110deE.
Queremosextraerunamuestrade120:
a) ¿Cuántas hay que elegir de cada raza para que el muestreo sea
estratificado con reparto proporcional?
b) ¿Cómo ha de ser la elección dentro de cada estrato?
PROBLEMAS ABP
1.-En cierto barr io se quiere hacer un estudio para conocer mejor el t ipo de
act ividades de ocio que gustan más a sus habitantes. Para el lo van a ser
encuestados 100 individuos elegidos al azar.
Explicar qué procedimiento de selección sería más adecuado ut i l izar:
muestreo con o sin reposición. ¿Por qué?
Como los gustos cambian con la edad y se sabe que en el barr io viven
2.500 niños, 7.000 adultos y 500 ancianos, poster iormente se decide
29
elegir la muestra anterior ut i l izando un muestreo estrat if icado. Determinar
el tamaño muestra correspondiente a cada estrato.
2.-La media de las estaturas de una muestra aleator ia de 400 personas de una
ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es
una var iable aleator ia que sigue una distr ibución normal con var ianza σ 2 =
0,16 m2 . ¿Cuál sería el mínimo tamaño muestral necesario para que pueda
decirse que la verdadera media de las estaturas está a menos de 2 cm de la
media muestral, con un nivel de conf ianza del 90%?
3.-Se desea estimar la proporción, p, de individuos daltónicos de una
población a través del porcentaje observado en una muestra aleatoria de
individuos, de tamaño nuestra. Si el porcentaje de individuos daltónicos en la
muestra es igual al 30%, calcula el valor de n para que, con un nivel de
conf ianza de 0,95, el error cometido en la est imación sea inferior al 3,1%.
4.- Un colegio t iene 120 alumnos de Bachi l lera to. Se requiere extraer una muestra de 30 alumnos, Explica ¿Cómo se obtiene la muestra?.
a) Mediante muestreo aleator io simple b) Mediante muestreo aleator io sistemát ico
5.- En un centro comercial acaba de recibir un pedido de sitonizadores TDT para ponerlos a la venta entre sus clientes. Dichos sintonizadores vienen numerados con codigos desde el 39466 al 48796. El gerente de dicho centro esta preocupado por la calidad de dichos sitonizadores y decide obtener una muestra sistematica de 7 aparatos y someterlos a varias pruebas. Ayudele a obtener una muestra.
6.- Una legisladora estatal desea encuestar a los recidentes de su distrito para conoxer la proporcion del electorado conoce la opinion de ella respecto al uso de fondos estudiantiles para pagar abortos ¿Qué tamaño de muestra se necesita si se requiere una confianza del 95 % y un error mazimo de estimacion del 0,10 ?
7.-Un ingeniero de control de calidad quiere estimar la fraccion de elementos defectuosos de un gran lote de lamparas. Por la experiencia cree, que la fraccion real de defectuosos es 0,2. ¿Qué tan grande tendria que ser la muestra si se quiere estimar una fraccion real, exacta dentro de 0,01 utilizando un nivel de confianza del 95%?
30
V.SISTEMA DE EVALUACIÓN DE APRENDIZAJE DE LA ASIGNATURA
El sistema de evaluación se describe a continuación:
NUM. TIPO DE EVALUACIÓN
OBJETIVOS A EVALUAR PUNTOS CLASE
1 Primer Parcial (Escrito)
- Conocer los conceptos más importantes de la Estadística, realizar clasificaciones, reconocer variables. - Construir e interpretar tablas de frecuencia y los gráficos correspondientes
15
8
2 Portafolio de evidencias
Evidenciar actividades en internet utilizando:
- Facebook, blogs Realizar controles de lecturas
5
3 Portafolio de evidencias
Realizar evaluaciones continuas en clase mediante:
- Trabajos grupales e individuales
- Casos
5
4 Segundo Parcial 15 15
5 Portafolio de evidencias
Proporcionar actividades extra clase mediante:
- Prácticos - Casos
5
6 Defensa de Trabajos Finales
20 19
7 Examen Final 40 20
TOTAL 100
Descripción de las características generales de las evaluaciones:
EVALUACIÓN 1 PRUEBA PARCIAL
Unidades 1, 2,3,4,5
EVALUACIÓN 2 PRUEBA PARCIAL
Unidades 6,7,8
PORTAFOLIO DE EVIDENCIAS
Prácticos del 1 al 6.para clase y extra clase. Casos de Estudio del No.1 al 6
EVALUACIÓN FINAL Todo lo avanzado
31
PROYECTO Presentación Trabajo Final
IV:BIBLIOGRAFÍA RECOMENDADA BIBLIOGRAFÍA BÁSICA:
Justiniano, Norberto E. (2004). Estadística Descriptiva Bolivia.1º edición
Moya C., Rufino. (2005) Estadística Descriptiva. 2da Edición
Spiegel Murray R. (2003 ).Probabilidad y Estadística. Editorial. Mc. Graw Hil.
Allen L. Webster (2.000) Estadística Aplicada a los negocios y la Economía” Mc. Graw Hil
Walpole Myers. (2000) Probabilidad y estadística.Mc Graw Hill. México.
BIBLIOGRAFÍA COMPLEMENTARIA:
Douglas C. Montgomery -George C. Runger. (2011) Probabilidad y Estadística 2da
Edición
Leonard Kazmier (1999).Estadística aplicada a la Administración y Economía.
McGRAW-HILL, 3ra. Edición
Jorge F. Daza Portocarrero. (2006). Estadística aplicada con Microsoft Excel. Edit.
Megabyte. 1ra. Edición
IV. PAGINAS WEB Y OTROS MATERIALESBIBLIOGRAFICOS CONCEPTOS BASICOS. http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-indice.html http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf http://ponce.inter.edu/cai/reserva/lvera/CONCEPTOS_BASICOS.pdf http://eduardolakatos.files.wordpress.com/2007/10/estadistica-descriptiva-distribucion-de-frecuencias.pdf CUADRO DE DISTRIBUCION DE FRECUENCIAS http://eduardolakatos.files.wordpress.com/2007/10/estadistica-descriptiva-distribucion-de-frecuencias.pdf http://www.vitutor.com/estadistica/descriptiva/a_3.html GRAFICOS http://www.uhu.es/45110/Ficheros%20de%20datos/curso%202007%202008/spss/PRACTICA%205.pdf http://optimierung.mathematik.uni-kl.de/mamaeusch/veroeffentlichungen/ver_vortraege/tt_es_dec03_paula1.pdf
32
GUÍA PARA EL PROYECTO FINAL
Objetivos del trabajo:
Aplicar todos los cálculos estadísticos a un problema de la vida real
Hacer la presentación de resultados del procesamiento estadístico
Interpretar los resultados estadísticos determinados Guía: 1.- Elegir variables, una cuantitativa(al tabular es de escala) y cualitativas (que al tabular una sea ordinal y otra nominal) y clasificarlas. 2. Elaborar una encuesta para recoger la información de las variables elegidas. 3.- Conseguir cincuenta y cinco (55) datos (por lo menos), de cada variable elegida. 4.- Para las variables cualitativas (ordinales y nominales) hacer la presentación de los datos:
Tabulados
En diagramas de barras
En diagrama de sectores.
Interpretar los resultados. 5.- Para la variable cuantitativa (de escala):
Realizar todos los cálculos estadísticos estudiados durante el desarrollo de la materia.
Representar gráficamente los datos procesados.
Interpretar y expresar las conclusiones sobre todos los cálculos realizados. 1. BIBLIOGRAFÍA(Referenciar en el texto) Formato APA 2. ANEXOS CARACTERÍSTICAS DE PRESENTACIÓN DEL TRABAJO: La presentación se debe realizar en papel tamaño carta con todos los cálculos realizados escritos (utilice el editor de ecuaciones), todos los cuadros y gráficos (en procesador de texto o planilla electrónica EXCEL). NOTA IMPORTANTE:
La exposición y defensa oral se realizará en la fecha mencionada al inicio.
La presentación y defensa del proyecto es un requerimiento indispensable para rendir el examen final. Presentación sin defensa o falta en fecha de defensa automáticamente pierde el derecho al examen final.
33
MATERIAL COMPLEMENTARIO O DE APOYO - El siguiente material de apoyo es el resultado de una compilación de textos de los principales autores sobre el tema publicados en libros o en fuentes confiables de internet. En muchos casos, algunas porciones del texto, han sido adaptadas al contexto local con el único fin de que resulten más beneficiosas para el proceso de aprendizaje de los estudiantes.
El único objetivo de este compilado, es entregar a los estudiantes un documento con información seleccionada.
34
Unidad 1 Datos y distribuciones de frecuencia Objetivos
Diferenciar entre población y muestra.
Identificar los diferentes tipos de variables.
Construir la tabla de distribución de frecuencia
Interpretar el cuadro de distribución de frecuencias
Realizar los gráficos de la tabla de frecuencia e interpretarlos.
CONCEPTOS BASICOS
La ciencia estadistica tiene un conjunto de metodos y herramientas que nos ayudan a recopilar, tabular, resumir datos, presentarlos mediante cuadros y graficos, a traves de una muestra representativa, llega a conclusiones, que facilitan la toma de decisiones.
La estadistica se divide en dos grandes areas: Estadistica Descriptiva y Estadistica Inferencial
La materia prima de la ESTADISTICA son los datos y un conjunto de datos es una informacion. Para resumir estos datos la Estadistica trabaja con variables que guian el metodo y las herramientas que se precisan en un trabajo de investigacion.
Una variable es una caracteristica (ejm. Edad) que puede asumir cualquier tipo de valor dentro de un conjunto de datos que son sometidos bajo un estudio en particular.
La estadistica DESCRIPTIVA es
aquella que se ocupa de
recolectar, clasificar, presentar y
describir datos, para llegar a
conclusiones.
La estadistica INFERENCIAL trabaja
con las conclusiones de la
Estadistica Descriptiva, generaliza
datos a partir de una muestra,
utiliza modelos probabilisticos,
realiza estimaciones, efectua
inferencias y genera datos a futuro.
VARIABLES CUALITATIVASson aquellas
que expresan una cualidad o un
atributo fisico. Ejm. Profesion, estado civil,
nivel de educacion, religion. Del mismo
modo las variables cualitativas pueden
ser ordinales y nominales.
VARIABLES CUANTITATIVAS son
aquellas que se expresan
numericamente. Ejm. Sueldos, edad,
peso, estatura. A su vez se subdividen en
cuantitativas continuas y cuantitativas
discretas.
35
PASOS PARA REALIZAR UNA INVESTIGACION ESTADISTICA DESCRIPTIVA
Fuente : Ing. Luis Fernando Villarroel – Taller Estadistica Utepsa Noviembre 2013 TOMA DE DATOS
Sucede que al recolectar la información muchas veces se hace imposible o muy costoso económicamente obtener los datos de todos los elementos que componen una población. Por la que se recurre a tomar solo una muestra de los datos.
Por ejemplo, imagina que el diario El DEBER quisiera elaborar un estudio sobre las preferencias literarias y musicales de la juventud cruceña. Está claro que no se puede preguntar a todos los individuos pues la población es demasiado grande. Población
Una población es aquella que está formada por la totalidad de las observaciones en las cuales se tiene cierto interés.
Muestra Una muestra es un subconjunto de observaciones seleccionadas de una población.
Se podrá observar y concluir que es una tarea imposible y muy costosa preguntar a cada individuo sobre la preferencia literaria y musical. Es por eso que resulta conveniente escoger una pequeña parte de esta población (una muestra) que sea representativa del total de la población.
Muestra Población
Individuo Cada uno de los elementos de la población
PRIMER PASO FORMULARSE LA PREGUNTA Que resultado quiero obtener a través de esta INVESTIGACION SEGUNDO PASO Identificar tipo de variable (cualitativa o cuantitativa) TERCER PASO Definir si el estudio de investigación estadística será realizado a través de una muestra o una población CUARTO PASO Seleccionar la/s herramienta/s validas para el levantamiento de datos (encuestas, censos, informes contables, informes económicos, cuestionarios, test, prensa escrita, observación) QUINTO PASO Tabulación, clasificación de la información recolectada a través del cuadro de distribución de frecuencias. SEXTO PASO Realización de los gráficos correspondientes SEPTIMO PASO Interpretación de los gráficos, conclusiones
36
Existen diferentes métodos para escoger una muestra entre los que destacaremos dos: o Muestreo aleatorio simple: cada elemento tiene la misma probabilidad de ser elegido o Muestreo estratificado: Las proporciones de diferentes individuos deben ser las mismas en
la muestra que en la población Analicemos el siguiente problema ABP: Se desea estudiar las preferencias musicales de 950 estudiantes de un centro educativo de la ciudad, de los cuales se conoce que 570 son mujeres. Explica cómo obtener una muestra de 100 individuos:
a) Por muestreo aleatorio simple b) Por muestreo estratificado.
SOLUCIÓN:
a) Una manera de obtener una muestra de 100 estudiantes por muestreo aleatorio simple es introducir en una urna 950 papeletas con un número diferente y escoger al azar 100.
b) Si de los 950 estudiantes se sabe que 570 son mujeres, la proporción de ésta en el total de la población es del 60%. Por lo tanto para escoger una muestra de 100 individuos por muestreo estratificado, deberemos escoger 60 mujeres y 40 hombres.
TÉCNICAS DE RECOLECCION DE INFORMACION
ENTREVISTAS EN PROFUNDAD
GRUPOS FOCALES
TÉCNICAS PROYECTIVAS
LA OBSERVACION
LA ENCUESTA
EL PANEL
CUALITATIVA
S
CUANTITATIVA
S
METODO DELFI
37
e
DISTRIBUCION DE FRECUENCIAS
Para construir la tabla de distribución de frecuencia se siguen los siguientes pasos:
1. PASO: Ordenar los datos en forma ascendente.
2. PASO: Determinar los valores mínimos y máximo
3. PASO: Calcular el rango
4. PASO: Calcular el número de intervalos
5. PASO: Determinar la amplitud de clases
6. PASO: Calcular el rango ideal y Determinar el margen de desplazamiento
7. PASO: Calcular el límite inferior de la primera clase
8. PASO. Finalmente calcular los demás límites inferiores.
MOMENCLATURA
Li =Límite inferior
Ls = Límite superior
A = Amplitud (A=Ls-Li)
m=número de filas
n=muestra
MC=Marca de Clase
fi=Frecuencia Absoluta
fr=frecuencia relativa
fp%=porcentaje
FI+=Frecuencia absoluta acumulada menor que
FI- = Frecuencia absoluta acumulada mayor que
Ejemplo 1
Los siguientes datos indican el número de minutos que ocuparon que ocuparan sus asientos 50 clientes de una cafetería:
73 65 82 70 45 50 70 54 32 75 75 67 65 60 75 87 83 40 72 64 58 75 89 70 73 55 61 78 89 93 43 51 59 38 65 71 75 85 65 85 49 47 55 60 76 75 69 35 45 63
a. Construir la tabla de distribución de frecuencias
b. Realizar la interpretación de todos los datos
c. Graficar histogramas, polígonos, gráficos de sector y ojivas
d. Realizar una interpolación y una probabilidad
DESARROLLO
Paso 1.- Ordenar los datos en forma ascendente
38
32 45 50 54 65 70 70 73 75 82 40 60 64 65 67 72 75 75 83 87 55 58 61 70 73 75 78 89 89 93 38 43 51 59 65 65 71 75 85 85 35 45 47 49 55 60 63 69 75 76
Paso 2.- Identificar el Máximo y el Mínimo
Máximo: 93 Mínimo: 32
Paso 3.- Calculo del Rango
R = Max – Min R = 93 – 32
R = 61 Paso 4.- Calculo del Número de Filas
m = 1 + 3,32 x log (n) m = 1 + 3,32 x log (50)
m = 6,6405 m = 7
Paso 5.- Calculo de la Amplitud
A = R/m A = 61/7
A = 8,7142 A = 9
Paso 6.- Calculo del Rango Ideal
RI = m x A RI = 7 x 9
RI = 63 RI >R correcto!!!
Margen de Desplazamiento
MD = RI – R MD = 63 – 61 MD = 2/2=1
Cuando el resultado es un número par se divide entre 2
MD = 1
NOTA: ··Si MD es (0-1-0,1-0,01-0,001) ya es unidad básica, por lo tanto se convierte
automáticamente en el margen de desplazamiento verdadero “MDV”.
Si el resultado es un número par, se divide entre 2.
Paso 7.- Calculo del Límite InferiorLi = Min – MD
Nota: las decimas de la amplitud deben cuadrar con las decimas de la tabla, si salen dos décimas dejarlos así no más, y si en la tabla hay una sola decima redondearlo. Ej.: 0,69= 0,7
39
Li = 32 – 1 Li = 31
Paso 8.- Calculo de los demás Limites Inferiores
39,9 48,9 Li1=31 40 Li2= 40 49 57,9 66,9 Li3=49 58 Li4=58 67
75,9 84,9 Li5=67 76 Li6=76 85 93,9 Li7=85 94
Li Ls fi fr fp FI+ FI- FR+ FR-
[31 40[ 3 0,06 6% 3 50 0,06 1
[40 49[ 5 0,1 10% 8 47 0,16 0,94
[49 58[ 6 0,12 12% 14 42 0,28 0,84
[58 67[ 11 0,22 22% 25 36 0,5 0,72
[67 76[ 15 0,3 30% 40 25 0,8 0,5
[76 85[ 4 0,08 8% 44 10 0,88 0,2
[85 94[ 6 0,12 12% 50 6 1 0,12
50 1 100%
0
0
INTERPRETACION
fi
3 Es la cantidad de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 40
5 Es la cantidad de clientes que ocuparon los asientos de una cafetería
40 ≤ tiempo(min) < 49
6 Es la cantidad de clientes que ocuparon los asientos de una cafetería
49 ≤ tiempo(min) < 58
11 Es la cantidad de clientes que ocuparon los asientos de una cafetería
58 ≤ tiempo(min) < 67
15 Es la cantidad de clientes que ocuparon los asientos de una cafetería
67 ≤ tiempo(min) < 76
4 Es la cantidad de clientes que ocuparon los asientos de una cafetería
76 ≤ tiempo(min) < 85
6 Es la cantidad de clientes que ocuparon los asientos de una cafetería
85 ≤ tiempo(min) < 94
Nota: hacer este procedimiento nos va a ayudar a escanear para hacer el fi.
40
PROBABILIDAD
fr
0,06 Es la mínima probabilidad de que los clientes ocupen los asientos de una cafetería
31 ≤ tiempo(min) < 40
0,1 Es la probabilidad de que los clientes ocupen los asientos de una cafetería
40 ≤ tiempo(min) < 49
0,12 Es la probabilidad de que los clientes ocupen los asientos de una cafetería
49 ≤ tiempo(min) < 58
0,22 Es la máxima probabilidad de que los clientes ocupen los asientos de una cafetería
58 ≤ tiempo(min) < 67
0,3 Es la probabilidad de que los clientes ocupen los asientos de una cafetería
67 ≤ tiempo(min) < 76
0,08 Es la probabilidad de que los clientes ocupen los asientos de una cafetería
76 ≤ tiempo(min) < 85
0,12 Es la probabilidad de que los clientes ocupen los asientos de una cafetería
85 ≤ tiempo(min) < 94
PORCENTAJE
fp
6% Es el porcentaje de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 40
10% Es el porcentaje de clientes que ocuparon los asientos de una cafetería
40 ≤ tiempo(min) < 49
12% Es el porcentaje de clientes que ocuparon los asientos de una cafetería
49 ≤ tiempo(min) < 58
22% Es el porcentaje de clientes que ocuparon los asientos de una cafetería
58 ≤ tiempo(min) < 67
30% Es el porcentaje de clientes que ocuparon los asientos de una cafetería
67 ≤ tiempo(min) < 76
8% Es el porcentaje de clientes que ocuparon los asientos de una cafetería
76 ≤ tiempo(min) < 85
12% Es el porcentaje de clientes que ocuparon los asientos de una cafetería
85 ≤ tiempo(min) < 94
FI+
3 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 40
8 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 49
14 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 58
25 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 67
40 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 76
44 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 85
50 Es la cantidad acumulada de clientes que ocuparon los 31 ≤ tiempo(min) < 94
41
asientos de una cafetería
FR+
0,06 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 40
0,16 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 49
0,28 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 58
0,5 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 67
0,8 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 76
0,88 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 85
1 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 94
FR-
1 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 94
0,94 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
40 ≤ tiempo(min) < 94
0,84 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
49 ≤ tiempo(min) < 94
0,72 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
58 ≤ tiempo(min) < 94
0,5 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
67 ≤ tiempo(min) < 94
0,2 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
76 ≤ tiempo(min) < 94
FI-
50 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
31 ≤ tiempo(min) < 94
47 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
40 ≤ tiempo(min) < 94
42 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
49 ≤ tiempo(min) < 94
36 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
58 ≤ tiempo(min) < 94
25 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
67 ≤ tiempo(min) < 94
10 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
76 ≤ tiempo(min) < 94
6 Es la cantidad acumulada de clientes que ocuparon los asientos de una cafetería
85 ≤ tiempo(min) < 94
42
0,12 Es la probabilidad acumulada de clientes que ocuparon los asientos de una cafetería
85 ≤ tiempo(min) < 94
GRAFICOS
Interpolación ¿Calcular cuántos clientes ocuparon los asientos en una cafetería?
35 6
11
15
46
0
5
10
15
20
31 -40
40 -49
49 -58
58 -67
67 -76
76 -85
85 -94
Can
tid
ad d
e cl
ien
tes
Tiempo en minutos
POLIGONO
0
0,1
0,2
0,3
31 -40
40 -49
49 -58
58 -67
67 -76
76 -85
85 -94
0,060,1 0,12
0,22
0,3
0,080,12
Pro
bab
ilid
ad
Tiempo en minutos
HISTOGRAMA PROBABILISTICO
0,060,1 0,12
0,22
0,3
0,080,12
00,05
0,10,15
0,20,25
0,30,35
31 -40
40 -49
49 -58
58 -67
67 -76
76 -85
85 -94
Pro
bab
ilid
ad
Tiempo en minutos
POLIGONO PROBABILISTICO
0
5
10
15
31 -40
40 -49
49 -58
58 -67
67 -76
76 -85
85 -94
35 6
11
15
46
Can
tid
ad d
e cl
ien
tes
Tiempo en minutos
HISTOGRAMA
6%10%
12%
22%30%
8%
12%
GRAFICO DE SECTOR PROBABILISTICO
31 - 40
40 - 49
49 - 58
58 - 67
67 - 76
76 - 85
43
43 asientos ≤ ocupados ≤ 73 asientos 33 + 58 + 67 + 51 40 43 49 58 67 73 76 Respuesta=33+58+67+51=209 Calculo de x1=? 9 49 6 x Formula A total Dato
A parcial X X= (6) (49)=32,66=33 9 Calculo de Y2=? Y= (6) (76)=50,66 =51 9 ¿Qué probabilidad de que los clientes utilizaron y 43 asientos ≤ ocuparon ≤ 73 asientos 0,0667 +0,12+ 0,22+ 0,2 40 43 49 58 67 73 76 Respuesta= 0,0667+0,12+,022+0,2=0,6067 Cálculo de x1=? X= (6) (0,1)= 0,0667
9 Y= (6) (0,3) = 0,2 Ejemplo 2
X=A p*Dato =
A total Nota: la amplitud parcial
sale de la resta de 49 – 43 lo
mismo para Y sale de 67 -73.
9
Nota: las formulas también
sirve para hacer el cálculo de
la probabilidad.
44
En los últimos 40 días se tomaron los siguientes datos que representan la duración en meses de
4 botas industriales.
4,3 3,5 4,4 4,6 3,8 5,2 5,5 4,9 5,8 3,2
4,4 3,9 4,3 5,9 6,1 6,8 5,3 4,4 3,8 5,9
6,8 6,3 5,2 3,2 6,3 6,9 5,5 4,3 5,5 6,9
3,9 4,9 6,9 5,9 7,2 7,9 6,9 5,8 4,2 3,3
Construir la tabla de distribución de frecuencias
a. Realizar la interpretación de todos los datos
b. Graficar histogramas, polígonos, gráficos de sector y ojivas
c. Realizar las interpolaciones y la probabilidad
DESARROLLO
Paso 1.- Ordenar los datos en forma ascendente
3,2 3,5 3,8 4,3 4,4 4,6 4,9 5,2 5,5 5,8 3,8 3,9 4,3 4,4 4,4 5,3 5,9 5,9 6,1 6,8 3,2 4,3 5,2 5,5 5,5 6,2 6,3 6,3 6,8 6,9 3,3 3,9 4,2 4,9 5,8 5,9 6,9 6,9 7,2 7,9
Paso 2.- Identificar el Máximo y el Mínimo
Máximo: 7,9 Mínimo: 3,2
Paso 3.- Calculo del Rango
R = Max – Min R = 7,9 – 3,2
R = 4,7 Paso 4.- Calculo del Número de Filas
m = 1 + 3,32 x log (n) m = 1 + 3,32 x log (40)
m = 6,3188 m = 7
Paso 5.- Calculo de la Amplitud
A = R/m
A = 4,7/7
A = 0,6714 A = 0.7
Paso 6.- Calculo del Rango Ideal
RI=mr*Ar
Nota: las decimas de la amplitud deben cuadrar con las decimas de la tabla, si salen dos décimas dejarlos así no más, y si en la tabla hay una sola decima redondearlo. Ej.: 0,69= 0,7
45
RI=7*0,7=4,9 Margen de Desplazamiento
MD = RI – R MD = 4,9 – 4,7
MD = 0,2
MD = 0,1
Paso 7.- Calculo del Límite Inferior
Li = Min – MD Li = 3,2 – 0,1
Li = 3,1 Paso 8.- Calculo de los demás Limites Inferiores
3,7 4,3 Li1=3,1 3,8Li2=3,8 4,5 5,1 5,8 Li3=4,5 5,2Li4=5,2 5,9
6,5 7,2 Li5=5,9 6,6Li6=6,6 7,3 7,9 Li7=7,3 8
Li Ls fi fr fp FI+ FI- FR+ FR-
[3,1 3,8[ 4 0,1 10% 4 40 0,1 1
[3,8 4,5[ 11 0,275 27,5% 15 36 0,375 0,9
[4,5 5,2[ 3 0,075 7,5% 18 25 0,45 0,625
[5,2 5,9[ 8 0,2 20% 26 22 0,65 0,55
[5,9 6,6[ 7 0,175 17,5% 33 14 0,825 0,35
[6,6 7,3[ 6 0,15 15% 39 7 0,975 0,175
[7,3 8[ 1 0,025 2,5% 40 1 1 0,025
40 1 100% 0 0
INTERPRETACION
NOTA: ··Si MD es (0-1-0,1-0,01-0,001) ya es unidad básica, por lo tanto se convierte
automáticamente en el margen de desplazamiento verdadero “MDV”.
Si el resultado es un número par, se divide entre 2.
Nota: hacer este procedimiento nos va a ayudar a escanear para hacer el fi.
NOTA: para sacar el Ls se debe sumar al Li la amplitud que es 0,27 hasta el número final de la fila ya encontrada
46
fi
4 Representa la duración de:
3,1 ≤botas industriales ‹
3,8
11 Representa la duración de:
3,8 ≤botas industriales ‹
4,5
3 Representa la duración de:
4,5 ≤botas industriales ‹
5,2
8 Representa la duración de:
5,2 ≤botas industriales ‹
5,9
7 Representa la duración de:
5,9 ≤botas industriales ‹
6,6
6 Representa la duración de:
6,6 ≤botas industriales ‹
7,3
1 Representa la duración de:
7,3 ≤botas industriales ‹
8
PROBABILIDAD
fr
0,1 Es la probabilidad de duración de:
3,1 ≤botas industriales ‹
3,8
0,275 Es la probabilidad máxima de duración de:
3,8 ≤botas industriales ‹
4,5
0,075 Es la probabilidad de duración de:
4,5 ≤botas industriales ‹
5,2
0,2 Es la probabilidad de duración de:
5,2 ≤botas industriales ‹
5,9
0,175 Es la probabilidad de duración de:
5,9 ≤botas industriales ‹
6,6
0,15 Es la probabilidad mínima de duración de:
6,6 ≤botas industriales ‹
7,3
0,025 Es la probabilidad de duración de:
7,3 ≤botas industriales ‹
8
47
PORCENTAJE
fp
10% Representa el porcentaje de duración:
3,1 ≤botas industriales ‹
3,8
27,5% Representa el porcentaje de duración:
3,8 ≤botas industriales ‹
4,5
7,5% Representa el porcentaje de duración:
4,5 ≤botas industriales ‹
5,2
20% Representa el porcentaje de duración:
5,2 ≤botas industriales ‹
5,9
17,5% Representa el porcentaje de duración:
5,9 ≤botas industriales ‹
6,6
15% Representa el porcentaje de duración:
6,6 ≤botas industriales ‹
7,3
2,5% Representa el porcentaje de duración:
7,3 ≤botas industriales ‹
8
FRECUENCIA ABSOLUTA ACUMULADA MAYOR QUE
FI+
4 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
3,8
15 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
4,5
18 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
5,2
26 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
5,9
33 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
6,6
39 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
7,3
40 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
8
FRECUENCIA ABSOLUTA ACUMULADA MENOR QUE
48
FI-
40 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
8
36 Representa la duración acumulada de:
3,8 ≤botas industriales ‹
8
25 Representa la duración acumulada de:
4,5 ≤botas industriales ‹
8
22 Representa la duración acumulada de:
5,2 ≤botas industriales ‹
8
14 Representa la duración acumulada de:
5,9 ≤botas industriales ‹
8
7 Representa la duración acumulada de:
6,6 ≤botas industriales ‹
8
1 Representa la duración acumulada de:
7,3 ≤botas industriales ‹
8
FRECUENCIA REALATIVA ACUMULADA MAYOR QUE
FR+
0,1 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
3,8
0,375 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
4,5
0,45 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
5,2
0,65 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
5,9
0,825 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
6,6
0,975 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
7,3
1 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
8
49
FRECUENCIA RELATIVA ACUMULADA MENOR QUE
FR-
1 Representa la duración acumulada de:
3,1 ≤botas industriales ‹
8
0,9 Representa la duración acumulada de:
3,8 ≤botas industriales ‹
8
0,625 Representa la duración acumulada de:
4,5 ≤botas industriales ‹
8
0,55 Representa la duración acumulada de:
5,2 ≤botas industriales ‹
8
0,35 Representa la duración acumulada de:
5,9 ≤botas industriales ‹
8
0,175 Representa la duración acumulada de:
6,6 ≤botas industriales ‹
8
0,025 Representa la duración acumulada de:
7,3 ≤botas industriales ‹
8
GRÁFICOS
0
5
10
15
3.13.8
3.84.5
4.55.2
5.25.9
5.96.6
6.67.3
7.38
4
11
3
8 7 6
1
HISTOGRAMA
4
11
3
8 7 6
10
5
10
15
3.13.8
3.84.5
4.55.2
5.25.9
5.96.6
6.67.3
7.38
POLIGONO
50
Ç Interpolación ¿Calcular cuánto podrán las botas industriales? 4 botas ≤Durar ≤ 6 botas 8 + 3 + 8 + 3 3,8 4 4,5 5,2 5,9 6,2 6,6
Respuesta= 8+3+8+3=22 meses son los que van a durar las botas industriales Calculo de x1=? 0,7 11 0,5 x Formula A total Dato
10%
27,50%
7,50%20%
17,50%15%
2,50%
GRAFICO DE SECTOR
3.1 3.8
3.8 4.5
4.5 5.2
5.2 5.9
5.9 6.6
6.6 7.3
0
0,1
0,2
0,3
3.13.8
3.84.5
4.55.2
5.25.9
5.96.6
6.67.3
7.38
0,1
0,275
0,075
0,2 0,1750,15
0,025
HISTOGRAMA PROBABILISTICO
10%
27,50%
7,50%20%
17,50%
15% 2,50%
GRAFICO DE SECTOR PROBABILISTICO
3.1 3.8
3.8 4.5
4.5 5.2
5.2 5.9
5.9 6.6
6.6 7.3
0,1
0,275
0,075
0,20,175
0,15
0,0250
0,05
0,1
0,15
0,2
0,25
0,3
3.13.8
3.84.5
4.55.2
5.25.9
5.96.6
6.67.3
7.38
POLIGONO PROBABILISTICO
X=A p*Dato =
A total
51
A parcial X X= (0,5) (11) =7,85 =8 0,7 Calculo de Y2=? Y= (0,3) (7)=3 0,7 ¿Qué probabilidad de que las botas 4 botas ≤ Duren ≤ 6 botas 0,1964 + 0,075 + 0,2 + 0,075 3,8 4 4,5 5,2 5,9 6,2 6,6 Respuesta= 0,1964+0,075+0,2+0,075=0,5464 Cálculo de x1=? X= (0,5) (0,275) =0,1964
0,7 Y= (0,3) (0,175) = 0,075 Ejemplo 3 Durante 40 días se ha observado, el número de pasajeros que viajan del aeropuerto Jorge Chávez (Lima) a Trujillo. Siendo estos resultados los siguientes.
40 44 39 45 42 46 41 43 42
38 45 47 43 43 45 46 42 43
42 43 44 40 39 41 43 45 46
44 41 42 44 45 41 42 43 47
a) Construir la tabla de distribución de frecuencias
b) Realizar la interpretación de todos los datos
c) Graficar histogramas, polígonos, gráficos de sector y ojivas
d) Realizar 3 interpolaciones
DESARROLLO
Paso 1.- Ordenar de forma ascendente
Nota: la amplitud parcial sale
de la resta de 4,5-4 lo mismo
para Y sale de 6,2 -5,9.
0,7
Nota: las formulas también
sirve para hacer el cálculo de
la probabilidad.
40 44 39 45 42 46 41 43 42
38 45 47 43 43 45 46 42 43
42 43 44 40 39 41 43 45 46
44 41 42 44 45 41 42 43 47
52
38 45 47 43 43 45 46 42 43
40 44 39 45 42 46 41 43 42
42 43 44 40 39 41 43 45 46
44 41 42 44 45 41 42 43 47 Paso 2.- Identificar el Máximo y el Mínimo Máximo: 47 Mínimo: 38 Paso 3.- Calculo del Rango
R = Max – Min R = 47 – 38
R = 9 Paso 4. -Calculo del Número de Filas
m = 1 + 3,32 x log (n) m = 1 + 3,32 x log (36)
m =6.1669 m = 7
Paso 5.- Calculo de la Amplitud
A = R/m
A = 9/7
A = 1.2857
A =2 Paso 6.-Calculo del Rango Ideal
RI= mr.* Ar RI= 7 * 2 = 14 Margen de Desplazamiento
MD = RI – R MD = 14 – 9
MD = 5
MD = 1
Nota: las decimas de la amplitud deben cuadrar con las decimas de la tabla, si salen dos décimas dejarlos así no más, y si en la tabla hay una sola decima redondearlo. Ej.: 1.2857= 2
NOTA: ··Si MD es (0-1-0,1-0,01-0,001) ya es unidad básica, por lo tanto se convierte
automáticamente en el margen de desplazamiento verdadero “MDV”.
Si el resultado es un número par, se divide entre 2.
53
Pasó 7.- Calculo del Límite Inferior
Li = Min – MD Li = 38 – 1
Li = 37 Pasó 8.- Calculo de los demás Limites Inferiores
38 40 Li1=37 39 Li2=39 41 42 44 Li3=41 43 Li4= 43 45
46 48 Li5=45 47 Li6=47 749 Tabla
Li Ls Fi fr fp FI+ FI- FR+ FR-
37 39 1 0,02778 3% 1 36 0,0278 1
39 41 4 0,11111 11% 5 35 0,1389 0,9722
41 43 10 0,27778 28% 15 31 0,4167 0,8611
43 45 11 0,30556 31% 26 21 0,7222 0,5833
45 47 8 0,22222 22% 34 10 0,9444 0,2778
47 49 2 0,05556 6% 36 2 1 0,0556
36 1 100% 0 0
INTERPRETACION
fi
1 son los días observados cuyo:
37 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
39
4 son los días observados cuyo:
39 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
41
10 son los días observados cuyo:
41 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
43
11 son los días observados cuyo:
43 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
45
8 son los días observados cuyo:
45 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
47
Nota: hacer este procedimiento nos va a ayudar a escanear para hacer el fi.
54
<
2 son los días observados cuyo:
47 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
49
PROBABILIDAD
fr
0.02778 es la probabilidad de días observados cuyo:
33 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
39
0.1111
es la probabilidad de días observados cuyo:
39 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo <
41
0.2777 es la probabilidad de días observados cuyo:
41 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo <
43
0.3055 es la probabilidad de días observados cuyo:
43 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo <
45
0,2222 es la probabilidad de días observados cuyo:
45 ≤ que viajan del
aeropuertoJorgerChavez
a Trujillo <
47
0.05556 es la probabilidad de días observados cuyo:
47 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo <
49
PORCENTAJE
fp
3% es el porcentaje de días observados cuyo:
37 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
39
11% es el porcentaje de días observados cuyo:
39 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
41
28% es el porcentaje de días observados cuyo:
41 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
43
31% es el porcentaje de días observados cuyo:
43 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
45
22% es el porcentaje de días observados cuyo:
45 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
47
6% es el porcentaje de días observados cuyo:
47 ≤ que viajan del
aeropuerto Jorger
49
55
Chavez a Trujillo<
FRECUENCIA ABSOLUTA ACUMULADA MAYOR QUE
FI+
1 son los días acumulados observados cuyo:
37 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
39
5 son los días acumulados observados cuyo:
37 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
41
15 son los días acumulados observados cuyo:
37 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
43
26 son los días acumulados observados cuyo:
37 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
45
34 son los días acumulados observados cuyo:
37 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
47
36 son los días acumulados observados cuyo:
37 ≤ que viajan del
aeropuerto Jorger Chavez a Trujillo
<
49
FRECUENCIA ABSOLUTA ACUMULADA MENOR QUE
FI-
36 son los días acumulados observados cuyo:
37 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
47
35 son los días acumulados observados cuyo:
39 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
47
31 son los días acumulados observados cuyo:
41 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
47
21 son los días acumulados observados cuyo:
43 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
47
56
10 son los días acumulados observados cuyo:
45 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
47
2 son los días acumulados observados cuyo:
47 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo<
47
FRECUENCIA REALATIVA ACUMULADA MAYOR QUE
FR+
0.2778 son los días acumulados observados cuyo:
33 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo <
39
0.1389 son los días acumulados observados cuyo:
33 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo <
41
0.4167 son los días acumulados observados cuyo:
33 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo <
43
0.7222 son los días acumulados observados cuyo:
33 ≤ que viajan del
aeropuertoJorgerChavez
a Trujillo <
45
0.9444 son los días acumulados observados cuyo:
33 ≤ que viajan del
aeropuerto Jorger
Chavez a Trujillo <
47
1 son los días acumulados observados cuyo:
33 ≤ que viajan del
aeropuerto JorgerChavez a Trujillo
<
49
FRECUENCIA RELATIVA ACUMULADA MENOR QUE
FR-
1 son los días acumulados observados cuyo:
39 ≤ que viajan del aeropuerto Jorger Chavez a Trujillo<
47
0.9722 son los días acumulados observados cuyo:
41 ≤ que viajan del aeropuerto Jorger Chavez a Trujillo<
47
0.8611 son los días acumulados observados cuyo:
43 ≤ que viajan del aeropuerto Jorger Chavez a Trujillo<
47
0.5833 son los días acumulados observados cuyo:
45 ≤ que viajan del aeropuerto Jorger Chavez
a Trujillo<
47
57
0.2778 son los días acumulados observados cuyo:
47 ≤ que viajan del aeropuerto Jorger Chavez a Trujillo<
47
0.0556 son los días acumulados observados cuyo:
49 ≤ que viajan del aeropuerto Jorger Chavez a Trujillo<
47
Gráficos INTERPOLACION
0%
20%
40%
1 2 3 4 5 6
HISTOGRAMA
fp0
5
10
15
20
25
30
35
40
1 2 3 4 5 6
Títu
lo d
el e
je
POLIGONO
FI+
127%
226%
323%
416%
57%
61%
Título del gráficoGRAFICOS DE SECTOR
0%
20%
40%
60%
80%
100%
1 2
HIRTOGRAMA PROBABILISTICO
FR+ 0,0278 0,13890,4167 0,72220,9444
58
¿Calcular el número de pasajeros que viajan? 42 pasajeros ≤ Entre ≤ 48 pasajeros 4 + 10 + 11 + 2 41 42 43 45 47 48 49
Respuesta= 4+10+11+2=27 son los pasajeros que viajan en el aeropuerto Jorge Chávez (Lima) a Trujillo.
Calculo de x1=? 2 4 1 x Formula A total Dato
A parcial X X= (1) (4) =2 2 Calculo de Y2=? Y= (1) (2)=1 2 PROBABILIDAD ¿Calcular el número de pasajeros que viajan? 42 pasajeros ≤ Entre ≤ 48 pasajeros 0,11111 + 0,27778 + 0,30556 + 0,05556 41 42 43 45 47 48 49 Respuesta= 0,1964+0,075+0,2+0,075=0,5464 Cálculo de x1=? X= (1) (0,11111) =0,0555
2 Y= (1) (0,05556) = 0,0277
X=A p*Dato =
A total Nota: la amplitud parcial sale
de la resta de 4,5-4 lo mismo
para Y sale de 6,2 -5,9.
2
Nota: las formulas también
sirve para hacer el cálculo de
la probabilidad.
59
Ejemplo 4
El contenido de nicotina, en miligramos, para 60 cigarrillos de cierta marca se registraron de la siguiente manera:
1,09 1,58 1,64 1,37 1,92 2,03 0,72 1,93 2,31 1,70 1,53 1,50 1,69 1,40 1,79 2,17 1,85 1,64 2,28 2,55 1,82 2,09 2,27 2,50 1,74 2,11 1,79 1,75 1,47 1,86 2,46 1,63 1,97 1,90 0,95 0,87 1,88 2,37 0,85 1,68 2,08 1,75 1,24 1,51 1,67 1,69 1,23 2,15 0,75 1,67 1,92 0,79 0,94 2,14
1,22 0,89 2,13 2,36 1,06 1.09
a. Construir la tabla de distribución de frecuencias b. Realizar la interpretación de todos los datos c. Graficar histogramas, polígonos, gráficos de sector y ojivas d. Realizar las interpolaciones de cantidad y las probabilidades
DESARROLLO a) Paso 1.- Ordenar los datos en forma ascendente
0,72 0,75 0,79 0,85 0,87 0,89 0,94 0,95 1,06
1,09 1,09 1,22 1,23 1,24 1,37 1,40 1,47 1,50
1,51 1,53 1,58 1,63 1,64 1,64 1,67 1,67 1,68
1,69 1,69 1,70 1,74 1,75 1,75 1,79 1,79 1,82
1,85 1,86 1,88 1,90 1,92 1,92 1,93 1,97 2,03
2,08 2,09 2,11 2,13 2,14 2,15 2,17 2,27 2,28
2,31 2,36 2,37 2,46 2,50 2,55
Paso 2.- Identificar el Máximo y el Mínimo
Máximo: 2,55 Mínimo: 0,72 Paso 3.- Calculo del Rango
R = Max – Min R = 2,55 – 0,72
R = 1,83
60
Paso 4.- Calculo del Número de Filas m = 1 + 3,32 x log (n) m = 1 + 3,32 x log (60)
m = 6,90346 m = 7
Paso 5.- Calculo de la Amplitud A = R/m
A = 1,83/7 A = 0,2614
A =0,27 Paso 6.- Calculo del Rango Ideal
RI = m x A RI = 7 x 0,27
RI = 1,89 Margen de Desplazamiento
MD = RI – R MD = 1,89 – 1,83
MD = 0,06 MD = 0,03
MVD=0,01 Paso 7.- Calculo del Límite Inferior
Li = Min – MD Li = 0,72 – 0,03
Li = 0,69 Paso 8.- Calculo de los demás Limites Inferiores 0,95 1,22 Li1=0,69 0,96 Li2=0,96 1,23 1,49 1,76 Li3=1,23 1,50 Li4=1,50 1,77
2,03 2,30 Li5=1,77 2,04 Li6=2,04 2,31 2,57 Li7=2,31 2,58
Nota: las decimas de la amplitud deben cuadrar con las decimas de la tabla, si salen dos décimas dejarlos así no más, y si en la tabla hay una sola decima redondearlo. Ej.: 0,69= 0,7
NOTA: ··Si MD es (0-1-0,1-0,01-0,001) ya es unidad básica, por lo tanto se convierte
automáticamente en el margen de desplazamiento verdadero “MDV”.
Si el resultado es un número par, se divide entre 2.
Nota: hacer este procedimiento nos va a ayudar a escanear para hacer el fi.
61
INTERPRETACION
Fi
8 Es la cantidad de cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 0,96 nicotina
4 Es la cantidad de cigarrillos de cierta marca que contienen entre
0,96 ≤ miligramos de<1,23 nicotina
5 Es la cantidad de cigarrillos de cierta marca que contienen entre
1,23≤ miligramos de< 1,50 nicotina
16 Es la cantidad de cigarrillos de cierta marca que contienen entre
1,50 ≤ miligramos de< 1,77 nicotina
12 Es la cantidad de cigarrillos de cierta marca que contienen entre
1,77 ≤ miligramos de<2,04 nicotina
9 Es la cantidad de cigarrillos de cierta marca que contienen entre
2,04 ≤ miligramos de< 2,31 nicotina
6 Es la cantidad de cigarrillos de cierta marca que contienen entre
2,31 ≤ miligramos de< 2,58 nicotina
fr
0,1333 Es la probabilidad de que cigarrillos de cierta marca contengan entre
0,69 ≤ miligramos de< 0,96 nicotina
0,0666 Es la mínima probabilidad de que cigarrillos de cierta marca contengan entre
0,96 ≤ miligramos de<1,23 nicotina
0,0833 Es la mínima probabilidad de que cigarrillos de cierta marca contengan entre
1,23≤ miligramos de< 1,50 nicotina
0,2666 Es la máxima probabilidad de que cigarrillos de cierta marca contengan entre
1,50 ≤ miligramos de< 1,77 nicotina
0,2000 Es la probabilidad de que cigarrillos de cierta marca contengan entre
1,77 ≤ miligramos de<2,04 nicotina
0,1500 Es la probabilidad de que cigarrillos de cierta marca contengan entre
2,04 ≤ miligramos de< 2,31 nicotina
0,1000 Es la mínima probabilidad de que cigarrillos de cierta marca contengan entre
2,31 ≤ miligramos de< 2,58 nicotina
Li Ls Fi Fr Fp FI+ FI- FR+ FR-
[0,69 0,96[ 8 0,1333 13,33% 8 60 0,1333 1,0000
[0,96 1,23[ 4 0,0666 6,66% 12 52 0,1999 0,8667
[1,23 1,50[ 5 0,0833 8,33% 17 48 0,2832 0,8001
[1,50 1,77[ 16 0,2666 26,66% 33 43 0,5498 0,7168
[1,77 2,04[ 12 0,2000 20,00% 45 27 0,7498 0,4502
[2,04 2,31[ 9 0,1500 15,00% 54 15 0,8998 0,2502
[2,31 2,58[ 6 0,1000 10,00% 60 6 1,0000 0,1002
60 1,0000 100,00% 0 0,0000
NOTA: para sacar el Ls se debe sumar al Li la amplitud que es 0,27 hasta el número final de la fila ya encontrada
62
FI+
8 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 0,96 nicotina
12 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 1,23 nicotina
17 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 1,50 nicotina
33 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 1,77 nicotina
45 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 2,04 nicotina
54 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 2,31 nicotina
60 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 2,58 nicotina
FI-
60 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 2,58 nicotina
52 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
0.96 ≤ miligramos de< 2,58 nicotina
48 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
1,23 ≤ miligramos de< 2,58 nicotina
43 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
1,50 ≤ miligramos de< 2,58 nicotina
27 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
1,77 ≤ miligramos de< 2,58 nicotina
15 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
2,04 ≤ miligramos de< 2,58 nicotina
6 Es la cantidad acumulada de cigarrillos de cierta marca que contienen entre
2,31 ≤ miligramos de< 2,58 nicotina
fp%
13,33% Es el porcentajede cigarrillos de cierta marca que contienen entre
0,69 ≤ miligramos de< 0,96 nicotina
6,66% Es el porcentajede cigarrillos de cierta marca que contienen entre
0,96 ≤ miligramos de<1,23 nicotina
8,33% Es el porcentajede cigarrillos de cierta marca que contienen entre
1,23≤ miligramos de< 1,50 nicotina
26,66% Es el porcentajede cigarrillos de cierta marca que contienen entre
1,50 ≤ miligramos de< 1,77 nicotina
20,00% Es el porcentajede cigarrillos de cierta marca que contienen entre
1,77 ≤ miligramos de<2,04 nicotina
15,00% Es el porcentajede cigarrillos de cierta marca que contienen entre
2,04 ≤ miligramos de< 2,31 nicotina
10,00% Es el porcentajede cigarrillos de cierta marca que contienen entre
2,31 ≤ miligramos de< 2,58 nicotina
63
FR+
0,1333 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
0,69 ≤ miligramos de< 0,96 nicotina
0,1999 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
0,69 ≤ miligramos de< 1,23 nicotina
0,2832 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
0,69 ≤ miligramos de< 1,50 nicotina
0,5498 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
0,69 ≤ miligramos de< 1,77 nicotina
0,7498 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
0,69 ≤ miligramos de< 2,04 nicotina
0,8998 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
0,69 ≤ miligramos de< 2,31 nicotina
1,0000 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
0,69 ≤ miligramos de< 2,58 nicotina
FR-
1,0000 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
0,69 ≤ miligramos de< 2,58 nicotina
0,8667 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
0.96 ≤ miligramos de< 2,58 nicotina
0,8001 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
1,23 ≤ miligramos de< 2,58 nicotina
0,7168 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
1,50 ≤ miligramos de< 2,58 nicotina
0,4502 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
1,77 ≤ miligramos de< 2,58 nicotina
0,2502 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
2,04 ≤ miligramos de< 2,58 nicotina
0,1002 Es la probabilidad acumulada de que cigarrillos de cierta marca contengan entre
2,31 ≤ miligramos de< 2,58 nicotina
64
0
2
4
6
8
10
12
14
16
0.690.96
0.961.23
1.231.5
1.51.77
1.772.04
2.042.31
2.312.58
HISTOGRAMA DE FRECUENCIA
0
0,05
0,1
0,15
0,2
0,25
0,3
0.690.96
0.961.23
1.231.5
1.51.77
1.772.04
2.042.31
2.312.58
HISTOGRAMA PROBABILISTICO
0,133333333
0,066666667
0,083333333
0,266666667
0,2
0,15
0,1
0
0,05
0,1
0,15
0,2
0,25
0,3
0.690.96
0.961.23
1.231.5
1.51.77
1.772.04
2.042.31
2.312.58
POLIGONO PROBABILISTICO
8
4
5
16
12
9
6
GRAFICO DE SECTOR DE FRECUENCIA
0.69 0.96 0.96 1.23 1.23 1.5 1.5 1.77
1.77 2.04 2.04 2.31 2.31 2.58
8
4 5
16
129
6
0.69 0.96
0.96 1.23
1.23 1.51.5 1.77 1.77 2.04
2.04 2.31
2.31 2.58
POLIGONO DE FRECUENCIA
0.69 0.96
0.96 1.23
1.23 1.5
1.5 1.77
1.77 2.04
2.04 2.31
2.31 2.58
GRAFICO DE SECTOR PROBABILISTICO
Gráficos
65
Interpolación
1. ¿Qué cantidad cigarrillos contienen como mínimo 1,20miligramos de nicotina y menor a 2?
1,20 ≤ miligramos de nicotina <2 1 + 5 + 16 + 11 0,96 1,20 1,23 1,50 1,77 2 2,04 Respuesta=1+5+16+11=33 Calculo de x1=? 0,27 4 0,03 x Formula A total Dato
A parcial X X=(0,03) (4) =0,44 =1 0,27 Calculo de Y2=? Y= (0,23) (12)=10,22=11 0,27 ¿Qué probabilidad hay de que los cigarrillos contengan como minimo 1,20 miligramos de nicotina y menos de 2? 1,20 ≤ miligramos de nicotina <2
0,1111 + 0,08 + 0,26 + 0,2222 3,8 4 4,5 5,2 5,9 6,2 6,6 Respuesta=0,1111+0,08+0,26+,02222=0,6733 Cálculo de x1=? X= (0,5) (0,06) =0,1111
0,27 Y= (0,3) (0,20) = 0,2222
X=A p*Dato =
A total Nota: la amplitud parcial sale
de la resta de 1,23-1,20lo
mismo para Y sale de 2-1,77.
0,27
Nota: las formulas también
sirve para hacer el cálculo de
la probabilidad.
66
Unidad 2 Medidas de tendencia central
A. OBJETIVOS
Identificar las medidas de tendencia central más utilizadas.
Calcular las medidas de tendencia central.
Interpretar las medidas de tendencia central.
Aplicar un Software para determinar estas medias. B. ACTIVIDADES DE APRENDIZAJE
Del mismo modo que los gráficos pueden mejorar la presentación de los datos, las descripciones numéricas también tiene gran valor. Una característica importante de un conjunto de datos es su tendencia central, las medidas de tendencia central determinan que tan agrupados se encuentran los datos alrededor de un valor fijo. Entre estas tenemos:
media (aritmética)
media geométrica
media cuadrática
media armónica
mediana
moda
fractiles (cuartiles, deciles y percentiles)
En estadística es normal representar una medida descriptiva de una población o parámetro poblacional mediante letras griegas, en tanto que se utilizan letras romanas para las medidas descriptivas de muestra, o estadísticas muestrales.
Por ejemplo, vamos a crear una nueva empresa de ventas de equipos de computación y necesitamos saber ¿Cuántas computadoras existen en el departamento de santa cruz para realizar un estudio de mercado?
Población
P Muestra
𝑥 =∑ 𝑥𝑖
𝑛𝑖=1
𝑛
(Media aritmética muestra)
67
En cuanto a operaciones se refiere, las dos fórmulas son idénticas, en ambos casos se suman todos los valores y después se divide ese total entre el número total de datos.
Cálculo de la mediana
NO. De clases
# 1
Limites Limites
Frecuencia
Inf. Sup.
Inf. Sup. n fi
1 2 3 4 5 6 7 8
173 195 217 239 261 283 305 327
194 216 238 260 282 304 326 348
172.5 194.5 216.5 238.5 260.5 282.5 304.5 326.5
194.5 216.5 238.5 260.5 282.5 304.5 326.5 348.5
2 7
10 22 37 12 6 4
2 9 19 41 78 90 96 100
100
𝑀𝑒𝑑 = 260,5 + (100
2−41
37) ∗ 22 =265,85 psi, 50 % de las botellas que fueron analizadas.
Cuadro Datos ordenados de datos de presión.
176 187 197 200 205 208 210 214 215 220
221 223 228 231 231 234 235 235 235 242
242 243 245 246 248 248 250 250 250 251
253 254 254 257 258 258 258 260 260 260
260 261 262 263 263 264 264 265 265 265
265 265 265 267 267 268 269 269 270 271
271 272 274 274 274 274 275 276 276 277
278 278 280 280 280 280 281 281 283 283
286 287 290 293 294 296 298 299 299 300
307 307 308 317 318 321 328 334 337 346
Moda La naturaleza y usos de la moda La moda es con frecuencia el concepto que la mayoría de las personas tienen en la
mente cuando hablan de valores frecuentes, cuando los estudiantes dicen que la
calificación más frecuente en “elementos de cálculo” es 51, dan a entender que esta
nota, más que cualquier otra, es la calificación que predomina en los estudiantes.
Lmed = 260, 5 Fmed = 41 ƒmed = 37 amed = 22 n = 100
De datos ordenados
el valor central de
los 100 datos está
situado al medio de
los datos 50 y 51 por
tanto la mediana de
datos no agrupados
es:
La moda de una serie de valores es aquel de ellos que se presenta con mayor frecuencia.
68
El “consumidor medio” suele significar aquel consumidor que aparece con mayor
frecuencia en la relación con su cuadro de consumo a otra cualidad.
El término “salario típico” se refiereal salario modal, la
mayoría de lossueldos están referidos a ese valor
monetario.
El tamaño modal de zapatos para hombre es el
tamaño típico comprado porque más personas adquirirán ese tamaño que cualquier otro.
Así, usamos la moda con preferencia a otros promedios si deseamos indicar el valor
más típico de la serie.
Aunque la moda es un concepto muy sencillo y útil, su aplicación plantea muchos
problemas difíciles. Primero, una distribución puede revelar que dos o más valores se
repitan igual número de veces, y en tal caso no hay forma lógica de determinar qué valor
debe escogerse pudiendo ser bimodal, etc.
MODA Es la observación que se presenta con mayor frecuencia, o dicho de otro modo, es la observación que se repite más veces. Matemáticamente:
Para datos agrupados Para datos no agrupados
ALiMo
21
1
∆𝟏=𝑭𝒊−𝑭𝒊−𝟏∆𝟐= 𝑭𝒊−𝑭𝒊+𝟏
Buscar dentro de los datos el número que se repite mayor cantidad de veces.
MEDIA La medida más común de centro de un conjunto de datos es el promedio o media aritmética. Matemáticamente:
Para datos agrupados Para datos no agrupados
𝑥 =∑ 𝑀𝐶. 𝑓𝑖
𝑛
Calcular el promedio, como se hace normalmente.
69
MEDIANA Es otra medida de tendencia central, representa el punto o valor donde el conjunto de datos se divide en dos partes iguales. La palabra “mediana” es sinónimo de parte media. Matemáticamente:
Para datos agrupados Para datos no agrupados
𝑴𝒆 = 𝑳𝒊 + [
𝒏
𝟐− 𝑭𝑰 − 𝟏
𝑭𝒊] ∗ 𝑨
Ordenar los datos de menor a mayor y ubicar el valor o los valores, según corresponda, a la mitad de los datos.
FRACTILES Los fractiles son valores que dividen a un conjunto de datos en partes iguales. Por ejemplo los cuartiles dividen el conjunto de datos en 4 grupos de igual tamaño, los deciles en 10 grupos y los percentiles en 100 grupos.
EJEMPLO 1
La siguiente tabla muestra la inversión en miles de dólares de diferentes países que
visitaron Bolivia cuando se celebró la G 77 más china.
Li Ls Fi Mc Mc.Fi FI+
0 8 15 4 60 15
8 16 20 12 240 35
16 24 10 20 200 45
24 32 8 28 224 53
32 40 2 36 72 55
40 48 1 44 44 56
48 56 3 52 150 59
56 64 1 60 60 60
T=60 T=1056
Calcular:
a) Calcular la mediana, media y la
b) Calcular la Kurtosis
ALiQrfi
1-i FI4
r.n
ALiDrfi
110
r.n
FIi
ALiPrfi
1100
r.n
FIi
70
Calculo de la mediana
Me= Li + [n
2−FI
Li]* A Me= 8+ [
30− 35
20]* 8 = 6
Calculo de la moda
Mo= Li + [∆1
∆1+∆2]* A Mo= 8 + [
5
5+10]* 8 = 10,66
Calculo del Quartil 1=?
Q1= Li + [n
4−FI
Li]* A Q1= 0 + [
15−0
15]* 8 = 8
Calculo del Quartil 3=?
Q3= Li + [3n
4−FI
Li]* A Q3= 16 + [
45−35
10]* 8 = 24
Calculo del percentil 10=?
P10= Li + [10n
100−FI
Li]* A P10= 0 + [
6−0
15]* 8 = 3,2
Calculo del percentil 90=?
P90= Li + [90n
100−FI
Li]* A P90= 32 + [
34−53
2]* 8 = 36
Calculo del rango semi-intercuartil
RSI= Q3−Q1
2 RSI=
24−8
2 = 8
Calculo de kurtosis
K= RSI
P90−P10 K=
8
3,6−3,2 = 0,24
Presenta una curva plasticurtica o achatada = 0,24
Nota: para poder hacer el cálculo de la moda se debe buscar el número más elevado en el fi con minúsculas.
71
Ejemplo 2 Consultados 310 matrimonios sobre la edad de la esposa, se confecciona la siguiente tabla:
Li Ls Fi FI MC Mc*Fi
15 19 23 23 17 391
20 24 28 51p10 22 616
25 29 76mo 127Q1 27 2052
30 34 54 181me 32 1728
35 39 60 241Q3 37 2220
40 44 42 283p90 42 1764
45 49 27 310 47 1269
310 10040
Calcular: a) Media, Mediana y Moda
b) La kurtosis
1. Calculo del Quartil 1
𝑄1 = 𝐿𝑖 + [
𝑛
4− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 25 + [
77,5 − 51
76] ∗ 9 = 28,014
2. Calculo de Quartil 3
𝑄3 = 𝐿𝑖 + [
3𝑛
4− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 35 + [
232.5 + 181
60] ∗ 9 = 97,02
3. Calculo de Percentil 10
𝑃10 = 𝐿𝑖 + [
10𝑛
100− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 20 + [
31 − 23
23] ∗ 9 = 23,13
4. Calculo de Percentil 90
𝑃90 = 𝐿𝑖 + [
90𝑛
100− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 40 + [
279 − 241
42] ∗ 9 = 48,14
5. Calculo de Rango Semi Intercuartil
𝑅𝑆𝐼 =𝑄3 − 𝑄1
2=
97,02 − 28,014
2= 34,50
72
6. Calculo de Kurtosis
𝐾 =𝑅𝑆𝐼
𝑃90 − 𝑃10=
34,50
48,14 − 23,13= 1,379
Representa una curva leptocurtica ya que K = 1,379
7. Calculo de la Media
𝑋 =∑(𝑀𝑐 ∗ 𝐹𝑖)
𝑁𝑡=
10040
310= 32,38
8. Calculo de la Mediana
𝑀𝑒 = 𝐿𝑖 + [
𝑛
2− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 30 + [
155 − 127
54] ∗ 9 = 34,66
9. Calculo de la Moda
𝑀𝑜 = 𝐿𝑖 + [𝐴1
𝐴1 + 𝐴2] ∗ 𝐴 = 25 + [
48
48 + 22] ∗ 9 = 31,17
Nota: para poder hacer el cálculo de la moda se debe buscar el número más elevado en el fi con minúsculas.
73
Unidad 3
Medidas de dispersión
OBJETIVOS
Identificar las medidas de dispersión más aplicadas.
Calcular las medidas de dispersión.
Interpretar las medidas de dispersión.
Aplicar un Software para determinar estas medidas.
Las medidas de tendencia central no necesariamente proporcionan información suficiente para describir datos de manera adecuada es así que surgen las medidas de dispersión que indican cuan dispersos o alejados están los datos con relación a un valor fijo.
Las medidas de dispersión son importantes cuando se comparan grupos de datos provenientes de distintas fuentes. Entre las medidas de dispersión más usuales tenemos a:
RANGO
Esta es una medida de dispersión que solo toma en cuenta el valor mínimo y el valor máximo de un conjunto de datos para dar una idea de la variabilidad del conjunto. Matemáticamente:
RANGO= MAX – MIN Para datos agrupados y no agrupados
DESVIACION MEDIA
Medida de dispersión tomando valores absolutos, para su cálculo utiliza a todo el conjunto de datos. Matemáticamente:
n
xxDM
Para datos no agrupados
n
fi.xMCDM
para datos
agrupados, RANGO SEMI-INTERCUARTIL Medida de dispersión calculada en función a los cuartiles. Matemáticamente:
2
1Q3QRSI
Para datos agrupados y no agrupados
DESVIACION TIPICA Otra medida de dispersión, la más usada por que utiliza a todos los datos para su cálculo. Matemáticamente:
Nota. Otra forma de interpretar las medidas de dispersión es decir que representan la homogeneidad de los datos, mientras más pequeña es la dispersión los datos están más juntos y viceversa.
Nota.
A. Si n 30 se usa la
formula con el termino n-1.
B. SI n ≥ 30 se usa la formula con el
termino n.
74
n
fxMCs
.2
O
1n
.f2
xMCs
para datos agrupados
n
2xx
s
O
1n
2xx
s
para datos no agrupados
EJERCICIO 1:
El número de ordenadores que hay en los hogares de un grupo de personas, A,
viene dado en la siguiente tabla: Número de Ordenadores 0 1 2 3 4
Número de personas 15 22 10 2 1
a) Halla la media y la desviación típica de esta distribución. b) b) Haciendo el mismo estudio en otro grupo, B, de personas, la media ha sido de 2,1 y la
Desviación típica de 0,92. Calcula el coeficiente de variación en los dos casos y di en cuál de ellos la variación relativa es mayor. Solución: Xi=MC=Marca de clase
Xi=MC fi fi*MC fi*MC2 MCfi 2MCfi
0 15 0 0 15 225 1 22 22 22 21 441 2 10 20 40 8 16 3 2 6 18 -1 1 4 1 4 16 -3 9 50 52 692
1,04n
MC*fix
3,751-n
2MCfi
s
49,5%100x
sa CV
1,13%100x
sb CV
La variación en A es más significativa que la variación en B
Importante: Para datos no agrupados resulta más rápido calcular la media y la desviación a través del uso de las funciones de una calculadora
75
EJERCICIO 2:
Midiendo el peso, en kilogramos, de los niños las niñas de un determinado grupo,
todos ellos de la misma edad, hemos obtenido los siguientes resultados:
a) Calcular la media desviación típica.
b) En cuanto al peso ¿Es un grupo homogéneo o disperso?
Peso (Kg) 10,13 13,16 16,19 19,22 22,25
Número de
niños/as 6 50 32 9 3
Solución: Hallamos una marca de clase Xi=MC de cada intervalo y hacemos tabla: INTERVALO Xi=MC fi fi*MC
fi*MC2 MCfi 2MCfi
10 13 11,5 6 69 793,5 -5.5 30,25 13 16 14,5 50 725 10 512,5 35,5 1260,25 16 19 17,5 32 560 9 800 14.5 210,25 19 22 20,5 9 184,5 3782,25 -11.5 132,25 22 25 23,5 3 70,5 1656,75 -20,5 420,25 TOTAL 100 1609 26545 2053.25
16,09n
MC*fix
4,551-n
2MCfi
s
28,30%100x
sCV
COEFICIENTE DE VARIACIÓN. ESTUDIO DE LA DISPERSIÓN EJERCICIO 3:
En un grupo, A, de personas, la estatura media es 165 cm, con una desviación típica de 10,5 cm. En otro grupo, B, la estatura media es 140 cm y su desviación típica, 8,4 cm. Calcula el coeficiente de variación en los dos casos y compara la dispersión de ambos grupos. Solución:
%36,6100*)165/5,10(100x
sCV
%6100*)140/4,8(100x
sCV
La dispersión es algo mayor en el grupo A
Importante: Para datos no agrupados resulta más rápido calcular la media y la desviación a través del uso de las funciones de una calculadora
76
EJERCICIO 4:
Las notas obtenidas en un examen de matemáticas por las alumnas y los alumnos de una clase de 4º ESO vienen reflejadas en esta tabla:
Nota 2 3 4 5 6 7 8 9 10
Alumnos 1 2 3 5 4 6 4 3 2
a) Calcula la media y la desviación típica. b) ¿Qué porcentaje de alumnos/as hay en el intervalo (x - σ, x + σ)? Solución:
Xi=MC fi fi*MC fi*MC2 MCfi 2MCfi
2 1 2 4 -1 1 3 2 6 18 -1 1 4 3 12 48 -1 1 5 5 25 125 0 0 6 4 24 144 -2 4 7 6 42 294 -1 1 8 4 32 256 -4 16 9 3 27 243 -6 36 10 2 20 200 -8 64 Total 30 190 1332 124
6,33n
MC*fix
2,06781-n
2MCfi
s
% 32,65100x
sCV
b) X – s = 4,27 X + s=9 En el intervalo de (4,27 y 9 ) hay 19 alumnos que representan un 63,3%
Importante: Para datos no agrupados resulta más rápido calcular la media y la desviación a través del uso de las funciones de una calculadora
77
RECOPILACION: MEDIA DESVIACIONTIPICA Y COEFICIENTE DE VARIACION EJERCICIO 5:
El tiempo medio empleado por el tren en recorrer un cierto trayecto es de 25 minutos, con una desviación típica de 5 minutos. Haciendo el mismo trayecto en coche, el tiempo medio ha sido de 35 minutos, con una desviación típica de 15 minutos. Calcula el coeficiente de variación y di en cuál de los dos casos hay mayor variación relativa. Solución:
% 20100*)25/5(100x
sCV
% 43100*)35/15(100x
sCV
La varianza relativa es mayor en el segundo caso.
EJERCICIO 6
Al finalizar el curso, el número de asignaturas suspensas en un grupo, A, de 35 alumnos/as se reflejaba en la siguiente tabla:
Numero de suspendidos 0 1 2 3 4 5 6
Número de alumnos/as 10 8 6 5 3 2 1
a) Calcular el número medio de suspensos y la desviación tipia.
b) En otro grupo, B, el número medio de suspensos fue de 3, con una desviación típica de 2,4. Hallar
el coeficiente de variación en los dos casos y compara la dispersión en ambos grupos.
Xi=MC fi fi*MC MCfi 2MCfi
0 10 0 10 20 1 8 8 7 49 2 6 12 4 16 3 5 15 2 4 4 3 12 -1 1 5 2 10 -3 9 6 1 6 -5 25
total 35 63 124
1,8n
MC*fix
1,901-n
2MCfi
s
94,7%100*(1,8/1,9)100x
sCV
80%100*(2,4/3)100x
sCV
Importante: Para datos no agrupados resulta más rápido calcular la media y la desviación a través del uso de las funciones de una calculadora
78
La varianza relativa es mayor en el primer caso. VARIANZA Matemáticamente:
2sVarianza Para datos agrupados y no agrupados
COEFICIENTE DE VARIACION
Permite calcular en porcentaje la dispersión, es una medida de dispersión relativa. Matemáticamente:
100x
sCV Para datos agrupados y no agrupados
PROBLEMA ABP (Para datos agrupados) Determine la desviación media, el rango semi-intercuartil, la desviación estándar y la varianza correspondientes a las ventas de aceite FINO VITAMINAS de INDUSTRIAS FINO
CUADRO DE DISTRIBUCION DE FRECUENCIAS
# l
Límites Fronteras
MC=x f FI(-) fr % FR (-) % Li Ls Fi Fs
1 2 4 1.5 4.5 3 5 5 16.67 16.67
2 5 7 4.5 7.5 6 10 15 33.33 50.00
3 8 10 7.5 10.5 9 4 19 13.33 63.33
4 11 13 10.5 13.5 12 7 26 23.33 86.66
5 14 16 13.5 16.5 15 2 28 6.67 93.33
6 17 19 16.5 19.5 18 2 30 6.67 100
79
�̅� =∑ 𝑀𝐶∙𝑓𝑖
𝑛 =
261
30= 8.70
𝐷𝑀 =∑|𝑀𝐶 − �̅�| ∙ 𝑓
𝑛=
111
30= 3.70
RANGO SEMI-INTERCUARTIL
𝑄1 = 𝐿𝑖 +𝑛
4−𝐹𝐼𝑖−1
𝑓∙ 𝐴 = 4.5 +
7.5−5
10∙ 3 = 5.25
𝑄3 = 𝐿𝑖 +
3𝑛
4− 𝐹𝐼𝑖−1
𝑓∙ 𝐴 = 10.5 +
22.5 − 19
7∙ 3 = 12
𝑅𝑆𝐼 = 𝑄3 − 𝑄1
2=
12 − 5.25
2= 3.38
DESVIACION ESTANDAR
�̅� =∑ 𝑓𝑖 ∗ 𝑀𝐶
𝑛 =
261
30= 8.70
𝑠 = √∑(𝑀𝐶−�̅�)2∙𝑓𝑖
𝑛= √
564.3
30= 4.34miles de
dólares
MC 𝑓i 𝑀𝐶∙ 𝑓𝑖
|𝑀𝑐 − �̅�|∙ 𝑓𝑖
3
6
9
12
15
18
5
10
4
7
2
2
15
60
36
84
30
36
28.5
27.0
1.2
23.1
12.6
18.6
261 111
𝑳𝒊 𝒇𝒊 𝑭𝑰
1.5
4.5
7.5
10.5
13.5
16.5
5
10
4
7
2
2
5
15
19
26
28
30
𝑀𝐶 𝑓𝑖 𝑓𝑖 ∗ 𝑀𝐶 (𝑀𝐶 − �̅�)2 ∙ 𝑓i
3
6
9
12
15
18
5
10
4
7
2
2
15
60
36
84
30
36
162.45
72.9
0.36
76.23
79.38
172.98
261 564.3
80
VARIANZA
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = 𝑠2 = 3.342 = 18.84Miles de dólares
VARIANZA
Ejemplo (Para datos no agrupados)
Burger King-Santa Cruz analiza los tiempos de servicio, desea determinar
el cuál de la dos sucursales, el Cristo o la Blacutt, los tiempos de servicio
están mejor controlados, esto debido a quejas de los clientes.
Para este efecto, se hace un pequeño estudio y se determinan los siguientes tiempos, en minutos:
SUC. EL CRISTO 12 15 14 15 9 8 7
SUC. BLACUTT 12 15 10 6 7 5 13
X = son los datos de la tabla anterior
SUC. EL CRISTO
�̅� =∑ 𝑥
𝑛= 11.43 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑠 = √∑(𝑥 − �̅�)2
𝑛 − 1= 3.41 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝐶𝑉 =𝑠
�̅�∙ 100 =
3.41
11.43∙ 100 = 29.83%
SUC. PLAZUELA BLACUTT
�̅� =∑ 𝑥
𝑛= 9.71 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑠 = √∑(𝑥 − �̅�)2
𝑛 − 1= 3.82 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝐶𝑉 =𝑠
�̅�∙ 100 =
3.82
9.71∙ 100 = 39.30%
Importante:
Para datos no agrupados resulta más rápido calcular la media y la
desviación a través del uso de las
funciones de una calculadora científica. Consulte a su docente
como realizar esto.
Nota:
Observe que para hacer la
comparación entre dos grupos de datos se
determina el CV.
81
Como conclusión diremos que como el coeficiente de variación de la sucursal EL CRISTO es el más pequeño los tiempos de servicio están mejor controlados o son más homogéneos en esta sucursal.
Note que la variación se produce por la existencia de valores bajos y altos y que esta no se puede evitar, pero si controlar. Por ejemplo, en el caso de las sucursales habrá que ver que hace que los empleados no tengan el mismo tiempo de atención para los clientes, ya sea por desgano, pedidos voluminosos, gran afluencia de gente, etc.
DIAGRAMA BOX PLOT (DIAGRAMA DE CAJA)
Este es un diagrama muy usado para observar la dispersión de los datos. Para construir este diagrama se siguen los siguientes pasos:
Se ordenan los datos.
Se determina el valor máximo y el valor mínimo.
Se encuentran los cuartiles (𝑄1, 𝑄2𝑦𝑄3)
Se realiza una escala (vertical u horizontal).
Se grafican los valores.
EJEMPLO
AT&T multinacional norteamericana, diseña un componente electrónico para una nueva tarjeta de red. La empresa ha recopilado información acerca del tiempo de vida útil de este componente en años. Resuma la información en un cuadro de distribución de frecuencias. Grafique el BOX PLOT.
3 4 4 4 4 5 5 5 5 6
7 7 7 7 7 9 9 9 10 11
11 11 12 12 12 12 15 15 17 18
MIN=3
MAX=18
𝑄1 = 𝐿𝑖 +𝑛
4−(𝐹𝐼𝑖−1.)
𝑓𝑖∙ 𝐴 = 4.5 +
7.5−5
10∙ 3 = 5.25
𝑄2 = 𝐿𝑖 +
2∙𝑛
4− (𝐹𝐼𝑖−1)
𝑓𝑖∙ 𝐴 = 4.5 +
15 − 5
10∙ 3 = 7.50
𝑄3 = 𝐿𝑖 +
3∙𝑛
4− (𝐹𝐼𝑖−1)
𝑓𝑖∙ 𝐴 = 4.5 +
22.5 − 19
7∙ 3 = 12
SUC. EL CRISTOEjemplo (Para datos no agrupados)
Burger King-Santa Cruz analiza los tiempos de servicio, desea determinar
El cuál de la dos sucursales, el Cristo o la Blacutt, los tiempos de servicio
Nota:
Observe que los cuartiles han sido calculados
anteriormente.
82
Están mejor controlados, esto debido a quejas de los clientes.
Para este efecto, se hace un pequeño estudio y se determinan los siguientes tiempos, en minutos:
SUC. EL CRISTO 12 15 14 15 9 8 7
SUC. BLACUTT 12 15 10 6 7 5 13
X = son los datos de la tabla anterior
SUC. EL CRISTO
minutos 11.43n
xx
minutos 3.411-n
2xx
s
% 29.8310011.43
3.41100
x
sCV
SUC. PLAZUELA BLACUTT
minutos 71.9n
xx
minutos 3.82
1-n
2xx
s
% 39.301009.71
3.82100
x
sCV
Como conclusión diremos que como el coeficiente de variación de la sucursal EL CRISTO es el más pequeño los tiempos de servicio están mejor controlados o son más homogéneos en esta sucursal.
Note que la variación se produce por la existencia de valores bajos y altos y que esta no se puede evitar, pero si controlar. Por ejemplo, en el caso de las sucursales habrá que ver que hace que los empleados no tengan el mismo tiempo de atención para los clientes, ya sea por desgano, pedidos voluminosos, gran afluencia de gente, etc.
Importante:
Para datos no agrupados resulta
más rápido calcular la media y la
desviación a través del uso de las
funciones de una calculadora
Nota:
Observe que para hacer la comparación entre dos
grupos de datos se
determina el CV.
83
3.7. DIAGRAMA BOX PLOT (DIAGRAMA DE CAJA)
Este es un diagrama muy usado para observar la dispersión de los datos. Para construir este diagrama se siguen los siguientes pasos:
Se ordenan los datos.
Se determina el valor máximo y el valor mínimo.
Se encuentran los cuartiles (𝑄1, 𝑄2𝑦𝑄3)
Se realiza una escala (vertical u horizontal).
Se grafican los valores.
PROBLEMA ABP RESUELTO
INDUSTRIAS FINO, analiza las ventas de un nuevo aceiteFINO Vitaminas, correspondientes al mes de Junio de 2013. Se ha recopilado información acerca de las ventas en miles de dólares de una sucursal. Grafique el BOX PLOT
MIN = 3 MAX = 18
5.25310
57.55.4Li
1Q
fi
1-i FI4
1.n
A
50.7310
515.54
fiLi
2Q
14
2.n
A
FIi
12 37
1922.55.4Li
3Q
fi
14
3.n
A
FIi
3 4 4 4 4 5 5 5 5 6 7 7 7 7 7 9 9 9 10 11 11 11 12 12 12 12 15 15 17 18
84
TEOREMA DE TCHEBYSHEV En todo conjunto de datos que represente una distribución simétrica se cumple que, dentro de:
x 1s
existe un
68.27% de los datos
x 2s
existe un
95.45% de los datos
x 3s
existe un
99.73% de los datos
Para verificar este teorema utilizaremos las siguientes fórmulas de cálculo:
n
100f
c
Fs)1(xff
c
Fs)1(xfs)%1(x B
iBINTERNASA
iAA
n
100f
c
F2s)(xff
c
Fs)2(xf2s)%(x B
iBINTERNASA
iAA
n
100f
c
F3s)(xff
c
F3s)(xf3s)%(x B
iBINTERNASA
iAA
24
20
16
12
8
4
0
24 20 16 12 8 4 0
85
Unidad 4 DENSIDAD Y CONCENTRACION DE DATOS (MEDIDAS DE FORMA) A.OBJETIVOS
Identificar las medidas de forma.
Calcular las medidas de forma.
Interpretar geométricamente las medidas de forma. B.ACTIVIADES DE APRENDIZAJE SESGO O ASIMETRIA Las curvas que representan los puntos de datos de un conjunto de datos pueden ser simétricas o sesgadas (asimétricas). Las curvas simétricas tiene una forma tal que una línea que pase por el punto más alto dividirá el área de esta en dos partes iguales. Las curvas sesgadas son aquellas que representan distribuciones de frecuencias que están concentradas el extremo inferior o en el superior de la escala de medición. La medida más simple de asimetría se basa en la distancia que pueda existir entre la media aritmética y la mediana. Por tanto se puede definir un coeficiente de asimetría como sigue:
s
Moda)-
_
x( Cas
s
Me)-
_
x3( Cas
EJEMPLOS DE ASIMETRIA
El número de días que se encuentra almacenada la fruta en un depósito.
El tiempo de atraso en el pago de un crédito a una institución bancaria.
La nota de los alumnos en un examen difícil. KURTOSIS O APUNTAMIENTO
Cuando medimos la KURTOSIS estamos midiendo su grado de agudeza. En la figura del ejemplo las curvas A. B y C difieren entre si solamente en que tiene un pico más grande que la otra. Tiene la misma posición central y la misma dispersión, y ambas son simétricas. Los estadísticos dicen que tiene un grado distinto de KURTOSIS.
AS = (+) AS = 0 AS = (-)
86
Si la distribución es Normal o Mesocúrtica. Si la distribución es más puntiaguda que la normal es Leptocurtica Si la distribución es más aplanada que la normal es Platicurtica Fórmula para el cálculo del coeficiente de Kurtosis (K)
10P
90P
RSI K
Interpretación:
K = 0.263 La curva es Mesocúrtica K > 0.263 La curva es Leptocúrtica K < 0.263 La curva es Platicurtica
87
8.7030
261
n
fi*MCx
Gráficamente:
PROBLEMA ABP RESUELTO Ejemplo 1.- INDUSTRIAS FINO
CUADRO DE DISTRIBUCION DE FRECUENCIAS
# Int Limites Fronteras
MC fi Fi (-) fr%
FR% (-)
Li Ls Fi Fs
1 2 4 1.5 4.5 3 5 5 16.67 16.67
2 5 7 4.5 7.5 6 10 15 33.33 50.00
3 8 10 7.5 10.5 9 4 19 13.33 63.33
4 11 13 10.5 13.5 12 7 26 23.33 86.66
5 14 16 13.5 16.5 15 2 28 6.67 93.33
6 17 19 16.5 19.5 18 2 30 6.67 100
1.-Durante 40 días se ha observado el número de mujeres que viajan al aeropuerto de ViruViru (Santa Cruz) sabiendo que estos son los resultados siguientes: Calcular:
a) El promedio o media b) La moda c) La mediana d) La Kurtosis
MC Fi MC*fi fixMC
2
3 5 15 162.45 6 10 60 72.9 9 4 36 0.36 12 7 84 76.23 15 2 30 79.38
18 2 36 172.98
261 564.3
dólares de miles 34.4
30
564.3
n
.f2
xMCs
88
La siguiente tabla muestran los gastos en seguridad de miles de dólares, sobre la cumbre del clima desarrollada en Bolivia
dólares de miles .507310
515.54AiMe
fi
1-i FI2
n
L
s
Me)-
_
x3( AS = 83.0
34.4
)50.770.8(3
Como este coeficiente es positivo, la distribución está sesgada a la derecha
Ejemplo 2.- Los siguientes datos indican el número de minutos que ocuparon que ocuparan sus asientos 50 clientes de una cafetería:
Li Ls MC fi FI+ MC*fi
31 40 35,5 3 3 106,5
40 49 44,5 5 8 222,5
49 58 53,5 6 14 321
58 67 62,5 11 25 687,5
67 76 71,5 15 40 1072,5
76 85 80,5 4 44 322
85 94 89,5 6 50 537
Calcular: e) El promedio o media f) La moda g) La mediana h) La Kurtosis
1.-Calculo de la Media
𝑋 =∑(𝑀𝑐 ∗ 𝐹𝑖)
𝑁𝑡=
3269
50= 65,38
2.-Calculo de la Mediana
𝑀𝑒 = 𝐿𝑖 + [
𝑛
2− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 58 + [
25 − 14
11] ∗ 9 = 67
Fi F fa
1,5 5 5
4,5 10 15
7,5 4 19
10,5
7 26
13,5
2 28
16,5
2 30
89
3.-Calculo de la Moda
𝑀𝑜 = 𝐿𝑖 + [𝐴1
𝐴1 + 𝐴2] ∗ 𝐴 = 67 + [
4
4 + 11] ∗ 9 = 69,4
𝐴1 = 𝑓𝑖 − 𝑓𝑖 − 1 = 15 − 11 = 4
𝐴2 = 𝑓𝑖 − 𝑓𝑖 + 1 = 15 − 4 = 11 4.-Calculo del Quartil 1
𝑄1 = 𝐿𝑖 + [
𝑛
4− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 49 + [
12,5 − 8
6] ∗ 9 = 55,75
5.- Calculo de Quartil 3
𝑄3 = 𝐿𝑖 + [
3𝑛
4− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 67 + [
37,5 + 25
15] ∗ 9 = 74,5
6.- Calculo de Percentil 10
𝑃10 = 𝐿𝑖 + [
10𝑛
100− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 40 + [
5 − 3
5] ∗ 9 = 43,6
7.- Calculo de Percentil 90
𝑃90 = 𝐿𝑖 + [
90𝑛
100− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 85 + [
45 − 44
6] ∗ 9 = 86,5
8.- Calculo de Rango Semi Intercuartil
𝑅𝑆𝐼 =𝑄3 − 𝑄1
2=
74,5 − 55.75
2= 9,375
9,.Calculo de Kurtosis
𝐾 =𝑅𝑆𝐼
𝑃90 − 𝑃10=
9,375
86,5 − 43,6= 0,218
Conclusión.-La curva es Plasticurtica ya que K < 0,263 Ejemplo 3-
La siguiente tabla muestra la inversión en miles de dólares de diferentes países
que visitaron Bolivia cuando se celebró la G 77 más china.
Li Ls Fi Mc Mc.Fi FI+
0 8 15 4 60 15
8 16 20 12 240 35
16 24 10 20 200 45
24 32 8 28 224 53
32 40 2 36 72 55
40 48 1 44 44 56
48 56 3 52 150 59
56 64 1 60 60 60
T=60 T=1056
90
Calcular:
a) Calcular la mediana, media y la
b) Calcular la Kurtosis
Calculo de la mediana
Me= Li + [n
2−FI
Li]* A Me= 8+ [
30− 35
20]* 8 = 6
Calculo de la moda
Mo= Li + [∆1
∆1+∆2]* A Mo= 8 + [
5
5+10]* 8 = 10,66
Calculo del Quartil 1=?
Q1= Li + [n
4−FI
Li]* A Q1= 0 + [
15−0
15]* 8 = 8
Calculo del Quartil 3=?
Q3= Li + [3n
4−FI
Li]* A Q3= 16 + [
45−35
10]* 8 = 24
Calculo del percentil 10=?
P10= Li + [10n
100−FI
Li]* A P10= 0 + [
6−0
15]* 8 = 3,2
Calculo del percentil 90=?
P90= Li + [90n
100−FI
Li]* A P90= 32 + [
34−53
2]* 8 = 36
Calculo del rango semi-intercuartil
RSI= Q3−Q1
2 RSI=
24−8
2 = 8
Nota: para poder hacer el cálculo de la moda se debe buscar el número más elevado en el fi con minúsculas.
91
Calculo de kurtosis
K= RSI
P90−P10 K=
8
3,6−3,2 = 0,24
Presenta una curva plasticurtica o achatada = 0,24
Ejemplo 4
Consultados 310 matrimonios sobre la edad de la esposa, se confecciona la siguiente tabla:
Li Ls Fi FI MC Mc*Fi
15 19 23 23 17 391
20 24 28 51p10 22 616
25 29 76mo 127Q1 27 2052
30 34 54 181me 32 1728
35 39 60 241Q3 37 2220
40 44 42 283p90 42 1764
45 49 27 310 47 1269
310 10040
Calcular: a) Media, Mediana y Moda b) La kurtosis
1.-Calculo del Quartil 1
𝑄1 = 𝐿𝑖 + [
𝑛
4− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 25 + [
77,5 − 51
76] ∗ 9 = 28,014
2.-Calculo de Quartil 3
𝑄3 = 𝐿𝑖 + [
3𝑛
4− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 35 + [
232.5 + 181
60] ∗ 9 = 97,02
3.-Calculo de Percentil 10
𝑃10 = 𝐿𝑖 + [
10𝑛
100− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 20 + [
31 − 23
23] ∗ 9 = 23,13
92
4.-Calculo de Percentil 90
𝑃90 = 𝐿𝑖 + [
90𝑛
100− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 40 + [
279 − 241
42] ∗ 9 = 48,14
5.-Calculo de Rango Semi Intercuartil
𝑅𝑆𝐼 =𝑄3 − 𝑄1
2=
97,02 − 28,014
2= 34,50
6.-Calculo de Kurtosis
𝐾 =𝑅𝑆𝐼
𝑃90 − 𝑃10=
34,50
48,14 − 23,13= 1,379
Representa una curva leptocurtica ya que K = 1,379
7.-Calculo de la Media
𝑋 =∑(𝑀𝑐 ∗ 𝐹𝑖)
𝑁𝑡=
10040
310= 32,38
8.-Calculo de la Mediana
𝑀𝑒 = 𝐿𝑖 + [
𝑛
2− 𝐹𝐼 − 1
𝑓𝑖] ∗ 𝐴 = 30 + [
155 − 127
54] ∗ 9 = 34,66
9.-Calculo de la Moda
𝑀𝑜 = 𝐿𝑖 + [𝐴1
𝐴1 + 𝐴2] ∗ 𝐴 = 25 + [
48
48 + 22] ∗ 9 = 31,17
Nota: para poder hacer el cálculo de la moda se debe buscar el número más elevado en el fi con minúsculas.
93
Unidad 5 Regresión y correlación lineal OBJETIVOS
Identificar los diferentes métodos de ajuste.
Aplicar método de mínimos cuadrado
Determinar pronósticos en base a datos históricos.
Interpretar el grado de correlación entre dos variables.
Analizar los resultados mediante el coeficiente de correlación y sus aplicaciones
REGRESION (AJUSTE DE CURVAS) En la práctica encontramos a menudo que existen relaciones entre dos o más, por ejemplo el precio de un automóvil depende del ingreso familiar, la demanda de helado esta función a la temperatura, etc. PASOS PARA REALIZAR ANALISIS: DIAGRAMA DE DISPERSION.- Es una gráfica en la que cada punto trazado representa un par de valores observados de las variables independiente y dependiente. En forma general:
.- APROXIMAR LOS DAROS A UNA RECTA.- Utilizando la ecuación de la recta que pasa por puntos para los que se toma dos puntos del conjunto de datos:
𝑌 − 𝑌 =𝑌2 − 𝑌!
𝑋2 − 𝑋1(𝑋 − 𝑋1)
.- METODO DE LOS MINIMOS CUADRADOS.- A y B
𝐴 = ∑ 𝑦 ∑ 𝑥2 − ∑ 𝑥 ∑ 𝑥𝑦
𝑁 ∑ 𝑥2 − (∑ 𝑥)2 𝐵 =
𝑁 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌
𝑁 ∑ 𝑋2 − (∑ 𝑋)2
Y=A + Bx ERROR DE ESTANDAR DE ESTIMACION.- El error estándar de estimación determina el error promedio que se comete al realizar un pronóstico de Y a par de X. esta medida es también útil para cual de varias curvas de estimación tiene mejor ajuste.
0
2
4
6
8
10
0
Diagrama de Dispersion X Y
X1 X2 X3
Y1 Y2
Y3
94
R= N∑XY-∑X∑Y =
[N*∑𝑋² - (∑X)²] [N∑Y² - (∑Y)²] EJERCICIOS Regresión lineal Ejercicios 1 El tiempo que tarda un sistema informático en red en ejecutar una instrucción depende del número de usuarios conectados a él. Si no hay usuarios en tiempo es 0. Tenemos los siguientes datos:
Numero de Usuario 10 15 20 20 25 30 18 16 13 14
Tiempo de ejecución 1 1,2 2 2,1 2,2 2,2 1,5 1,4 1,4 1,5
a) Realice un diagrama de dispersión
b) Recta de regresión
Numero de Usuario (X)
Tiempo de ejecución (Y)
XY X2 Y2
10 1,0 10 100 1
15 1,2 18 225 1,44
20 2 40 400 4
20 2,1 42 400 4,41
25 2,2 55 625 4,84
30 2,2 66 900 4,84
18 1,5 27 324 2,25
16 1,4 22,4 256 1,96
13 1,4 18,2 169 1,96
14 1,5 21 196 2,25
0,0
0,5
1,0
1,5
2,0
2,5
3,0
0 10 20 30 40
Títu
lo d
el e
je
Título del eje
Series1
Lineal (Series1)
95
181 16,5 319,6 3595 28,95
𝒀 = 𝑩𝑿 + 𝑨
𝑌 = (0,0657* 21)+0,4609
𝑌 = 1,84
𝐴 =∑𝑌 ∗ ∑𝑋2 − ∑𝑋 ∗ ∑𝑋𝑌
𝑁∑𝑋2 − (∑𝑋)2
𝐴 =(16,5 ∗ 3595) − (181 ∗ 319,6)
(10 ∗ 3595) − (181)2
𝐴 = 0.4609
𝐵 =𝑁 ∑𝑋𝑌 − ∑𝑋∑𝑌
𝑁∑𝑋2 − (∑𝑋)2
𝐵 =(10 ∗ 319,6) − (181 ∗ 16,5)
(10 ∗ 3595) − (181)2
𝐵 = 0,0657 Conclusión.- La ecuación de “y” nos dice que si en el servidor existen 21 usuarios el tiempo de respuesta será de 1,8406 segundos.
c) Coeficiente de determinación
R= N∑XY-∑X∑Y =
[N*∑𝑋² - (∑X)²] [N∑Y² - (∑Y)²] R= 10 * 319,6 – 181 * 16,5 = √ [10* 3595 - (181)² ] * [ 10 * 28,95 -(16,5)²] R= 209,5 = 209,5 = 0,8932
√(3189) (147,25) 234,5426 R²= (0,8932)²=0,7978=79,78% Conclusión.- La variación del tiempo de ejecución, se debe a la variación del número de usuarios conectados en un 79.78%
96
Ejemplo 2 Una Organización de estudio de consumidores desea determinar la relación entre el precio de una pila para radio de transmisores en función al número de duración de horas de la pila. Se compró una muestra de 11 pilas con los resultados dados en la siguiente tabla:
“Y” Precio 24 32 49 49 39 69 69 89 119 79 35
“X” Duración 5.4 4.8 6.3 7.2 6.3 6.8 6.8 10.2 13.1 9.2 6.0
a) Encuentre el diagrama de dispersión. b) En el supuesto de una relación lineal, encontrar los coeficientes de la regresión A y B. c) Prediga el precio por pila si la duración de esta última es de 10 Hr.
d)Calcule el coeficiente de determinación 𝑅2 e interprete su significado en este problema. Operación auxiliar;
X Y X × Y 𝐗𝟐 𝐘𝟐
5.4 24 129.6 29.16 576
4.8 32 153.6 23.04 1024
6.3 49 308.7 39.69 2401
7.2 49 352.8 51.84 2401
6.3 39 245.7 39.69 1521
7.4 69 510.6 54.76 4761
6.8 69 469.2 46.24 4761
10.2 89 907.8 104.04 7921
13.1 119 1558.9 171.61 14161
9.2 79 726.8 84.64 6241
6.0 35 210 36 1225
∑X= 82.7 ∑Y= 653 ∑X×Y= 5573.7 ∑𝐗𝟐=680,71 ∑𝐘𝟐=46993
a) Encuentre el diagrama de dispersión.
97
b)En el supuesto de una relación lineal, encontrar los coeficientes de la regresión A y B.
𝑨 =∑𝐘 × ∑𝑿𝟐 − ∑𝐗 × ∑𝐗 ∗ 𝒀
𝑵 × ∑𝑿𝟐 − (∑𝑿)𝟐
𝐴 =(653) (680.71) − (82.7)(5573.7)
11( 680.71) − (82.7)2
𝐴 = −25.352
𝑩 =𝐍 × ∑𝐗 ∗ 𝒀 − ∑𝐗 × ∑𝒀
𝑵 × ∑𝑿𝟐 − (∑𝑿)𝟐
𝐵 =11 × 5573.7 − 82.7 × 653
11 × 680.71 − (82.7)2
𝐵 = 11.268 c) Prediga el precio por fila si la duración de esta última es de 10 Hr.
𝐘 = 𝐀 + 𝐁 × 𝐗
Y = (−25.352) + (11.268) × 10
Y = 87.328
d) Calcule el coeficiente de determinación 𝑹𝟐 e interprete su significado en este problema. R= N∑XY-∑X∑Y =
[N*∑𝑋² - (∑X)²] [N∑Y² - (∑Y)²] R= 11 *(5573,7) -(82,7) (653) = √11 (680,71) – (82,7)² * 11 * 46993 - (6543)² R= 0,9537 R²= (0,9537)² R²= 0,9095= 90,95% En un 90.95% la variación del precio de las pilas se debe a la variación de las horas de duración de cierta marca de pila.
98
X Y X2 Y2 XY
8 15 64 225 120
7 19 49 361 133
6 25 36 625 150
4 23 16 529 92
2 34 4 1156 68
1 40 1 1600 40
28 156 170 4496 603
Ejemplo 3 Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un núcleo de población, acuden los clientes, en cientos, que figuran en la tabla
a) Calcular el coeficiente de correlación lineal
b) Si el centro comercial se sitúa a 2 km, ¿Cuántos clientes puede esperar?
c) Si desea recibir a 500 clientes. ¿a qué distancia del núcleo de población debe
situarse?
𝐴 =∑𝑌 ∗ ∑𝑋2 − ∑𝑋 ∗ ∑𝑋𝑌
𝑁∑𝑋2 − (∑𝑋)2 𝐵 =
𝑁 ∑𝑋𝑌 − ∑𝑋∑𝑌
𝑁∑𝑋2 − (∑𝑋)2
A=40.83 B= -3.1779 Y=BX + A Y=(-3.1779*500) + 40.83 Y=-1548 R= N∑XY-∑X∑Y =
[N*∑𝑋² - (∑X)²] [N∑Y² - (∑Y)²] R=-0.9502 R2 = 0.9028 = 90,28%
0
10
20
30
40
50
0 5 10
Series1
REGRECIONLINEAL
Lineal (Series1)
99
Ejemplo 4 El gerente de personal de la “CRE” considera que puede haber una relación entre el ausentismo y la edad de una persona Se desea usar la edad de un empleado para predecir el número de días de ausencia durante un año del calendario Se selecciona una muestra aleatoria de 11 empleados tal como se muestra en la siguiente tabla:
Ausencia (días) 15 13 6 10 18 9 7 14 11 5 8
Edad (en años) 27 24 61 37 23 46 58 39 36 64 40
*Representar gráficamente los datos y dibujar la recta de regresión obtenida.
*En el supuesto regresión lineal encontrar los coeficientes A y B
*Cuantos días de ausencia se pronosticará para un trabajador de 54 años.
*Calcule el coeficiente de correlación.
Edad (en años) X
Ausencia (días) Y
XY
X2
Y2
27 15 405 729 225
24 13 312 576 169
61 6 366 3721 36
37 10 370 1369 100
23 18 414 529 324
46 9 414 2116 81
58 7 406 3364 49
39 14 546 1521 196
36 11 396 1296 121
64 5 320 4096 25
40 8 320 1600 64
Ʃ= 455 Ʃ= 116 Ʃ= 4269 Ʃ= 20917 Ʃ= 1390
100
a) Representar gráficamente los datos y dibujar la recta de regresión obtenida.
En el supuesto regresión lineal encontrar los coeficientes A y B
A = Ʃy ∗ Ʃx² − Ʃx ∗ Ʃxy
N ∗ Ʃx² − (Ʃx)²
A = 116 ∗ 20917 − 455 ∗ 4269
11 ∗ 20917 − (455)²
𝐴 = 483977
23062= 20,9859
𝐵 = N ∗ Ʃxy − Ʃx ∗ Ʃy
N ∗ Ʃx² − (Ʃx)²
𝐵 = 11 ∗ 4269 − 455 ∗ 116
11 ∗ 20917 − (455)²
𝐵 = −5821
23062= −0,2524
0
2
4
6
8
10
12
14
16
18
20
0 10 20 30 40 50 60 70
AUSENCIA (dias)
AUSENCIA (dias)
101
a) Cuantos días de ausencia se pronosticará para un trabajador de 54 años.
𝑌 = B(x) + A
𝑌 = −0,2524(54) + 20,9859 = 7,3563
b) Calcule el coeficiente de correlación.
R= N∑XY-∑X∑Y =
[N*∑𝑋² - (∑X)²] [N∑Y² - (∑Y)²] R= 11 * (4269) – (455) * (116) = √ [11* 20917 - (455)² ] * [ 11 * 1390 -(455)²] R= -5821 = -5821 = -0,8932
√(23062) (1834) 6503,5150 R²= (- 0,8950)²=0,8010= 80,10% Ejemplo 5 Las ventas de helado y chocolate caliente de todo el año han sido registradas siguiendo la temperatura de cada día en promedio y las ventas de los mismos productos.
𝑻𝑬𝑴𝑷𝑬𝑹𝑨𝑻𝑼𝑹𝑨 (X)
𝑽𝑬𝑵𝑻𝑨 𝑫𝑬 𝑯𝑬𝑳𝑨𝑫𝑶𝑺 (Y)
𝑿𝒀 𝑿𝟐 𝒀𝟐
5 2 10 25 4
10 4 40 100 16
15 7 105 225 49
20 12 240 400 144
25 13 325 625 169
30 18 540 900 324
35 20 700 1225 400
140 76 1960 3500 1106
R= N∑XY-∑X∑Y =
[N*∑𝑋² - (∑X)²] [N∑Y² - (∑Y)²]
102
Utilizando el método de los mínimos cuadrados ordinarios, estime la recta que
modela la venta de helados y la temperatura.
𝐴 = (76 ∗ 3500) − (140 ∗ 1960)
(7 ∗ 3500) − (140)2=
−8400
4900= −1.71
𝐵 =(7 ∗ 1960) − (140 ∗ 76)
(7 ∗ 3500) − (140)2=
3080
4900= 0.628
𝑌 = −1.71 + 0.628 ∗ (𝑋)
a) Utilizando el método de los mínimos cuadrados ordinarios estime la recta que
modela la venta de chocolate caliente y la temperatura.
𝑻𝑬𝑴𝑷𝑬𝑹𝑨𝑻𝑼𝑹𝑨
(X)
𝑽𝑬𝑵𝑻𝑨 𝑫𝑬 𝑪𝑯𝑶𝑪𝑶𝑳𝑨𝑻𝑬𝑺
(Y)
𝑿𝒀 𝑿𝟐 𝒀𝟐
5 19 95 25 361
10 16 160 100 256
15 10 150 225 100
20 10 200 700 100
25 8 200 625 64
30 6 180 900 36
35 3 105 1225 9
140 72 1090 3500 926
𝐴 =(72 ∗ 3500) − (140 ∗ 1090)
(7 ∗ 3500) − (140)2=
99400
4900= 20.28
𝐵 =(7 ∗ 1090) − (140 ∗ 72)
(7 ∗ 3500) − (140)2=
−2450
4900= −0.5
𝑌 = 20.28 − 0.5 ∗ (𝑋)
b) Se sabe que mana va a haber 22 grados de temperatura en promedio. ¿Cuál
estima usted que va a ser la venta de helados y de chocolate?
𝑌 = −1.71 + 0.628 ∗ (22) = 𝟏𝟐. 𝟏𝟎𝑯𝑬𝑳𝑨𝑫𝑶𝑺 𝑌 = 20.28 − 0.5 ∗ (22) = 𝟗. 𝟐𝟖𝑪𝑯𝑶𝑪𝑶𝑳𝑨𝑻𝑬𝑺 𝑪𝑨𝑳𝑰𝑬𝑵𝑻𝑬𝑺
c) De sus dos pronósticos. ¿Cuál es más certero? Justifique su respuesta.
R= N∑XY-∑X∑Y =
[N*∑𝑋² - (∑X)²] [N∑Y² - (∑Y)²]
103
El más certero es la venta de Helados, con un 98.47%.
Ejemplo 6 El gerente de una cadenas de heladerías SAVORY quiere estudiar el efecto de la temperatura ambiente sobre sobre las ventas de temporada de calor. Se selecciona una muestra aleatoria de 10 días y los resultados se dan en la siguiente tabla:
Temperatura °C 17 21 23 24 27 28 29 31 32 33
Ventas En cientos de dólares
15 17 18 20 24 22 27 29 31 31
a. Encuentre un diagrama de dispersión.
b. En el supuesto de una regresión lineal. Encontrar los coeficientes de la regresión A y B.
c. Prediga las ventas por día cuando la temperatura es de 36°C.
d. Calcule el coeficiente de determinación r2 e interprete su significado.
Solución:
X y XY X2 Y2
17 15 255 289 225
21 17 357 441 289
104
23 18 414 529 324
24 20 480 576 400
27 24 648 729 576
28 22 616 784 484
29 27 783 841 729
31 29 899 961 841
32 31 992 1024 961
33 31 1023 1089 961
265 234 6467 7263 5790
Diagrama de dispersión.
Encontrar los coeficientes de la regresión A y B.
Prediga las ventas por día cuando la temperatura es de 36°C
Y=Bx+A Y = (1,106)(36) - 5.9098 = 33.9062 ventas en cientos de dólares.
y = 1,106x - 5,9098R² = 0,9358
0
5
10
15
20
25
30
35
0 10 20 30 40
temperatura °C
Ventas en cientos de dolares
Lineal (Ventas encuentos de dolares)
105
Calcule el coeficiente de determinación R2 e interprete su significado.
Unidad 6 Elementos de probabilidad OBJETIVOS
Interpretar las definiciones básicas de los elementos de probabilidad. Identifica el tipo de evento definido en el mismo espacio muestral. Reconocer la importancia de la aplicación del Teorema de Bayes. Desarrollar habilidades para resolver problemas de probabilidades.
DEFINICIÓN DE PROBABILIDAD En general la probabilidad es la posibilidad de que algo pase. Las probabilidades se pueden expresar de tres maneras como: Fracciones ¾, ½, ¼, … Decimales 0.75, 0.50, 0.25, … Porcentajes 75%, 50%, 25%, … Las probabilidades están siempre entre cero y uno. Tener una probabilidad de cero significa que algo nunca va a suceder, una probabilidad de uno indicado que algo va a suceder siempre. CONCEPTOS BASICOS DEFINICIÓN DE EVENTO En teoría de la probabilidad un evento es uno o más de los posibles resultados a hacer un experimento. En otras palabras, un evento es todo lo que puede suceder. DEFINICIÓN DE EXPERIMENTO (Ex) Un experimento es aquella actividad que origina un evento. DEFINICIÓN DE ESPACIO MUESTRAL (S) Es el conjunto de todos los posibles resultados o eventos de un experimento. EVENTOS MUTUAMENTE EXCLUYENTES (ME) Se dice que dos eventos son mutuamente excluyentes, si uno y solo uno de ellos puede tener lugar en un mismo tiempo.
106
EVENTOS NO MUTUAMENTE EXCLUYENTES (NME) Se dice que dos eventos no son mutuamente excluyentes si pueden ocurrir juntos o la vez. Ejemplo Si se lanza un dado una vez. Determinar el espacio muestral Ex = “Lanza un dado una vez” (Experimento) S = {1, 2, 3, 4, 5, 6 } (Espacio Muestral) Si se tienen los siguientes pares de eventos indicar si son mutuamente excluyentes o no. A = Que el resultado al lanzar el dado sea un 3 B = Que salga un numero par C = Que salga un número impar D = Que salga un número a 5 A y B…………………… B y C…………………… A y C…………………… B y D…………………… A y D…………………… C y D…………………… CLASIFICACIÓN DE LA PROBABILIDAD DE ACUERDO A SU ORIGEN Existen tres maneras básicas de clasificar la probabilidad. PROBABILIDAD DE TIPO CLASICA
Matemáticamente
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑎𝑑 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 = 𝑢𝑛𝑎 𝑝𝑎𝑟𝑡𝑒
𝑇𝑜𝑡𝑎𝑙
PROBABILIDAD DE TIPO FRECUENCIA RELATIVA
Cuando las probabilidades se hallan a través de la observación de un evento durante un gran número de veces, esto origina normalmente los cuadros de distribución de frecuencias. Este método se basa en observaciones pasadas.
PROBABILIDAD DE TIPO SUBJETIVA Es aquella que está basada en opiniones o creencias de las personas.
EVENTOS NO MUTUAMENTE EXCLUYENTES
Se dice que dos eventos A y B son mutuamente excluyentes si ambos pueden suceder a
la vez. Matemáticamente, la probabilidad que al menos uno de ellos suceda se calcula
con:
DESCRIPCIÓN DE LOS TIPOS DE PROBABILIDAD
PROBABILIDAD SIMPLE
𝑃(𝐴 ∘ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)− 𝑃(𝐴𝐵)
107
Es la posibilidad de que ocurra un solo evento, se simboliza por una sola letra
mayúscula. Ejemplo: P(A)
PROBABILIDAD CONJUNTA
Es la posibilidad de que ocurran dos eventos al mismo tiempo, se simboliza por
dos letras que corresponden a los eventos. Ejemplo: P(A∩B)
PROBABILIDAD CONDICIONAL
Es la posibilidad de que ocurra un evento sabiendo que otro evento ya ocurrió. Se
simboliza por dos letras que corresponden a los eventos A que es el que
queremos calcula en este caso y B el evento que ya ocurrió. Ejemplo: P(A/B)
EVENTOS INDEPENDIENTES
Se dice que dos eventos A y B son independientes cuando el resultado de uno de ellos no
afecta el posterior resultado de otro experimento.
Probabilidad Marginal 𝑃(𝐴) = 𝑃(𝐴)
Probabilidad Conjunta
Probabilidad Condicional
EVENTOS DEPENDIENTES
Se dice que dos eventos A y B son dependientes cuando el resultado de uno de ellos
afecta el posterior resultado de otro experimento.
Probabilidad Condicional
Probabilidad Conjunta
Probabilidad Marginal
I.8.- TEOREMA DE BAYES
La fórmula básica de la probabilidad condicional se conoce como TEOREMA DE BAYES:
El Teorema de Bayes ofrece un método estadístico para evaluar nueva información y
revisar nuestras anteriores estimaciones.
Se puede generalizar la fórmula anterior cuando se presentan varias condicionales. La
fórmula general es:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)∗ 𝑃(𝐵)
𝑃(𝐴/𝐵)= 𝑃(𝐴)
𝑃(𝐴𝐵) = 𝑃(𝐵)∗ 𝑃(𝐴/𝐵)
𝑃(𝐴) = 𝑃(𝐴𝐵) + 𝑃(𝐴𝐶) + 𝑃(𝐴𝐷)+ ⋯
𝑃(𝐴/𝐵) =𝑃(𝐴𝐵)
𝑃(𝐵)
𝑃(𝐴/𝐵) =𝑃(𝐴𝐵)
𝑃(𝐵)
𝑃(𝐴/𝑅) =𝑃 (
𝑅
𝐴) ∗ 𝑃(𝐴)
𝑃 (𝑅
𝐴) ∗ 𝑃(𝐴) + 𝑃 (
𝑅
𝐵) ∗ 𝑃(𝐵) + ⋯
108
EJEMPLO 1 Guaraná Conti
Los datos de producción de la Guaraná Conti la empresa se los mandó de Brasil, en sí
son cinco las máquinas que producen dicha soda. La primera produce 1000 cajas por día
y 50 salen en mal estado, la segunda produce el doble que la primera y la misma
proporción de desperfectos que la cuarta. La tercera produce la mitad que la quinta y el
2% sale en mal estado, la cuarta produce el triple que la primera y la misma proporción
de desperfectos que la tercera, mientras que la quinta produce el cuádruple que la
primera y ninguna en mal estado. El lote que la fábrica envió a Bolivia fue la producción
total del mes pasado. La máquina uno trabajó los 30 días, la dos y la tres 25 días, la
cuatro 20 días y la cinco 22 días.
Preguntas:
A. De cuantas cajas contó el lote de sodas.
Prod. √ x hrs/día Producción
Total Propor.
Maquina 1 1000 0,95 0,05 30 30000 0,1079
Maquina 2 2000 0,98 0,02 25 50000 0,1799
Maquina 3 2000 0,98 0,02 25 50000 0,1799
Maquina 4 3000 0,98 0,02 20 60000 0,2158
Maquina 5 4000 1 0 22 88000 0,3165
Ʃ278000 Ʃ1
Tuvo una producción de todo el mes de 278000 cajas.
B. Si un cliente se quejó porque una caja estaba en mal estado ¿Cuál es la
probabilidad que haya sido producida por la cuarta máquina?
𝐌á𝐪𝐮𝐢𝐧𝐚 𝟏
𝟎,𝟏𝟎𝟕𝟗 0,95 √
0,05 x 𝐌á𝐪𝐮𝐢𝐧𝐚 𝟐
𝟎,𝟏𝟕𝟗𝟗 0,98 √
0,02 x "𝐆𝐮𝐚𝐫𝐚𝐧á 𝐂𝐨𝐧𝐭𝐢"
𝟏
𝐌á𝐪𝐮𝐢𝐧𝐚 𝟑
𝟎,𝟏𝟕𝟗𝟗 0,95√
0,05 x 𝐌á𝐪𝐮𝐢𝐧𝐚 𝟒
𝟎,𝟐𝟏𝟓𝟖 0,98 √
0,02 x 𝐌á𝐪𝐮𝐢𝐧𝐚 𝟓
𝟎,𝟑𝟏𝟔𝟓 1 √
0 x
109
(0,02)(0,2158)
(0,02)(0,2158)+(0,05)(0,1079)+(0,02)(0,1799)+(0,02)(0,1799)=
0,0043
0,0169=
0,2543→24,53%
La caja tuvo un 25,43% de que haya sido producida por la cuarta máquina.
C. Si una caja está en buen estado. ¿Cuál es la probabilidad que haya sido
producida por la tercera máquina?
D.
(0,98)(0,1799)
(0,98)(0,1799)+(0,95)(0,1079)+(0,98)(0,1799)+(0,98)(,02158)+(0,3165)=
0,1763
0,9831= 0,1793→17,93%
Un 17,93% de que haya sido producida por la tercera máquina.
EJEMPLO 3 Cerveza Real.
La planta de cerveza Real está en Warnes, cuenta con 5 máquinas para producirla, la
primera produce 1000 latas por hora y solo 50 salen con desperfectos, la segunda
produce 1500 latas solo el 2% salen en muy mal estado, la tercera produce el doble que
la primera y 200 salen en condiciones no muy buenas, mientras que la cuarta produce lo
mismo que la segunda y el mismo porcentaje defectuoso que la primera. La quinta es una
maquina nueva y de tecnología de punta, esta produce 1000 latas por hora y todas salen
en buen estado. La primera trabaja 5 horas al día, la segunda 3, la tercera 10, y la cuarta
y la quinta 8.
Producción √ x Hrs.*día Producción
Total Proporción
Maquina 1 1000 0,95 0,05 5 5000 0,1010
Maquina 2 1500 0,98 0,02 3 4500 0,0909
Maquina 3 2000 0,90 0,10 10 20000 0,4040
Maquina 4 1500 0,95 0,05 8 12000 0,2424
Maquina 5 1000 1 0 8 8000 0,1616
Ʃ49500 Ʃ1
110
Máquina 1
0,1010 0,95 √
0,05 x Máquina 2
0,0909 0,98 √
0,02 x "Cerveza Real"
1
Máquina 3
0,4040 0,90 √
0,10 x Máquina 4
0,2424 0,95 √
0,05 x Máquina 5
0,1616 1 √
0 x
a) Ayer llego un cliente protestando porque tomo una lata con
desperfecto.
¿Cuál es la probabilidad que haya sido producida por la segunda
maquina? (0,02)(0,9090)
(0,02)(0,0909)+(0,05)(0,1010)+(0,10)(0,4040)+(0,05)(0,2424) =
0,001818
0,059388 = 0,0306
→3,06%
Existe un 3,06% de probabilidad que la lata defectuosa la haya producido la
maquina 2.
b) Pedro tiene en la mano una lata en buen estado ¿Cuál es la
probabilidad que haya sido producida por la tercera o la quinta
maquina?
(0,90)(0,4040)
(0,90)(0,4040)+(0,95)(0,1010)+(0,98)(0,0909)+(0,95)(0,2424)+(1)(0,1616)=
0,3636
0,940512 → 38,65%
(1)(0,1616)
(1)(0,1616)+(0,95)(0,1010)+(0,98)(0,0909)+(0,90)(0,4040)+(0,95)(0,2424)+(1)(0,1616)=
0,1616
0,940512
→17,18%
Se tiene un 55,83% de probabilidad que la lata en buen estado haya sido
producida por la tercera o la quinta máquina
111
Ejemplo 4
1) En el Laboratorio Industrial de UTEPSA, fabrican 150 yogures de durazno
diarios entre 6 estudiantes. El primero (Daniel), fabrica 24 yogures diarios y
una tercia parte están rancios por la falta de calidad, la segunda (Mabel),
fabrica 20 yogures diarios y 2 pares están en mal estado, la tercera (Anahí),
fabrica 10 yogures diarios y el 20% están rancios, el cuarto (Alejandro), fabrica
la cuarta parte menos que el primero y la misma cantidad de yogures rancios
que la quinta, la quinta (María) fabrica el doble que la tercera y el 50% más
que la segunda le salen en mal estado, el sexto (Ernesto), es el estudiante
más aplicado, ya que hizo la misma cantidad que el primero y no tuvo ningún
yogurt en mal estado. El encargado del Laboratorio les dio un plazo de un
trimestre para que realicen sus respectivos trabajos y presenten un informe
realizado por ellos de cuántos yogures hicieron en total (Tanto buenos como en
mal estado). El primero trabajó 5 días a la semana para realizar un buen
informe, la segunda trabajó 3 días a la semana, la tercera trabajó 1 día a la
semana, el cuarto realizó su trabajo más light y sólo trabajó 3 veces al mes, la
quinta trabajó 2 días a la semana y el sexto 6 días a la semana.
Producción
(Yogurt por
Día)
Producción
(Yogurt por Mes)
p q Producción
(1 Trimestre)
Probabilidad
Est.1
(Daniel) 24 480 0,667 0,333 1440 0,3170
Est. 2
(Mabel) 20 240 0,8 0,2 720 0,1585
Est. 3
(Anahí) 10 40 0,8 0,2 120 0,0264
Est. 4
(Alejandro) 6 18 0,7 0,3 54 0,0119
Est. 5
(María) 20 160 0,7 0,3 480 0,1057
Est. 6
(Ernesto) 24 576 0 1 1728 0,3804
∑ 4542 1
112
Est.1 (Daniel)
0,3170 0,667 √
0,333 X Est.2 (Mabel)
0,1585 0,80 √
0,20 X Est. 3 (Anahí)
0,0264 0,80 √
"Laboratorio Industrial"
UTEPSA
Est. 4 (Alejandro)
0,0119 0,70 √0,20 X
0,30 X Est. 5 (María)
0,1057 0,70 √
0,30 X Est. 6 (Ernesto)
0,3804 0,70 √
0,30 X a) ¿Cuántos yogures hicieron en total todos los estudiantes al terminar el
trimestre asignado?
R.- Al terminar el trimestre, los estudiantes hicieron un total de 4542 yogures.
b) Si 1 yogur está en mal estado, ¿Cuál es la probabilidad de que el
responsable sea la tercera estudiante o el cuarto estudiante?
(0,0264)(0,20)
(0,3170)(0,333) + (0,1585)(0,20) + (0,0264)(0,20) + (0,0119)(0,30) + (0,1057)(0,30) + (0,3804)(0)
=0,0052
0,1779 = 0,0298
→ 2,98%
(0,0119)(0,30)
(0,3170)(0,333) + (0,1585)(0,20) + (0,0264)(0,20) + (0,0119)(0,30) + (0,1057)(0,30) + (0,3804)(0)
=0,0036
0,1779 = 0,0202
→ 2,02%
2,98 + 2,02 = 5%
R.- La probabilidad de que la hubiera elaborado la tercera o el cuarto
estudiante es de 5%.
113
c) Si el encargado decidió tomar 1 yogurt, y éste estaba en buen estado,
¿Cuál es la probabilidad de que la hubiera elaborado el sexto estudiante o la
segunda estudiante?
(0,3804)(1)
(0,3170)(0,667) + (0,1585)(0,80) + (0,0264)(0,80) + (0,0119)(0,70) + (0,1057)(0,70) + (0,3804)(1)
=0,3804
0,822 = 0,4628
→ 46,28%
(0,1585)(0,80)
(0,3170)(0,667) + (0,1585)(0,80) + (0,0264)(0,80) + (0,0119)(0,70) + (0,1057)(0,70) + (0,3804)(1)
=0,1268
0,822 = 0,1543
→ 15,43%
46,28 + 15,43 = 61,71%
R.- La probabilidad de que la hubiera elaborado el sexto o la
segundaestudiante es de 61,71%.
d) El Jefe de Control de Calidad decidió tomar 1 yogurt, el cual estaba en mal
estado, ¿Cuál es la probabilidad de que lo hubiera elaborado el primer
estudiante o la quinta estudiante?
(0,3170)(0,333)
(0,3170)(0,333) + (0,1585)(0,20) + (0,0264)(0,20) + (0,0119)(0,30) + (0,1057)(0,30) + (0,3804)(0)
=0,1056
0,1779 = 0,5936
→ 59,36%
(0,1057)(0,30)
(0,3170)(0,333) + (0,1585)(0,20) + (0,0264)(0,20) + (0,0119)(0,30) + (0,1057)(0,30) + (0,3804)(0)
=0,0317
0,1779 = 0,1782
→ 17,82%
59,36 + 17,82= 77,18%
R.- La probabilidad de que la hubiera elaborado el primero o
la quinta estudiante es de 77,18%.
114
Ejemplo 5
En el Laboratorio Industrial de UTEPSA, trabajan 6 estudiantes. El primero (Daniel), fabrica 20 yogures de frutilla, 15 yogures de durazno y 10 yogures de chirimoya diarios, todos los yogures de frutilla le salen en buen estado, una tercia parte de los yogures de durazno le salen rancios y el 10% de los yogures de chirimoya también. La segunda (Mabel), fabrica 15 yogures de frutilla, 10 yogures de durazno y 6 yogures de chirimoya diarios, el 20% de los yogures de frutilla le salen rancios, 2 pares de los yogures de durazno corren la misma suerte, y la mitad de los yogures de chirimoya se le fregaron. La tercera (Anahí), fabrica 16 yogures de frutilla, 12 yogures de durazno y 20 yogures de chirimoya diarios, y la cuarta parte de sus yogures le salen rancios. El cuarto (Alejandro), fabrica la mitad que la tercera estudiante y la misma cantidad de yogures rancios que el sexto, la quinta (María) fabrica el doble que la cuarto y todos los yogures le salen en mal estado, el sexto (Ernesto), es el estudiante más aplicado, ya que hizo la misma cantidad que el primero y no tuvo ningún yogurt en mal estado. El encargado del Laboratorio les dio un plazo de un semestre para que realicen sus respectivos trabajos y presenten un informe realizado por ellos de cuántos yogures hicieron en total (Tanto buenos como en mal estado). El primero trabajó 6 días a la semana para realizar un buen informe, la segunda trabajó día por medio, la tercera trabajó 4 días a la semana, el cuarto realizó su trabajo más light y sólo trabajó 2 días del mes, la quinta trabajó 3 días cada trimestre y el sexto 6 días a la semana.
115
𝐅𝐫𝐮𝐭𝐢𝐥𝐥𝐚
𝟎, 𝟏𝟑𝟕𝟔 𝟏 √
𝟎 𝐗
𝐄𝐬𝐭. 𝟏 (𝐃𝐚𝐧𝐧𝐢𝐞𝐥)
𝟎,𝟑𝟎𝟗𝟔
𝐃𝐮𝐫𝐚𝐳𝐧𝐨
𝟎,𝟏𝟎𝟑𝟐 𝟎, 𝟔𝟔𝟕 √
𝟎, 𝟑𝟑𝟑 𝐗
𝐂𝐡𝐢𝐫𝐢𝐦𝐨𝐲𝐚
𝟎, 𝟎𝟔𝟖𝟖 𝟎, 𝟗𝟎 √
𝟎, 𝟏𝟎 𝐗 𝐅𝐫𝐮𝐭𝐢𝐥𝐥𝐚
𝟎, 𝟎𝟔𝟒𝟓 𝟎, 𝟖𝟎 √
𝟎, 𝟐𝟎 𝐗
𝐄𝐬𝐭. 𝟐 (𝐌𝐚𝐛𝐞𝐥)
𝟎,𝟏𝟑𝟑𝟑
𝐃𝐮𝐫𝐚𝐳𝐧𝐨
𝟎,𝟎𝟒𝟑𝟎 𝟎, 𝟔𝟎 √
𝟎, 𝟒𝟎 𝐗
𝐂𝐡𝐢𝐫𝐢𝐦𝐨𝐲𝐚
𝟎, 𝟎𝟐𝟓𝟖 𝟎, 𝟓𝟎 √
𝟎, 𝟓𝟎 𝐗 𝐅𝐫𝐮𝐭𝐢𝐥𝐥𝐚
𝟎, 𝟎𝟕𝟑𝟒 𝟎, 𝟕𝟓 √
𝟎, 𝟐𝟓 𝐗
"𝐋𝐚𝐛𝐨𝐫𝐚𝐭𝐨𝐫𝐢𝐨 𝐈𝐧𝐝𝐮𝐬𝐭𝐫𝐢𝐚𝐥"
𝐔𝐓𝐄𝐏𝐒𝐀
𝐄𝐬𝐭. 𝟑 (𝐀𝐧𝐚𝐡í)
𝟎,𝟐𝟐𝟎𝟏
𝐃𝐮𝐫𝐚𝐳𝐧𝐨
𝟎,𝟎𝟓𝟓𝟎 𝟎, 𝟕𝟓 √
𝟎, 𝟐𝟓 𝐗
𝐂𝐡𝐢𝐫𝐢𝐦𝐨𝐲𝐚
𝟎, 𝟎𝟗𝟏𝟕 𝟎, 𝟕𝟓 √
𝟎, 𝟐𝟓 𝐗 𝐅𝐫𝐮𝐭𝐢𝐥𝐥𝐚
𝟎, 𝟎𝟎𝟒𝟔 𝟏 √
𝟎 𝐗
𝐄𝐬𝐭. 𝟒 (𝐀𝐥𝐞𝐣𝐚𝐧𝐝𝐫𝐨)
𝟎,𝟎𝟏𝟑𝟕
𝐃𝐮𝐫𝐚𝐳𝐧𝐨
𝟎,𝟎𝟎𝟑𝟒 𝟏 √
𝟎 𝐗
𝐂𝐡𝐢𝐫𝐢𝐦𝐨𝐲𝐚
𝟎, 𝟎𝟎𝟓𝟕 𝟏 √
𝟎 𝐗 𝐅𝐫𝐮𝐭𝐢𝐥𝐥𝐚
𝟎, 𝟎𝟎𝟒𝟔 𝟎 √
𝟏 𝐗
𝐄𝐬𝐭. 𝟓 (𝐌𝐚𝐫í𝐚)
𝟎,𝟎𝟏𝟑𝟕
𝐃𝐮𝐫𝐚𝐳𝐧𝐨
𝟎,𝟎𝟎𝟑𝟒 𝟎 √
𝟏 𝐗
𝐂𝐡𝐢𝐫𝐢𝐦𝐨𝐲𝐚
𝟎, 𝟎𝟎𝟓𝟕 𝟎 √
𝟏 𝐗 𝐅𝐫𝐮𝐭𝐢𝐥𝐥𝐚
𝟎, 𝟏𝟑𝟕𝟔 𝟏 √
𝟎 𝐗
𝐄𝐬𝐭. 𝟔 (𝐄𝐫𝐧𝐞𝐬𝐭𝐨)
𝟎,𝟑𝟎𝟗𝟔
𝐃𝐮𝐫𝐚𝐳𝐧𝐨
𝟎,𝟏𝟎𝟑𝟐 𝟏 √
𝟎 𝐗
𝐂𝐡𝐢𝐫𝐢𝐦𝐨𝐲𝐚
𝟎, 𝟎𝟔𝟖𝟖 𝟏 √
𝟎 𝐗
116
Producción
(Yogurt por
Día)
Producción
(Yogurt por
Mes)
p q Producció
n (1
Semestre)
Probabilida
d
Est.1
(Daniel)
20 480 1 0 2880 0,1376
15 360 0,66
7
0,33
3
2160 0,1032
10 240 0,9 0,1 1440 0,0688
Est.2
(Mabel)
15 225 0,8 0,2 1350 0,0645
10 150 0,6 0,4 900 0,0430
6 90 0,5 0,5 540 0,0258
Est.3
(Anahí)
16 256 0,75 0,25 1536 0,0734
12 192 0,75 0,25 1152 0,0550
20 320 0,75 0,25 1920 0,0917
Est.4
(Alejandr
o)
8 16 1 0 96 0,0046
6 12 1 0 72 0,0034
10 20 1 0 120 0,0057
Est.5
(María)
16 16 0 1 96 0,0046
12 12 0 1 72 0,0034
20 20 0 1 120 0,0057
Est.6
(Ernesto)
20 480 1 0 2880 0,1376
15 360 1 0 2160 0,1032
10 240 1 0 1440 0,0688
∑ 20934 1
a) ¿Cuántos yogures hicieron en total todos los estudiantes al terminar el semestre asignado?
R.- Al terminar el trimestre, los estudiantes hicieron un total 20934 yogures.
117
b) Si 1 yogur de frutilla o de chirimoya está en buen estado, ¿Cuál es la probabilidad de que el responsable sea la tercera estudiante o el cuarto estudiante?
(0,0734)(0,75)
(0,1376)(1) + (0,0645)(0,80) + (0,0734)(0,75) + (0,0046)(1) + (0,0046)(0) + (0,1376)(1)
=0,05505
0,38645 = 0,1424
→ 14,24%
(0,0046)(1)
(0,1376)(1) + (0,0645)(0,80) + (0,0734)(0,75) + (0,0046)(1) + (0,0046)(0) + (0,1376)(1)
=0,0046
0,38645 = 0,0119
→ 1,19%
(0,0917)(0,75)
¡ (0,0688)(0,90) + (0,0258)(0,50) + (0,0917)(0,75) + (0,0057)(1) + (0,0057)(0) + (0,0688)(1)
=0,0688
0,2181 = 0,0261
→ 31,54%
(0,0057)(1)
(0,0688)(0,90) + (0,0258)(0,50) + (0,0917)(0,75) + (0,0057)(1) + (0,0057)(0) + (0,0688)(1)
=0,0057
0,2181 = 0,0261
→ 2,61%
14,24 + 1,19 + 31,54 + 2,61 = 49,58%
R.- La probabilidad de que la hubiera elaborado la tercera o el cuarto estudiante
es de 49,58%.
C)Si el Rector de UTEPSA decidió tomar 1 yogurt de durazno, y éste estaba en buen estado, ¿Cuál es la probabilidad de que la haya hecho el sexto estudiante o la segunda estudiante?
(0,1032)(1)
(0,1032)(0,667) + (0,0430)(0,60) + (0,0550)(0,75) + (0,0034)(1) + (0,0034)(0) + (0,1032)(1)
=0,1032
0,24355 = 0,4237
→ 42,37%
118
(0,0430)(0,60)
(0,1032)(0,667) + (0,0430)(0,60) + (0,0550)(0,75) + (0,0034)(1) + (0,0034)(0) + (0,1032)(1)
=0,0258
0,24355 = 0,1059
→ 10,59%
42,37 + 10,59= 52,96%
R.- La probabilidad de que la hubiera elaborado el sexto o la segunda estudiante
es de 52,96%.
c) El Jefe de Control de Calidad decidió tomar 1 yogurt de durazno y otro de chirimoya, y éstos estaban en mal estado, ¿Cuál es la probabilidad de que lo haya elaborado el primer estudiante o la quinta estudiante?
(0,1032)(0,333)
(0,1032)(0,333) + (0,0430)(0,40) + (0,0550)(0,25) + (0,0034)(0) + (0,0034)(1) + (0,1032)(0)
=0,0344
0,06875 = 0,5004
→ 50,04%
(0,0034)(1)
(0,1032)(0,333) + (0,0430)(0,40) + (0,0550)(0,25) + (0,0034)(0) + (0,0034)(1) + (0,1032)(0)
=0,0034
0,06875 = 0,0494
→ 4,94%
(0,0688)(0,10)
(0,0688)(0,10) + (0,0258)(0,50) + (0,0917)(0,25) + (0,0057)(0) + (0,0057)(1) + (0,0688)(0)
=0,00688
0,048405 = 0,1421
→ 14,21%
(0,0057)(1)
(0,0688)(0,10) + (0,0258)(0,50) + (0,0917)(0,25) + (0,0057)(0) + (0,0057)(1) + (0,0688)(0)
=0,0057
0,04805 = 0,1186
→ 11,86%
50,04 + 4,94 + 14,21 + 11,86 = 81,05%
R.- La probabilidad de que la hubiera elaborado el primer o la quinta estudiante
es de 81,05%.
119
d) Un Estudiante decidió comprar 1 yogur de frutilla, el cual estaba rancio. ¿Cuál es la probabilidad de que lo haya elaborado la quinta estudiante?
(0,0046)(1)
(0,1376)(0) + (0,0645)(0,20) + (0,0734)(0,25) + (0,0046)(0) + (0,0046)(1) + (0,1376)(0)
=0,0046
0,03585 = 0,1283
→ 12,83%
R.- La probabilidad de que la hubiera elaborado la quinta estudiante es de
12,83%.
Ejemplo 3 El señor Oscar es dueño de 4 carnecerías y tiene a 4 encargados o carniceros a cargo de ellas, las carnecerías son nuevas y el señor Oscar quiere saber en cuál de los 4 puestos de carne se vende más. El 1er carnicero recibe 1500kg ( 500 kg es carne de 1era,500kg es carne de 2da y los otros 500 kg es carne molida) el 3% de la carne de 1era no puede vender, el 1% de la carne de 2da y el 6% de la carne molida. El 2do carnicero recibe 1000kg (500kg es carne de 1era y 500kg es carne de 2da, a él no le llevan carne molida) ¼ de la carne de 1era no puede vender y el 5% de la de 2da). El 3er carnicero recibe 2000kg (600kg es carne molida, 700kg es carne de 1era y lo que sobra es carne de 2da) no puede vender el doble de porcentaje de carne de 1era que la del 1er carnicero, el 2% de carne de 2da y toda la carne molida logra vender. El 4to carnicero recibe el doble de kg de carne que el 1ero (1000kg de carne de 1era, 1500kg de 2da y 500kg de molida) logra vender toda la carne de 1era y no puede vender la mitad del porcentaje de carne de 2da que la del 3er carnicero, y también no puede vender 70 kg de carne molida.(toda la carne que no pueden vender los carniceros se pudre y es botada o enviada al señor Oscar).
1. El 1er carnicero trabaja 6 días a la semana
2. El 2do carnicero trabaja 5 días a la semana
3. El 3er carnicero trabaja 4 días a la semana
4. El 4to carnicero trabaja los 7 días
Al señor Oscar le hacen llegar unos kg de carne de 2da que sobro en mal estado, ¿cuál es la probabilidad de que haiga sido enviada por el 1er carnicero? Realizamos la Tabla:
120
121
CARNIVERIA OSCAR
1ER CARNICERO
(0,2091)
Carne de primera (0,0697)
SI(0,97)
NO(0,03)
Carne de segunda (0,0697)
SI(0,99)
NO(0,01)
Carne molida (0,0697)
SI(0,94)
NO(0,06)
2DO CARNICERO
(0,1162)
Carne de primera (0,0581)
SI(0,75)
NO(0,25)
Carne de segunda (0,0581)
SI(0,98)
NO(0,02)
Carne molida (0)
SI(0)
NO(0)
3ER CARNICERO
(0,186)
Carne de primera (0,651)
SI(0,94)
NO(0,06)
Carne de segunda (0,0651)
SI(0,98)
NO(0,02)
Carne molida (0,0558)
SI(1)
NO(0)
4TO CARNICERO
(0,4881)
Carne de primera (0,1627)
SI(1)
NO(0)
Carne de segunda (0,2441)
SI(0,99)
NO(0,01)
Carne molida (0,0813)
SI(0,86)
NO(0,14)
122
a) (0.0697)(0.01)
(0.0697)(0.01) + (0.0581)(0.05) + (0.0651)(0.02) + (0.2441)(0.01)
= 0.0948 ∗ 100% = 9.48% Hay una probabilidad de 12.88% que haiga sido enviada por el 1er carnicero la carne en mal estado.
BARCO PESQUERO S.A. es una empresa apicultora que tiene 4 pozas como criadero de 3 especies para comercializar.
1- De la cual en la primera poza sacan 50 surubí, 20 pacú y 40 es la media de
amarillos al mes. De las cuales 10 surubíes sobrepasan los 10kg. , 20%de
los pacú sobrepasan los 3kg. Y el 10% de los amarillos son de buen
tamaño sobrepasando los 5 kg.
2- En la segunda poza salen 80 surubí al mes, 20 pacú a la quincena y 60
amarillos al mes. De los cuales el 15% del surubí sobrepasan los 10kg. , el
5% del pacú sobrepasan los 3kg. , y el 75% de los amarillos no sobrepasan
los 5kg.
3- De la tercera poza salen 70 surubí y 30 pacú al mes, en esta no hay la
especie de los amarillos. De los cuales el 7% del surubí sobrepasan los
10kg. , una 1/10 del pacú sobrepasan los 3kg.
4- De la cuarta poza sacan 180 pescados al mes, de los cuales la mitad son
surubí, 60 son pacú y resto son amarillos. De los cuales 15% de los surubí
sobrepasan los 10kg. , 13%del pacú sobrepasan los 3kg. Y 12% de los
amarillos sobrepasan los 5kg.
- Como dato extra sabemos que la poza #1 trabaja 3 veces al año, la poza #2
trabaja 4 veces al año al igual que la poza #3 y por último la poza #4
trabaja 3 veces al año.
- Una empresa que adquiere los servicios de BARCO PESQUERO S.A. fue a
dejarle un reconocimiento por un pez Surubí que le había llegado con un
peso mayor a 10kg. Y un Pacú Amarillo con un peso mayor a 5kg.
- ¿Cuál es la probabilidad de que esos peces hayan sido sacado de la poza
#4?
123
Armando Tabla:
124
BARCO PESQUERO
1ER POZA (0,2091)
SURUBI (0,0697)
SI(0,97)
NO(0,03)
PACU
(0,0697)
SI(0,99)
NO(0,01)
AMARILLO (0,0697)
SI(0,94)
NO(0,06)
2DO POZA (0,1162)
SURUBI (0,0581)
SI(0,75)
NO(0,25)
PACU
(0,0581)
SI(0,98)
NO(0,02)
AMARILLO
(0)
SI(0)
NO(0)
3ER POZA (0,186)
SURUBI (0,651)
SI(0,94)
NO(0,06)
PACU
(0,0651)
SI(0,98)
NO(0,02)
AMARILLO (0,0558)
SI(1)
NO(0)
4TA POZA (0,4881)
SURUBI (0,1627)
SI(1)
NO(0)
PACU
(0,2441)
SI(0,99)
NO(0,01)
AMARILLO (0,0813)
SI(0,86)
NO(0,14)
125
Unidad 7
Distribuciones de probabilidad importantes para V.A.D V.A.C
OBJETIVOS
identificar los componentes de la teoría combinatoria.
Identificar las distribuciones de probabilidades más importantes para VAD.
Resolver las distribuciones de probabilidades más importantes de VAD.
Resolver problemas de aplicación a la economía.
1.- DISTRIBUCIONES BINOMINAL
Es cualquier experimento formado por una serie de ensayos repetidos tales que:
1. Los ensayos son independientes.
2. Cada ensayo tiene dos resultados posibles, denominados “éxito” o “fracaso”.
3. La probabilidad de éxito de cada ensayo, denotada por p, permanece constante.
Las probabilidades se calculan a través de la siguiente formula:
P[x=?] = C pxqn-x ó n x P[x]= nCx * (p^x) * (q^(n-x)) n= muestra
x= parte de muestra
P= probabilidad de ocurrencia (+,-)
q= 1 – p óP+q =1
C= Combinación
126
EJEMPLO 1
Después de una auditoria externa en una empresa financiera se determinó que el 30% de sus créditos están en mora. Si el auditor interno toma una muestra aleatoria de cinco de esas cuentas, determine la probabilidad de que exactamente dos créditos estén en mora.
Utilizando la formula binominal tenemos:
Dónde:
n=5 p+q=1 p=0.3 q=0.7 P[x]= nCx * (p^x) * (q^(n-x)) P[x=2]= 5C2 * (0.3^2) * (0.7^(5-2)) P[x=2]= 0.3087 Entonces la probabilidad es 0.3087
EJEMPLO 2
Un examen consta de diez preguntas, cada pregunta es de selección múltiple con tres opciones de las cuales solo una es correcta. Un estudiante que desconoce la materia intenta resolver el examen respondiendo las preguntas al azar:
a) Si necesita responder como mínimo 5 preguntas correctas para aprobar el examen. Cuál es la probabilidad de que el estudiante apruebe?
Datos
n=10 p=0.33
q=0.67 x = 5, 6, 7, 8, 9, 10
P[x]= nCx * (p^x) * (q^(n-x)) P[x=5]= 10C5 * (0.33^5) * (0.67^(10-5)) P [x = 5] = 0.1332 = 13.32%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=6]= 10C6 * (0.33^6) * (0.67^(10-6)) P [x = 6] = 0.0547 = 5.7%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=7]= 10C7 * (0.33^7) * (0.67^(10-7)) P[x=7]= 0.0154 = 1.54%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=8]= 10C8 * (0.33^8) * (0.67^(10-8)) P[x=8]= 0.028 = 0.28%
127
P[x]= nCx * (p^x) * (q^(n-x)) P[x=9]= 10C9 * (0.33^9) * (0.67^(10-9)) P[x=9]= 0.0003 = 0.03%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=10]= 10C10 * (0.33^10) * (0.67^(10-10)) P[x=10]= 0 .0000 = 0%
P (X ≥ 5) = P (X = 5) + P (X = 6) + P (X = 7) + P (X = 8) + P (X = 9) + P (X = 10) P (X ≥ 5) = 0.1332 + 0.0547 + 0.0154 + 0.0028 + 0.0003 + 0.0000 P (X ≥ 5) = 0.2064 = 20.64% La probabilidad de que un estudiante apruebe es de 20.64%
b) Cuál es la probabilidad de que conste al menos 3 preguntas correctas?
n=10 p=0.33
q=0.67 X = 3, 4, 5, 6, 7, 8, 9,10
P[x=3]= nCx * (p^x) * (q^(n-x)) P[x=3]= 10C3 * (0.33^3) * (0.67^(10-3)) P[x=3]= 0.2614 = 26 .14%
P[x=4]= nCx * (p^x) * (q^(n-x)) P[x=4]= 10C4 * (0.33^4) * (0.67^(10-4)) P[x=4]= = 0.2253 = 22.53%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=5]= 10C5 * (0.33^5) * (0.67^(10-5)) P [x = 5] = 0.1332 = 13.32%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=6]= 10C6 * (0.33^6) * (0.67^(10-6)) P [x = 6] = 0.0547 = 5.7%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=7]= 10C7 * (0.33^7) * (0.67^(10-7)) P[x=7]= 0.0154 = 1.54%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=8]= 10C8 * (0.33^8) * (0.67^(10-8)) P[x=8]= 0.028 = 0.28%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=9]= 10C9 * (0.33^9) * (0.67^(10-9)) P[x=9]= 0.0003 = 0.03%
P[x]= nCx * (p^x) * (q^(n-x))
128
P[x=10]= 10C10 * (0.33^10) * (0.67^(10-10)) P[x=10]= 0 .0000 = 0%
P (X ≥ 3) = P (X =3) + P (X = 4) + P (X = 5) + P (X = 6) + P (X = 7) + P (X = 8) + P(X=9) + P(X=10)
P (X ≥ 3) = 0.02614 + 0.2253 + 0.1332 + 0.0547 + 0.0154 + 0.0028 + 0.0003 + 0.0000
P (X ≥ 3) = 0.6931 = 69.31%
La probabilidad de que conste al menos 3 preguntas correctas es de 69.39%
c) Cuál es la probabilidad de que conteste como mínimo 4 preguntas correctas?
x = 4, 5, 6, 7, 8, 9,10 n = 10
p =0.33 q = 0.67
P[x=4]= nCx * (p^x) * (q^(n-x)) P[x=4]= 10C4 * (0.33^4) * (0.67^(10-4)) P[x=4]= = 0.2253 = 22.53%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=5]= 10C5 * (0.33^5) * (0.67^(10-5)) P [x = 5] = 0.1332 = 13.32%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=6]= 10C6 * (0.33^6) * (0.67^(10-6)) P [x = 6] = 0.0547 = 5.7%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=7]= 10C7 * (0.33^7) * (0.67^(10-7)) P[x=7]= 0.0154 = 1.54%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=8]= 10C8 * (0.33^8) * (0.67^(10-8)) P[x=8]= 0.028 = 0.28%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=9]= 10C9 * (0.33^9) * (0.67^(10-9)) P[x=9]= 0.0003 = 0.03%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=10]= 10C10 * (0.33^10) * (0.67^(10-10)) P[x=10]= 0 .0000 = 0%
P (X ≥ 4) = P (X =4) + P (X = 5) + P (X = 6) + P (X = 7) + P (X = 8) + P (X = 9) + P(X=10)
129
P (X ≥ 4)= 0.2252 + 0.1332 + 0.0547 +0.0154 +0.0028 + 0.0003 + 0.0000
P (X ≥ 4)= 0.4317 = 43.17%
La probabilidad de que conteste como mínimo 4 preguntas correctas es de 43.17%
d) Cuál es la probabilidad de que conteste entre 2 y 6 preguntas correctas?
x = 3 ,4 ,5 n = 10
p =0.33 q = 0.67
P[x=3]= nCx * (p^x) * (q^(n-x)) P[x=3]= 10C3 * (0.33^3) * (0.67^(10-3)) P[x=3]= 0.2614 = 26 .14%
P[x=4]= nCx * (p^x) * (q^(n-x)) P[x=4]= 10C4 * (0.33^4) * (0.67^(10-4)) P[x=4]= = 0.2253 = 22.53%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=5]= 10C5 * (0.33^5) * (0.67^(10-5)) P [x = 5] = 0.1332 = 13.32%
P (2<X<6) = P (X =3) + P (X = 4) +P (X = 5)
P (2<X<6) = 0.2614 + 0.2253 + 0.1332
P (2<X<6) = 0.6199 = 61.99%
La probabilidad de que conteste entre 2 y 6 preguntas es del 61.99%
130
EJEMPLO 3
En una universidad el 50% de los estudiantes están escritos en carreras del área empresarial, el 20 % en carreras de Ingeniería, el 20% en derecho y el 10% en carreras de humanidades. si se toma una muestra de 8 alumnos, cual es la probabilidad:
a) Que hayan más de 4 alumnos del área de empresariales.
x = 5, 6, 7 ,8 n=8
p=0.5 q=0.5
P[x]= nCx * (p^x) * (q^(n-x)) P[x=5]= 8C5 * (0.5^5) * (0.5^(8-5)) P [x = 5] = 0.2188 = 21.88%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=6]= 8C6 * (0.5^6) * (0.5^(8-6)) P [x = 6] = 0.1094 = 10.94%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=7]= 8C7 * (0.5^7) * (0.5^(8-7)) P [x = 7] = 0.0313 = 3.13%
P[x]= nCx * (p^x) * (q^(n-x)) P[x=8]= 8C8 * (0.5^8) * (0.5^(8-8)) P [x = 8] = 0.0039 = 0.39%
P (X<4) = P (X=5) + P (X = 6) + P (X = 7) + P (X = 8)
P (X<4) = 0.2188 + 0.1094 + 0.0313 + 0.0039
P (X<4) = 0.3634 = 36.34%
La probabilidad de que hayan más de 4 alumnos en el área empresarial es de 36.34%
b) Que exactamente 3 alumnos sean de derecho
n =8 x=3
p = 0.20 q =0.80
P[x]= nCx * (p^x) * (q^(n-x)) P[x=3]= 8C3 * (0.2^3) * (0.8^(8-3)) P [x = 3] = 0.1468 = 14.68%
La probabilidad de que exactamente 3 alumno sean de derecho es de 14.68%
131
EJEMPLO 4
Supongamos que un avión tiene seis motores, cada motor trabaja de forma independiente y la probabilidad de falla de cada motor es de 3%.
Determinar cuál, es la probabilidad de que en un vuelo cualquiera:
a.) No ocurra ninguna falla
x=0 n=6 p=0.03 q=0.9
P[x=0]= nCx * (p^x) * (q^(n-x)) P[x=0]= 6C0 * (0.03^0) * (0.97^(6-0)) P[x=0]= 0.8329 = 83.29%
La probabilidad de que ocurra ninguna fallas es de 83.29%
b. Fallen un número menor a 2 motores
x = 0,1 n=6 p=0.03 q=0.97
P[x=0]= nCx * (p^x) * (q^(n-x)) P[x=0]= 6C0 * (0.03^0) * (0.97^(6-0)) P[x= 0.8329 = 83.29%
P[x=1]= nCx * (p^x) * (q^(n-x)) P[x=1]= 6C1 * (0.03^1) * (0.97^(6-1)) P[x=1]= 0.1545 = 15.45%
P (X<2) = P (X=0) + P (X = 1)
P (X<2) = 0.8329 + 0.1545
P (X<2) = 0.9874 = 98.74%
c. Que probabilidad de que fallen más de un motor, si el último registro informa que ya fallaron 3 motores?
x = ,2,3,4,5,6 n=6 p=0.03 q=0.97
P[x>1] = P (X = 2) + P (X=3) + P (X = 4) + P (X=5) + P (X = 6)
P[x=4]= nCx * (p^x) * (q^(n-x)) P[x=4]= 6C4 * (0.03^4) * (0.97^(6-4)) P[x=4]= 0.00001143 = 0.00%
P[x=5]= nCx * (p^x) * (q^(n-x)) P[x=5]= 6C5 * (0.03^5) * (0.97^(6-5))
132
P[x=5]= 0.00000014 = 0.00%
P[x=6]= nCx * (p^x) * (q^(n-x)) P[x=6]= 6C6 * (0.03^6) * (0.97^(6-6)) P[x=6]= 07.29 e-10 = 0.00%
P[x>1] = P (X = 4) + P (X=5) + P (X = 6)
P[x>1] = 0+0+0 = 0%
La probabilidad de que fallen más de un motor es 0%
EJEMPLO 5
Un agente de seguros vende pólizas a cinco personas de la misma edad y que disfrutan de buena salud. Según las tablas actuales, la probabilidad de que una persona en estas condiciones viva 30 años o más es 2/3.
a)Hállese la probabilidad de que, transcurridos 30 años vivan las cinco personas.
x=5 n=5 p= 2/3=0.66 q = 1/3=0.33
P[x=5]= nCx * (p^x) * (q^(n-x))
P[x=5]= 5C5 * (0.66^5) * (0.33^(5-5)) P[x=5]= 0.1252 = 12.52%
La probabilidad que vivan las 5 personas es de 12.52%
b)Al menos tres personas.
x=3,4,5 n=5 p= 2/3=0.66 q = 1/3=0.33
P[x=3]= nCx * (p^x) * (q^(n-x)) P[x=3]= 5C3 * (0.66^3) * (0.33^(5-3)) P[x=3]= 0.3130 = 31.30%
P[x=4]= nCx * (p^x) * (q^(n-x)) P[x=4]= 5C4 * (0.66^4) * (0.33^(5-4)) P[x=4]= 0.3130 = 31.30 %
P[x=5]= nCx * (p^x) * (q^(n-x)) P[x=5]= 5C5 * (0.66^5) * (0.33^(5-5)) P[x=5]= 0.1252 = 12.52%
P (X≥3) = P (X=3) + P (X =4) + P (X =5)
133
P (X≥3) = 0.3130+ 0.3130 + 0.1252
P (X≥3) = 0.7512 = 75.12%
La probabilidad que vivan al menos 3 personas es del 75.12%
c)Exactamente dos personas.
x=2 n=5 p= 2/3=0.66 q = 1/3=0.33
P[x=2]= nCx * (p^x) * (q^(n-x)) P[x=2]= 5C2 * (0.66^2) * (0.33^(5-2)) P[x=2]= = 0.1565 = 15.65%
La probabilidad que vivan dos personas 15.65%
EJEMPLO 6
La probabilidad de que un hombre acierte en el blanco es 1/4. Si dispara 10 veces a)¿cuál es la probabilidad de que acierte exactamente en tres ocasiones?
x=3 n=10 p =¼=0.25 q = ¾=0.75
P[x=3]= nCx * (p^x) * (q^(n-x)) P[x=3]= 10C3 * (025^3) * (0.75^(10-3)) P[x=3]= 0.2502 = 25.02%
La probabilidad de que acierte 3 ocasiones es de 25.02%
b)¿Cuál es la probabilidad de que acierte por lo menos en una ocasión?
x=1 n=10 p =¼=0.25 q = ¾=0.75
p+q=1
p=1-q
P[x≥1]=1- P[x<1]
P[x≥1]=1- [P[=0]]
P[x≥1]=1- [10C0 * (0.25^0) * (0.75^(10-0))]
P[x≥1]= 0.9436 = 94.36%
La probabilidad de que acierte en una ocasión es del 94.36%
c) De que acierte un número menor a 3 tiros
134
x=0,1,2 n=10 p =¼=0.25 q = ¾=0.75
P[x=0]= nCx * (p^x) * (q^(n-x)) P[x=0]= 10C0 * (025^0) * (0.75^(10-0)) P[x=0]=0.0563= 5.63%
P[x=1]= nCx * (p^x) * (q^(n-x)) P[x=1]= 10C1 * (025^1) * (0.75^(10-1)) P[x=1]= 0.1877 = 18.77%
P[x=2]= nCx * (p^x) * (q^(n-x)) P[x=2]= 10C2 * (025^2) * (0.75^(10-2)) P[x=2]= 0.2815 = 28.15%
P (X<3) = P (X=0) + P (X =1) + P (X =2)
P (X<3) = 0.0563+ 0.1877 + 0.2815
P (X<3) = 0.5255 = 52.55 %
La probabilidad de que acierte un número menor a 3 tiros es de 52.55%
EJEMPLO 7
Se diseña un complicado sistema electrónico con cierta cantidad de componentes de seguridad con sus subsistemas. Uno de ellos cuenta con 4 componentes idénticos, cada uno con una probabilidad de fallar de 0.2 en menos de 1000 horas. El subsistema funcionará si dos de los 4 componentes están trabajando. Suponga que cado uno opera de manera independiente.
a) Determine la probabilidad de que dos de los cuatro componentes rindan más de 1000 horas.
n = 4 x = 2 p = 0.2 q = 1-p = 0.8
P(x=2) = nCx *(p^x)* (q^(n-x)) P(x=2) = 4C2*(0.2^2)*(0.8^2) P(x=2) = 0.1536 = 15.36% La probabilidad que rindan dos componentes es de 15.36%
b) Encuentre la probabilidad de que el subsistema funcione más de 1000 horas.
n = 4 ; x = 4 ; p = 0.2 ; q = 1-p à q = 0.8
P(x>=4) = 1-P(x<=3)
P(x<=3) = nCx *(p^x)* (q^(n-x))
P(x<=3) = 4C3*(0.2^3)*(0.8^1)
135
P(x) = 0.0256
P(x) = 1 - 0.0256
P(x) = 0.9744 = 97.44%
La probabilidad de que el subsistema funcione 1000 hrs es del 97.44%
DISTRIBUCION DE POISSON Dado un intervalo de números reales, suponga que en el conteo de ocurrencias es aleatorio en dicho intervalo. Si este puede dividirse en subintervalos suficientemente pequeño tales que:
1. La probabilidad de ocurrencia más de una ocurrencia en dicho subintervalos en
cero.
2. La probabilidad de ocurrencia en un subintervalos es la misma para todos los
subintervalos, y es proporcional a la longitud de estos.
3. En conteo de ocurrencia en cada subintervalos es independiente del delos demás
subintervalos.
𝑃(𝑋 = 𝑥) =𝑒−2ℷ𝑥
x!
PROPIEDADES
EJEMPLO 1 Un promedio de cinco personas por hora realizan transacciones en una ventanilla de servicios especiales de un banco comercial. Suponiendo que al arribo de esas personas tiene una distribución independiente y es igualmente probable a lo largo del periodo de interés ¿cuál es la probabilidad de exactamente diez personas deseen realizar transacciones en ventanilla de servicios especiales durante una hora en particular?
P(x = 10) = 0,01813 = 1,81%
Donde: e= base del logaritmo neperiano (2,7182)
ℷ=promedio x=valor buscado
µx=E(x)=ℷ ϭ𝟐𝒙 = 𝑽(𝒙) = ℷ
𝑃(𝑋 = 𝑥) =𝑒−2ℷ𝑥
x!
𝑃(𝑋 = 10)
=𝑒−5𝑥510
10!
136
EJEMPLO 2 Un promedio de 6 personas por hora hacen uso de caja bancaria automática durante el
horario pico de compra en una tienda departamental. Cuál es la probabilidad de que:
ℷ= 6/hora
Exactamente 6 personas usen la caja durante una hora aleatoriamente seleccionada?
P (X = 6) = 𝑒6∗(6)6
6! = 0.1606 = 16.06%
Menos de 5 personas usen la caja durante una hora aleatoriamente seleccionada?
P (X = 4) = 𝑒6∗(6)4
4! = 0.1339 = 13.39%
P (X = 3) = 𝑒6∗(6)3
3! = 0.0892 = 8.92%
P (X = 2) = 𝑒6∗(6)2
2! = 0.0446 = 4.46%
P (X = 1) = 𝑒6∗(6)1
1! = 0.0149 = 1.49%
P (X = 0) = 𝑒6∗(6)0
0! = 0.0025 = 0.25%
P (X<5) = 0.1339 + 0.0892 + 0.0446 + 0.0149 + 0.0025 = 0.2851 = 28.51%
Ninguna persona la use durante un intervalo de 10 minutos?
ℷ= 1 /hora
P(X = 0) = 𝑒−1∗(1)0
0! = 0.3679 = 36.79
Ninguna persona la use durante un intervalo de 5 minuto?
ℷ= 0,5 /hora
P (X = 0) = 𝑒−0.50∗(0.50)0
0! = 0.6065 = 60.65%
137
EJEMPLO 3 Un promedio de 6 personas por hora hacen uso de caja bancaria automática durante el
horario pico de compra en una tienda departamental. Cuál es la probabilidad de que:
ℷ= 6/hora
a. Exactamente 4 personas usan la caja durante una hora aleatoriamente
seleccionada.
P(X = 4) =𝑒−6 ∗ (6)4
4!= 0.1338 = 13.38%
b. Menos de 5 personas usen la caja durante una hora aleatoriamente seleccionada
P(X = 4) =𝑒−6 ∗ (6)4
4!= 0.1339 = 13.39%
P(X = 3) =𝑒−6 ∗ (6)3
3!= 0.0892 = 8.92%
P(X = 2) =𝑒−6 ∗ (6)2
2!= 0.0446 = 4.46%
P(X = 1) =𝑒−6 ∗ (6)1
1!= 0.0149 = 1.49%
P(X = 0) =𝑒−6 ∗ (6)0
0!= 0.0025 = 0.25%
P(X ‹ 5) = 0.1339 + 0.0892 + 0.0446 + 0.0149 + 0.0025 = 0.2851 = 28.51%
c. Ninguna persona la use durante un intervalo de 10 minutos
ℷ= 1 /hora
P(X = 0) =𝑒−1 ∗ (6)0
0!= 0.3679 = 36.79%
d. Ninguna persona la use durante un intervalo de 5 minutos
ℷ= 0,5 /hora
P(X = 0) =𝑒−0.50 ∗ (0.50)0
0!= 0.6065 = 60.65%
138
EJEMPLO 4
El número de casos admitidos de emergencia en cierto Hospital durante 1 hora es una
variable aleatoria con una distribución de Poisson con ƛ = 3
a. Ningún caso de emergencia es admitido
P(X = 0) =𝑒−3 ∗ (3)0
0!= 0.0498 = 4.98%
b. Más de 4 casos de emergencia son admitidos
P(X = 5) =𝑒−3 ∗ (3)5
5!= 0.1008 = 10.08%
P(X = 6) =𝑒−3 ∗ (3)6
6!= 0.0504 = 5.04%
P(X = 7) =𝑒−3 ∗ (3)7
7!= 0.0216 = 2.16%
P(X = 8) =𝑒−3 ∗ (3)8
8!= 0.0081 = 0.81%
P(X = 9) =𝑒−3∗(3)9
9!= 0.0027 = 0.27%
P(X = 10) =𝑒−3∗(3)10
10!= 0.0008 = 0.08%
P(X = 11) =𝑒−3∗(3)11
11!= 0.0002 = 0.02%
P(X = 12) =𝑒−3∗(3)12
12!= 0.0001 = 0.01%
c. Por lo menos dos casos sean admitidos
P(X = 0) =𝑒−3 ∗ (3)0
0!= 0.0498 = 4.98%
P(X = 1) =𝑒−3 ∗ (3)1
1!= 0.1494 = 14.94%
139
UNIDAD 8 DISTRIBUCION NORMAL PARA MUESTRAS GRANDES Es sin duda la distribución más utilizada para modelar experimentos aleatorios. La distribución normal es una distribución continua que se ajusta a las distribuciones reales observadas en muchos fenómenos como ser:
Las mediciones de velocidad de transmisiones de datos.
Las mediciones de corriente eléctrica.
Las mediciones de temperatura.
En general todo lo que se pueda medir.
Tiene las siguientes propiedades:
La curva o distribución de los datos es unimodal.
La medida de la población cae dentro del gráfico y coincide con el centro de la
gráfica.
Los dos extremos de la distribución normal se extienden infinitivamente nunca
toca el eje horizontal (desde luego, esto es imposible de mostrar de manera
gráfica).
Para definir un distribución normal se necesita solamente dos parámetros la
medida y la desviación estándar.
La distribución es simétrica con µ respecto a la línea vertical que FIG.GRAFICA DE LA DISTRIBUCION NORMAL Pasa por la media µ
No es necesario ni posible tener una tabla distinta para cada distribución normal posible, en lugar de ellos se utiliza una distribución normal estándar para encontrar las probabilidades. Fórmula de Aplicación de la Distribución Normal de Probabilidades.
PROPIEDADES
E(x)=µ V(x)=ϭ
Para entender mejor este tema veamos un ejercicio de Aplicación.
σ
μ-xz
140
EJEMPLO 1
DISTRIBUCION DE PROBABILIDAD NORMAL
Varios test de inteligencia dieron una puntación que sigue una ley normal con media 100 y
desviación típica 15.
a) cual es el porcentaje de la población que obtendría un coeficiente entre 95 y 110?
b) cual es el porcentaje de la población que obtendría un coeficiente entre 102 y 135?
c) cual es el porcentaje de la población que obtendría un coeficiente entre 97 y 71?
d) cual es el porcentaje de la población que obtendría un coeficiente mayor a 110?
e) Cual es el porcentaje de la población que obtendría un coeficiente menor a 75?
Datos
µ = 100
r = 15
a) P [95 ≤ x ≤ 110]
-3 -2 -1 0 1 2 3
55 70 85 95 100 110 115 130 145
141
Z1 = X - µ Z2 = X - µ
r r
Z1 = 95 – 100 Z2 = 110 – 100
15 15
Z1 = -0.33 Z2 = 0.66
0`00 0`01 0`03 0`00 0´01 0´02 0´03 0´04 0´05 0´06
0´0 0´0
0`1 0´1
0`3 0,12930 P1 = 0,12930 0´3
0´4 P2 = 0.24537
0´5
0´6 0,24537
RESPUESTA
P1 + P2 = 0,12930 + 0,24537 = 0,37467 = 37,46%
b) P [ 102 ≤ X ≤ 135 ]
-3 -2 -1 0 1 2 3
55 70 85 100102 115 130135 145
Z1 = X - µ Z2 = X - µ
r r
} Formulas
142
Z1 = 102 -100 Z2 = 135 – 100
15 15
Z1 = 0,13 Z2 = 2,33
0´00 0´01 0´02 0´03 0´00 0´01 0´02 0´03 0´04
0´0 2´0
0´1 0,05172 P1 = 0,05172 2´1 P2 = 0,49010 0´2 2´3 0,49010
0´3 2,4
RESPUESTA
P1 – P2 = 0,05172 – 0,49010 = -0,4383 = 43,83 %
c) P [ 97 ≤ X ≤ 71 ]
-3 -2 -1 0 1 2 3
55 71 70 85 91 100 115 130 145
Formulas
Z1 = X - µ Z2 = X - µ
r r
Z1 = 97 – 100 Z2 = 71 – 100
15 15
Z1 = - 0,20 Z2 = -1,93
143
0´00 0´01 0´02 0´03 0´00 0´01 0´03
0´1 1´5
0´2 0,07926 P1 = 0,07926 1´7 P2 = 0,47320 0´3 1,8
1,9 0,47320
RESPUESTA
P1 – P2 = 0,07926 – 0,47320 = - 0,3939 = 39,39 %
d) P [ X ≥ 110 ]
-3 -2 -1 0 1 2 3
55 70 85 100 110 115 130 145
Z = 110 – 100 = 0,67
15
0´00 0´01 0´02 0´03 0´04 0´05 0´06 0´07
0´1
0´2
0´3 P2= 0,2487
0´4
0´5
0´6 0,24857
RESPUESTA
0,5 – P2 = 0,5 – 0,2487 = 0,2513 = 25,13%
144
e) P [X ≤ 75]
-3 -2 -1 0 1 2 3
55 70 75 85 100 115 130 145
Z = 75 – 100 = -1,67
15
0´00 0´01 0´02 0´03 0´04 0´05 0´06 0´07 1´01
1´02
1´03 P1 = 0,45254
1´04
1´05
1´06 0,45254
RESPUESTA
0,5 – P1 = 0,5 – 0.45254 = 0,04746 = 4,74%
145
EJEMPLO 2
Los montos de dinero que se piden en las solicitudes de préstamos en Down River
Federal Savings tiene una distribución normal, una media de $70,000 y una
desviación estándar de $20,000. Esta mañana se recibió una solicitud de
préstamo. ¿Cuál es la probabilidad de que:
A) El monto sea de $80.000 o superior.
B) El monto solicitado oscile entre $65.000 y $80.000
C) El monto solicitado sea de $65.000 o superior.
Datos
µ = $70.00
α = $20.00
A) P [ 80.000 ≥ ]
P1
-3 -2 -1 0 1 2 3
10 30 50 70 80 90 110 130
Z1 = 𝐱−µ
𝛔
Z= 𝑿−µ
𝝈
146
𝑧 =80.000−70.000
20.000 =
10.000
20.000 = 0.50 = 0.19146
0`0 0`1 0´2 0´3 0´4 0`5
0´1
0´2
0´3
0`4
0`5 0.19146
Respuesta.
P= 0.5+ 0.19146= 0.69146 = 69.146%
B).[65.000 ≥ 80.000]
P1 P2
3 2 1 0 1 2 3
10 30 50 65 70 80 90 110 130
P = 0.19146
147
Z1 = 𝐱−µ
𝛔
Z1 =65.000−70.000
20.000 =
−5.000
20.000 = -0.25 = 0.09871
0.0 0.1 0.2 0.3 0.4 0.5
0.0
0.1
0.2 0.09871
0.4
Z2 = 𝐱−µ
𝛔
𝑧2 =80.000−70.000
20.000=
10.000
20.000 = 0.50 = 0.1914
0.0 0.1 0.2 0.3 0.4 0.5
0.1
0.2
0.3
0.4
0.5 0.19146
Respuesta:
P1 + P2 = 0.09871 + 0.19146 = 0.29017 = 29.017%
P1 = 0.09871
P2 = 0.19146
148
C. [65.000 ≥ ]
P1
3 2 1 0 1 2 3
10 30 50 65 70 90 110 130
Z1 = 𝐱−µ
𝛔
Z1= 65.000−70.000
20.000 =
−5.000
20.000 = -0.25 = 0.09871
0`0 0´01 0´02 0´3 0´4 0´5
0`0
0.1
0.2 0.09871
0.3
Respuesta:
P = 0.5 + 0.09871 = 0.59871 = 59.871%
P1=
0.09871
149
EJEMPLO 3 Entre las ciudades de Estados Unidos con una población de más de 250,000 habitantes, la media
del tiempo de viaje de ida al trabajo es de 24.3 minutos. El tiempo de viaje más largo pertenece a
la ciudad de Nueva York, donde el tiempo medio es de 38.3 minutos. Suponga que la distribución
de los tiempos de viaje en la ciudad de Nueva York tiene una distribución de probabilidad normal y
la desviación estándar es de 7.5 minutos.
A) ¿Qué porcentaje de viajes en la ciudad de nueva york consumen menos de 30 min?
B) ¿Qué porcentaje de viajes consumen entre 30 y 35 minutos?
C) ¿Qué porcentaje de viajes en la ciudad de nueva york consumen más de 45min?
DATOS
µ = 24.3 min
σ = 7.5 min
A) [ 30 ≤ ]
P1
3 2 1 0 1 2 3
1.8 9.3 16.8 24.3 31.8 39.3 46.8
30
Z= 𝒙−µ
𝝈
150
Z= 30−24.3
7.5 =
5.7
7.5 = 0.76 = 0.27637
0.0 0.1 0.2 0.6
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7 0.27637
RESPUESTA:
0.5 – P1 = 0.5 – 0.27637 = 0.22363 = 22.363 %
B) P [ 30 ≤ X ≤ 35 ]
P1
P2
3 2 1 0 1 2 3
1.8 9.3 16.8 24.3 31.8 39.3 46.8
30 35
P1 = 0.27637
151
Z1 = 30−24.3
7.5 =
5.7
7.5 = 0.76 = 0.27637
0.0 0.1 0.2 0.3 0.4 0.5 0.6
0.0
0.1
0.2
0.3
0.7 0.27637
Z2 = 35−24.3
7.5 =
10.7
7.5 = 1.42 = 0.42220
0.0 0.2
0.0
0.2
0.4
0.6
0.8
1.0
1.4 0.42220
RESPUESTA:
P2 –P1 = 0.4220 – 0.27637 = 0.14563 = 14.563 %
P1 = 0.27637
P2 = 0.4220
152
C ) P [ 40 ≥ ]
P1
3 2 1 0 1 2 3
1.8 9.3 16.8 24.3 31.8 39.3 46.8
40
Z1 = 40−24.3
7.5 =
15.7
7.5 = 2.09 = 0.48169
0.0 0.1 0.2 0.3 0.4 0.9
0.0
0.1
0.3
0.4
2.0 0.48169
0.5 + P1 = 0.5 + 0.48169 = 0.98169 = 98.169 %
P1 = 0.48169
153
EJEMPLO 4
Del colegio Isabel Saavedra se obtienen los resultados de un examen del bimestre pasado. Siguiendo una distribución normal con una calificación media de 60 puntos, con una desviación típica de 20 puntos. Si se escoge un examen al azar, para analizar la nota. ¿Cuál es la probabilidad de que:
a) Un alumno obtenga una nota de mayor de 40 puntos y menor a 90 puntos
b) Un alumno obtenga una nota mayor a 90 puntos
c) Un alumno obtenga una nota menor a 40 puntos
d) Un alumno obtenga una nota entre 36 y 50 puntos
e) Un alumno obtenga una nota entre 65 y 85 puntos
EJEMPLO 5
En una ciudad se estima que la temperatura máxima en el mes de junio sigue una
distribución normal, con media de 23° y desviación típica de 5°.
A) Calcular la probabilidad de días del mes en los que se espera alcanzar máximas
entre 21° y 27°.
B) Calcular la probabilidad de días que la temperatura llegue a más de 15 °.
DATOS
µ = 23°
σ = 5°
A) P[ 21 ≤ X ≤ 27 ]
P1 P2
Z = 𝑋−µ
𝑟
154
3 2 1 0 1 2 3
8 13 18 23 28 33 38
21 27
Z1 = 21−23
5 =
−2
5 = -0.4 = 0.01595
0.1 0.2 0.3 0.4
0.0 0.01595
Z2 = 27−23
5 =
4
5 = 0.8 = 0.03188
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
0.0 0.03188
P1 = 0.01595
P2 = 0.03188
155
RESPUESTA:
P1 + P2 = 0.01595 + 0.03188 = 0.04783 = 4.783 %
B) P [ 15 ≥ ]
P1
3 2 1 0 1 2 3
8 13 18 23 28 33 38
15
Z1 = 15−23
5 =
−8
5 = - 1.6 = 0.35543
156
0.1 0.2 0.3 0.4 0.5 0.6
0.1
0.2
1.0 0.35543
RESPUESTA:
0.5 + P1 = 0.5 + 0.35543 = 0.85543 = 85.543 %
Distribución de Probabilidad Normal Estándar Áreas bajo la distribución de probabilidad Normal Estándar entre la media y valores positivos de (Z) EJEMPLO 6 Varios test de inteligencia dieron una puntuación que sigue una ley normal con media de 100 y
desviación típica 15.
A) Determinar el porcentaje de la población que obtendría un coeficiente entre 95 y 110
B) Determinar el porcentaje de la población que obtendría un coeficiente de más de 120
DATOS
µ = 100
σ = 15
P1 = 0.35543
Z = 𝑋−µ
𝑟
157
A)P [ 95 ≤ x ≤ 110 ]
P1 P2
3 2 1 0 1 2 3
55 70 85 100 115 130 145
95 110
Z 1= 95−100
15 =
−5
15 = - 0.33 = 0.12930
0.1 0.2 0.3
0.0
0.1
0.2
0.3 0.12930
Z2 = 110−100
15 =
10
15 = 0.66 = 0.24537
P1 = 0.12930
158
0.0 0.1 0.2 0.3 0.4 0.5 0.6
0.0
0.1
0.2
0.3
0.4
0.5
0.6 0.24537
RESPUESTA:
P1 + P2 = 0.12930 + 0.24537 = 0.37467 = 37.467 %
B) P [120 ≥]
P1
3 2 1 0 1 2 3
P2 = 0.24537
159
55 70 85 100 115 130 145
120
Z1 = 120−100
15 =
20
15 = 1.3 = 0.05172
0.1 0.2 0.3
0.0
0.1 0.05172
RESPUESTA:
0.5 + P1 = 0.5 + 0.052172 = 0.552172 = 55.2172 %
P1 =
0.052172
151
UNIDAD 9
Muestreo
Teoría del muestreo.
OBJETIVOS
Reconocer los diferentes tipos de muestreos probabilísticas.
Reconocer los diferentes tipos de muestreos no probabilísticas.
Calcular el tamaño de la muestra para población finita e infinita.
Resolver problemas de aplicación a la economía.
Muestreo.
Uno de los temas más importantes de la Estadística Inferencial es sin duda alguna el Muestreo.
Es la parte de la ciencia que divide a la investigación científica de la búsqueda empírica de
resultados, la correcta selección del tamaño de la muestra es sumamente importante en el
mundo empresarial, ya que frecuentemente requerimos realizar encuestas e investigaciones de
mercado para tomar decisiones que es la base de un profesional exitoso.
Si bien hay muchísima bibliografía acerca del tema en esta guía hemos intentado sintetizar solo
los argumentos más importantes y que les resultarán más útiles a los profesionales de las
Ciencias Económicas, Administrativas y Financieras.
Existen como tal dos tipos de muestreo, el probabilístico y el No probabilístico, el muestreo
probabilístico es cuando todos los elementos de la población tienen la misma probabilidad de
ser seleccionados en la Muestra y obviamente el no probabilístico es el que muestra lo
contrario. En este Manual solo trabajaremos con el muestreo probabilístico y necesariamente
con poblaciones finitas (que se conocen todos los elementos de la población) ya que estos son
los más utilizados en las investigaciones de mercado de nuestro rubro de trabajo.
Aparte de las fórmulas de muestreo existen criterios que necesariamente deben cumplirse a la
hora de realizar una investigación.
Criterios de Muestreo.
1. Se debe tomar información en todas las áreas y horarios. (Si queremos realizar una
encuesta en la Universidad UTEPSA, es importante que tomemos la opinión de
estudiantes de todos los horarios, ya que la opinión de los estudiantes de la mañana
puede diferir mucho a los de la noche)
2. Si usted no va a realizar la encuesta debe adiestrar muy bien a los encuestadores y si
es posible realizar una auditoría de trabajo de campo2.
3. Tomar la información en diversos días no el mismo. ¿Por qué?, En muchas
ocasiones hay lugares que las personas visitan solo rara vez y otros todos los días.
Para seleccionar los datos tenemos que tomar en cuenta que existen varios métodos de
selección.
1. La Entrevista Personal.
2. Entrevistas por teléfono.
3. Cuestionarios Auto aplicados (Encuestas)
4. Observación Directa.
2 Este tema se trabajará en profundidad en la materia de investigación de mercado.
152
Nota: Intente que la mayor cantidad de sus preguntas sean cerradas. Las preguntas más
importantes no pueden tener la opción No se no respondo.
Planeación de una encuesta por muestreo.
1. Establecimiento de objetivos: Usted debe saber de ante mano lo que quiere
investigar, los objetivos deben ser muy claros y concisos.
2. Población Objetivo: Usted debe delimitar su población. No siempre nos interesa
trabajar con la población en su conjunto sino una parte de ella. Ejemplo. Si usted es
vendedor de acciones de bolsa con un valor superior a los 1.5 millones de dólares no
creo que le interese mucho encuestar a estudiantes ó personas de recursos medios.
3. El Marco Muestral: El Marco muestral es una lista donde están todos los elementos de
la población, ejemplo si usted va a estudiar el nivel de satisfacción de los obreros del
ingenio Guabirá, el marco muestral sería la nomina de todos los trabajadores.
4. Diseño de Muestreo: Seleccione que tipo de muestreo va a utilizar, aleatorio simple,
sistemático, por conglomerados ó polietápico3 (Varios muestreos a la vez)
5. Método de Medición: Entrevistas, encuestas, observaciones, entrevistas por teléfono,
etc.
6. Instrumento de Medición. Como tal este paso se refiere a elaborar el cuestionario en
sí.
7. Selección y adiestramiento de investigadores de Campo: Este es una de las partes
más importantes, tome el tiempo que sea necesario para esto y dele la importancia que
se merece, de instrucciones claras.
8. Prueba Piloto. Se realiza con dos objetivos, uno es calcular la varianza poblacional y
otro es saber más ó menos como está elaborado el cuestionario.
9. Organización y Trabajo de Campo: Como tal es el trabajo de campo en sí. Ir y tomar la
información a la calle, a la empresa ó por correo.
10. Organización del Manejo de Datos. Ya está toda la información seleccionada y
requerimos organizar el trabajo, ¿Quién va a tabular?, ¿Quién va a dictar?, etc.
11. Análisis de los datos: Es el tratamiento ó procesamiento de la información y las
propuestas de solución a problemas, hipótesis ó toma de decisiones.
5.2 Muestreo Aleatorio Simple:
Este es sin duda alguna el más utilizado de todos los muestreos, sus usos son infinitos, y es tan
sencillo de entender como tener una bolsa con 40 bolillas y seleccionar 10 a azar,
evidentemente todos los elementos de la población tienen la misma probabilidad de ser
seleccionados en la muestra.
Para seleccionar el tamaño de la muestra utilizando el muestreo aleatorio simple
debemos tener en cuenta ¿Que nos interesa de la población?
La media poblacional. Ejemplo (Cuál es el gasto promedio en CD´s de los estudiantes
Universitarios de Santa Cruz de la Sierra, Bolivia)
Una proporción poblacional. Ejemplo (Cuál es la proporción de estudiantes de Santa
Cruz que compran CD´s.
3 El muestreo polietápico está diseñado para investigaciones de mercado muy grandes con poblaciones superiores a 500.000 personas, elementos u observaciones.
153
Un total poblacional. Ejemplo (Cuál es el total de dinero que gastan estudiantes de
Santa Cruz comprando CD´s.
En esta guía no vamos a trabajar con los totales, pero si es importante que conozcas que existe
este tipo de estadígrafo llamado (tao) ó total4.
Selección del tamaño de la Muestra para seleccionar la Media Poblacional.
Recordemos que la media poblacional es (miu) ó (mu) y se denota con la letra (u)
Fórmula:
𝒏 = 𝑵𝝈𝟐
(𝑵 − 𝟏)𝑫 + 𝝈𝟐𝑫 =
𝐁𝟐
𝟒
Donde:
n: Es el tamaño de la Muestra.
N: Es la Población.
E: Límite para el error de estimación.
𝜎2 : Varianza Poblacional
Nota: Una vez seleccionado el tamaño de la Muestra se seleccionan de la población utilizando
la tabla de Números Aleatorios.
Ejemplo 1:
5000 son las cuentas en moras de la Cooperativa “LUNA”, se sabe por estudios
anteriores que la desviación estándar de las mismas es de 35 dólares, Hay que llamar a los
clientes para saber ¿Cuál ha sido el motivo del retraso en sus obligaciones? Evidentemente no
se puede llamar a los 5.000 porque incurriría un elevado costo para la cooperativa, por lo que
hay que seleccionar una muestra. Es evidente que se puede utilizar el muestreo aleatorio
simple debido a que cumple con los requisitos del mismo.
A) Determine el número de clientes que hay que llamar con un límite para el error de
estimación de 5 dólares.
B) Determine el número de clientes que hay que llamar con un límite para el error de
estimación de 10 dólares.
Respuesta inciso “a”
No nos dan la Varianza poblacional pero si la desviación Estándar, y la varianza es la
desviación estándar al cuadrado.
𝜎2 = 352= 1225
𝜎2 = 1.225 N= 5.000 B= 5
𝐷 =B2
4 =
52
4=
25
4= 6.25
𝑛 = 𝑁𝜎2
(𝑁−1)𝐷+ 𝜎2 = (5.000)(1.225)
(5.000−1)6.25+ 1.225 =
6.125.000
(4999)6.25+ 1.225= 188.64 ≈ 189
Respuesta: De las 5.000 cuantas de la cooperativa “LUNA” tenemos que seleccionar 189 si es
que queremos un límite para el error de estimación de 5 dólares.
Respuesta inciso “b”
𝜎2 = 352= 1225
4 Para más información acerca de este tema. ScheafferRichar Editorial Iberoamérica, “Elementos de Muestreo”
154
𝜎2 = 1.225 N= 5.000 B= 5
𝐷 =B2
4 =
102
4=
100
4= 25
𝑛 = 𝑁𝜎2
(𝑁−1)𝐷+ 𝜎2 = (5.000)(1.225)
(5.000−1)25+ 1.225 =
6.125.000
(4999)25+ 1.225= 48.53 ≈ 49
Respuesta: De las 5.000 cuantas de la cooperativa “LUNA” tenemos que seleccionar 49 si es
que queremos un límite para el error de estimación de 10 dólares.
Nota: Notemos que mientras más grande es el error que aceptamos más pequeña es la
muestra.
Ejemplo 2.
Usted es el gerente de Marketing de la empresa comercializadora de calzados “Zapatitos
de Cristal”, en los últimos meses se ha detectado un descenso de las ventas netas, su asesor
sugiere que se realice una investigación de mercado para detectar si ha sido debida a un ciclo
comercial ó a la llegada de nuevos competidores. Se tomó una prueba piloto donde se pudo
detectar en los encuestados un valor máximo de compras de 80 dólares y un mínimo de 20.
Con un error de estimación de 4 dólares cuantas encuestas se deben tomar para saber por qué
ha sido el descenso en las ventas teniendo en cuenta que los clientes con dirección y número
de celular están en la base de datos de la empresa y suman 3.000.
𝜎2 = Tenemos que tomar en cuenta que no nos dan la desviación estantar, ni la varianza de
la población, pero nos dan el rango, que en este caso sería 80-20= 60. Por regla estadística el
rango dividido entre 4 es la desviación estándar.
Por lo tanto 60/4= 15, y la varianza es la desviación estándar al cuadrado. 152= 225
𝜎2 = 225 N= 3.000 B= 5
𝐷 =B2
4 =
42
4=
16
4= 4
𝑛 = 𝑁𝜎2
(𝑁−1)𝐷+ 𝜎2 = (3.000)(225)
(3.000−1)25+ 225 =
675.000
(2999)4+ 225= 55.23 ≈ 56
Respuesta: Se debe tomar una encuesta a 56 de los clientes.
Selección del tamaño de la Muestra para seleccionar una proporción poblacional. (𝝅)
Recordemos que la proporción poblacional es (𝝅)
Fórmula:
𝒏 = 𝑵𝐩𝐪
(𝑵 − 𝟏)𝑫 + 𝐩𝐪𝑫 =
𝐁𝟐
𝟒
Donde:
n: Es el tamaño de la Muestra.
N: Es la Población.
B: Límite para el error de estimación.
p: proporción poblacional de éxitos en casos anteriores ó la prueba piloto.
q: proporción poblacional de fracasos en casos anteriores ó la prueba piloto.
155
Ejemplo 3
El señor Juan propietario de la Finca Ganadera “Juanito” ha detectado que están
muriendo animales. Juan es propietario de 10.000 cabezas de ganado y el costo del estudio
(análisis de sangre) por animal es de 5 Bs. Juan solo puede tener un error de estimación del 5%
y no tiene el dinero suficiente para realizarle el estudio a todos los animales. Cuál es la Muestra
probabilística que debe seleccionar Juan para realizar el estudio que verifique la proporción de
animales que están enfermos y cuál es el presupuesto que necesita para llevar adelante
análisis de sangre.
Nota: En el anterior estudio se calculó que el 20% de los animales estaban contaminados con
un virus.
N= 10.000 p= 0.2 q= 0.8 B= 0.05
𝐷 =B2
4 =
0.052
4=
0.0025
4= 0.000625
𝑛 = 𝑁pq
(𝑁−1)𝐷+ pq =
(10.000)(0.2)(0.8)
(9.999)(0.000625)+(0.2)(0.8) = 250
Respuesta: Con un límite para el error de estimación de 5% el tamaño de la muestra debe ser
de 250 animales para el estudio y el presupuesto sería de 250*5= 1.250 bolivianos.
Ejemplo 4
El gerente de Recursos Humanos de la fábrica de Juguetes “Juguetón” leyó la semana
pasada el buzón de quejas y sugerencias internas y detectó que un 30% de las quejas eran
acerca del mal trato del Supervisor “Fernández”, preocupado por esta situación decide realizar
una encuesta para determinar si realmente existe tal molestia entre los trabajadores ó es solo
problema de una camarilla, El problema es que hay 50.000 obreros y encuestarlos a todos sería
en un período muy largo de tiempo. ¿Qué tan grande debe ser el tamaño de la muestra que
necesita tomar el gerente para realizar dicha encuesta teniendo en cuenta un límite para el error
de estimación de 0.04?
N= 50.000 p= 0.3 q= 0.7 E= 0.04
𝐷 =B2
4 =
0.042
4=
0.0016
4= 0.0004
𝑛 = 𝑁pq
(𝑁−1)𝐷+ pq =
(50.000)(0.3)(0.7)
(49.999)(0.0004)+(0.3)(0.7) =
10.500
20.209 = 519.55 ≈ 520
R) El gerente requiere tomar una muestra de 520 empleados para determinar la situación del
señor Fernández..
Ejemplo 5
Se quiere estudiar la preferencia de un nuevo partido político en una población, sobre la
cual no se ha hecho ningún estudio anterior, se acepta un margen de error máximo a aceptar es
el 2%. Determina el tamaño de la muestra con un nivel de confianza del 90%.
𝒏 =𝒁𝟐 ∗ 𝒑 ∗ 𝒒
𝑬𝟐
156
𝑃 = 0.5
𝑞 = 0.5
Z= 1.645 E= 2% =0.02
𝑛 =1.6452 ∗ 0.5 ∗ 0.5
0.022
𝑛 = 1691.2656
4.3 Muestreo Sistemático:
El muestreo sistemático es muy parecido aleatorio simple, de hecho mantiene hasta las mismas
fórmulas, la única diferencia es que en este se divide la población entre la muestra y hallamos
un valor que vamos a llamar “K”, tomamos un primer valor y sistemáticamente sumamos “K” y
seleccionamos la observación.
Ventajas del Muestreo Sistemático:
1.- Es el más fácil de llevar a cabo en el campo.
2.- Está menos expuestos a errores de selección que cometen los investigadores de campo.
3.- El muestreo Sistemático puede proporcionar mayor información que la que puede
proporcionar el muestreo aleatorio por unidad de costo.
Selección del tamaño de la muestra para hallar el promedio poblacional.
Fórmula.
𝒏 = 𝑵𝝈𝟐
(𝑵 − 𝟏)𝑫 + 𝝈𝟐𝑫 =
𝐁𝟐
𝟒
Como podemos ver es la misma muestra que el muestreo aleatorio simple.
Ejemplo:
La siguiente tabla muestra los valores de las edades de los integrantes del Club Social.
(Guajurú). Con un error de estimación de 4 años. ¿Cuál debe ser la muestra que se debe
seleccionar? y realice mediante el muestreo sistemático, seleccione los valores y halle el
promedio de la muestra e infiera a la población.
56 36 80 54 21 45 48 49 52 59
64 48 75 20 25 29 32 36 37 33
33 39 45 42 48 65 32 6 90 75
21 20 54 58 68 69 70 65 60 70
50 52 45 25 35 65 95 85 75 75
45 75 45 25 52 45 53 56 59 58
57 65 68 67 64 21 70 80 90 54
24 25 65 35 36 38 69 71 80 28
Evidentemente que una población de este tamaño (80) se puede estudiar en su totalidad pero
con fines pedagógicos hemos tomado la decisión de seleccionar una muestra y luego
sistematizar.
Edad Máxima: 90 años, Edad Mínima: 20 años, Rango = 70 años.
No nos olvidemos que el Rango dividido entre 4 es la desviación estándar. 70/4= 17.5. La
varianza es la desviación estándar al cuadrado. 17.52= 306.25
157
𝜎2 = 306.25 N= 80 B= 4
𝐷 =B2
4 =
112
4=
121
4= 30.25
𝑛 = 𝑁𝜎2
(𝑁−1)𝐷+ 𝜎2 = (80)(306.25)
(80−1)30.25+ 306.25 =
24.500
(79)30.25+ 306.25= 9.08 ≈ 10
K= 80/10= 8
Evidentemente tenemos que seleccionar 10 de los 80 socios. El primer valor lo tomamos
aleatoriamente entre los primeros 10 valores, en nuestro caso fue el tercero, entonces
seleccionamos el tercer valor y sistematizamos sumando “K” que en este caso es 8.
56 36 80 54 21 45 48 49 52 59
64 48 75 20 25 29 32 36 37 33
33 39 45 42 48 65 32 6 90 75
21 20 54 58 68 69 70 65 60 70
50 52 45 25 35 65 95 85 75 75
45 75 45 25 52 45 53 56 59 58
57 65 68 67 64 21 70 80 90 54
24 25 65 35 36 38 69 71 80 28
Ahora realizamos el estudio entre los 10 valores seleccionados en la muestra.
𝑥 =∑xi
𝑛=
80 + 64 + 37 + 32 + 68 + 45 + 45 + 59 + 70 + 36
10=
536
10= 53.6 ≈ 54
El promedio de las edades de la muestra es 54 años. Ahora realizamos el intervalo de
confianza para inferir a la población. Como es una muestra pequeña (10) tenemos que utilizar la
“t” de student.
S= 17.5, √𝑛 = √10 = 3.16. Grados de libertad sería n-1, 10-1= 9, y el nivel de significación
al no dárnoslo es el 95%. Siguiendo los pasos que están en la tabla es 2.262 el valor de “t”
𝑢 = 𝑥 ± 2.262 (17.5)
√10= 2.262
(17.5)
3.16= 12.52
[54 − 12.52 ≥ 𝑢 ≥ 54 + 12.52]
[41.47 ≥ 𝑢 ≥ 66.52]
158
Respuesta: Estamos seguros que en un 95% de las posibles muestras que se pudieran haber
seleccionado la media estará entre 41.47 y 66.52 años.
Selección del tamaño de la Muestra para seleccionar una proporción poblacional. (𝝅)
Fórmula:
𝒏 = 𝑵𝐩𝐪
(𝑵 − 𝟏)𝑫 + 𝐩𝐪𝑫 =
𝐁𝟐
𝟒
Ejemplo:
Los siguientes datos muestran la opinión que tuvieron las 130 personas que asistieron al
cine “Peliculón” el día de su reapertura. Encuestas anteriores muestran que el 65% de los
visitantes ven las mejoras como positivas. Debido a que tabular 130 encuestas es mucho según
el gerente, se decide tomar una muestra con un error de 0.15 y un 95% de confiabilidad, aparte
realice un estudio estadístico completo.
Positiv
o
Igual Positiv
o
Igual Positiv
o
Positiv
o
Positiv
o
Positiv
o
Positiv
o
Positiv
o
Igual Negativ
o
Positiv
o
Igual Positiv
o
Igual Negativ
o
Positiv
o
Igual Positiv
o
Negativ
o
Igual Igual Positiv
o
Positiv
o
Positiv
o
Positiv
o
Igual Igual Positiv
o
Igual Positiv
o
Negativ
o
Positiv
o
Igual Igual Igual Negativ
o
Positiv
o
Positiv
o
Positiv
o
Igual Igual Igual Negativ
o
Positiv
o
Positiv
o
Igual Positiv
o
Positiv
o
Positiv
o
Negativ
o
Igual Positiv
o
Igual Igual Positiv
o
Igual Igual Positiv
o
Igual Igual Positiv
o
Negativ
o
Positiv
o
Negativ
o
Igual Positiv
o
Positiv
o
Igual
Negativ
o
Positiv
o
Positiv
o
Igual Igual Igual Positiv
o
Igual Igual Positiv
o
Igual Positiv
o
Igual Positiv
o
Positiv
o
Positiv
o
Igual Igual Negativ
o
Igual
Positiv
o
Positiv
o
Positiv
o
Positiv
o
Igual Positiv
o
Igual Positiv
o
Igual Negativ
o
Igual Positiv
o
Negativ
o
Positiv
o
Igual Igual Igual Negativ
o
Positiv
o
Positiv
o
Positiv
o
Igual Igual Igual Negativ
o
Positiv
o
Positiv
o
Igual Positiv
o
Positiv
o
Positiv
o
Negativ
o
Igual Positiv
o
Igual Igual Positiv
o
Igual Igual Positiv
o
Solución.
N= 130 p= 0.65 q= 0.35 E= 0.15
𝐷 =B2
4 =
0.152
4=
0.0225
4= 0.005625
159
𝑛 = 𝑁pq
(𝑁−1)𝐷+ pq =
(130)(0.65)(0.35)
(129)(0.005625)+(0.65)(0.35) =
29.57
0.9531 = 31.02 ≈ 32
𝐾 =130
32= 4.06 ≈ 4
Si bien en estadística siempre redondeamos al mayor valor, en el caso del cálculo de la “K” se
utiliza el enfoque matemático.
Ahora tomamos un número aleatorio entre los primeros 4 número en nuestro caso fue el 2. O
sea, la segundo observación que nos va a servir como punto de partida y primer valor.
Positiv
o
Igual Positiv
o
Igual Positiv
o
Positiv
o
Positiv
o
Positiv
o
Positiv
o
Positiv
o
Igual Negativ
o
Positiv
o
Igual Positiv
o
Igual Negativ
o
Positiv
o
Igual Positiv
o
Negativ
o
Igual Igual Positiv
o
Positiv
o
Positiv
o
Positiv
o
Igual Igual Positiv
o
Igual Positiv
o
Negativ
o
Positiv
o
Igual Igual Igual Negativ
o
Positiv
o
Positiv
o
Positiv
o
Igual Igual Igual Negativ
o
Positiv
o
Positiv
o
Igual Positiv
o
Positiv
o
Positiv
o
Negativ
o
Igual Positiv
o
Igual Igual Positiv
o
Igual Igual Positiv
o
Igual Igual Positiv
o
Negativ
o
Positiv
o
Negativ
o
Igual Positiv
o
Positiv
o
Igual
Negativ
o
Positiv
o
Positiv
o
Igual Igual Igual Positiv
o
Igual Igual Positiv
o
Igual Positiv
o
Igual Positiv
o
Positiv
o
Positiv
o
Igual Igual Negativ
o
Igual
Positiv
o
Positiv
o
Positiv
o
Positiv
o
Igual Positiv
o
Igual Positiv
o
Igual Negativ
o
Igual Positiv
o
Negativ
o
Positiv
o
Igual Igual Igual Negativ
o
Positiv
o
Positiv
o
Positiv
o
Igual Igual Igual Negativ
o
Positiv
o
Positiv
o
Igual Positiv
o
Positiv
o
Positiv
o
Negativ
o
Igual Positiv
o
Igual Igual Positiv
o
Igual Igual Positiv
o
Hacemos el estudio de las variables cualitativas de los treinta datos y tenemos que la
proporción de clientes que estuvo satisfecha (positivo) fue el 0.4687, o sea 15 de 32
encuestados.
Ahora vamos a hallar el intervalo de confianza.
Como estamos trabajando con muestras grande trabajamos con “Z” no con “t”
160
t= -1,812 t= 1,812
n 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704
60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 2.980 2.358 2.617
Y 0.674 0.842 1.036 1.282 1.645 2.960 2.326 2.576
TABLA T STUDENT
161
0'00 0'01 0'02 0'03 0'04 0'05 0'06 0'07 0'08 0'09
0'0
0'1
0'2
0'3
0'4
0’00000 0’00399 0’00798 0’01197 0’01595 0’01994 0’02392 0’02790 0’03188 0’03586
0’03983 0’04380 0’04766 0’05172 0’05567 0’05962 0’06356 0’06749 0’07142 0’07535
0’07926 0’08317 0’08706 0’09095 0’09483 0’09871 0’10257 0’10642 0’11026 0’11409
0’11791 0’12172 0’12552 0’12930 0’13307 0’13683 0’14058 0’14431 0’14803 0’15173
0’15554 0’15910 0’16276 0’16640 0’17003 0’17364 0’17724 0’18082 0’18439 0’18793
0'5
0'6
0'7
0'8 0'9
0’19146 0’19497 0’19847 0’20194 0’20450 0’20884 0’21226 0’21566 0’21904 0’22240
0’22575 0’22907 0’23237 0’23565 0’23891 0’24215 0’24537 0’24857 0’25175 0’25490
0’25804 0’26115 0’26424 0’26730 0’27035 0’27337 0’27637 0’27935 0’28230 0’28524
0’28814 0’29103 0’29389 0’29673 0’29955 0’30234 0’30511 0’30785 0’31075 0’31327
0’31594 0’31859 0’32121 0’32381 0’32639 0’32894 0’33147 0’33398 0’33646 0’33891
1'0
1'1
1'2
1'3
1'4
0’34134 0’34375 0’34614 0’34850 0’35083 0’35313 0’35543 0’35769 0’35993 0’36214
0’36433 0’36650 0’36864 0’37076 0’37286 0’37493 0’37698 0’37900 0’38100 0’38298
0’38493 0’38686 0’38877 0’39065 0’39251 0’39435 0’39617 0’39796 0’39973 0’40147
0’40320 0’40490 0’40658 0’40824 0’40988 0’41149 0’41308 0’41466 0’41621 0’41774
0’41924 0’42073 0’42220 0’42364 0’42507 0’42647 0’42786 0’42922 0’43056 0’43189
1'5
1'6
1'7
1'8
1'9
0’43319 0’43448 0’43574 0’43699 0’43822 0’43943 0’44062 0’44179 0’44295 0’44408
0’44520 0’44630 0’44738 0’44845 0’44950 0’45053 0’45154 0’45254 0’45352 0’45449
0’45543 0’45637 0’45728 0’45818 0’45907 0’45994 0’46080 0’46164 0’46246 0’46327
0’46407 0’46485 0’46562 0’46638 0’46712 0’46784 0’46856 0’46926 0’46995 0’47062
0’47128 0’47193 0’47257 0’47320 0’47381 0’47441 0’47500 0’47558 0’47615 0’47670
2'0
2'1
2'2
2'3
2'4
0’47725 0’47778 0’47831 0’47882 0’47932 0’47982 0’48030 0’48077 0’48124 0’48169
0’48214 0’48257 0’48300 0’48341 0’48382 0’48422 0’48461 0’48500 0’48537 0’48574
0’48610 0’48645 0’48679 0’48713 0’48745 0’48778 0’48809 0’48840 0’48870 0’48899
0’48928 0’48956 0’48983 0’49010 0’49036 0’49061 0’49086 0’49111 0’49134 0’49158
0’49180 0’49202 0’49224 0’49245 0’49266 0’49286 0’49305 0’49324 0’49343 0’49361
2'5
2'6
2'7
2'8 2'9
0’49379 0’49396 0’49413 0’49430 0’49446 0’49461 0’49477 0’49492 0’49506 0’49520
0’49534 0’49547 0’49560 0’49573 0’49585 0’49598 0’49609 0’49621 0’49632 0’49643
0’49653 0’49664 0’49674 0’49683 0’49693 0’49702 0’49711 0’49720 0’49728 0’49736
0’49744 0’49752 0’49760 0’49767 0’49774 0’49781 0’49788 0’49795 0’49801 0’49807
0’49813 0’49819 0’49825 0’49831 0’49836 0’49841 0’49846 0’49851 0’49856 0’49861
3'0
3'1
3'2
3'3 3'4
0’49865 0’49869 0’49873 0’49877 0’49881 0’49885 0’49889 0’49893 0’49896 0’49899
0’49903 0’49906 0’49909 0’49912 0’49915 0’49918 0’49921 0’49923 0’49926 0’49929
0’49931 0’49933 0’49936 0’49938 0’49940 0’49942 0’49944 0’49946 0’49948 0’49950
0’49951 0’49953 0’49955 0’49956 0’49958 0’49959 0’49961 0’49962 0’49964 0’49965
0’49966 0’49967 0’49968 0’49970 0’49971 0’49972 0’49973 0’49974 0’49975 0’49976
3'5
3'6
3'7
3'8
3'9
0’49977 0’49977 0’49978 0’49979 0’49980 0’49981 0’49981 0’49982 0’49983 0’49983
0’49984 0’49985 0’49985 0’49986 0’49986 0’49987 0’49987 0’49988 0’49988 0’49989
0’49989 0’49990 0’49990 0’49990 0’49991 0’49991 0’49991 0’49992 0’49992 0’49992
0’49993 0’49993 0’49993 0’49994 0’49994 0’49994 0’49994 0’49995 0’49995 0’49995
0’49995 0’49995 0’49996 0’49996 0’49996 0’49996 0’49996 0’49996 0’49997 0’49997
4'0
4'1
4'2
4'3
4'4
0’49997 0’49997 0’49997 0’49997 0’49997 0’49997 0’49998 0’49998 0’49998 0’49998
0’49998 0’49998 0’49998 0’49998 0’49998 0’49998 0’49998 0’49998 0’49999 0’49999
0’49999 0’49999 0’49999 0’49999 0’49999 0’49999 0’49999 0’49999 0’49999 0’49999
0’49999 0’49999 0’49999 0’49999 0’49999 0’49999 0’49999 0’49999 0’49999 0’49999
0’49999 0’49999 0’49999 0’50000 0’50000 0’50000 0’50000 0’50000 0’50000 0’50000
-5 -4 -3 -2 -1 1 2 3 4 La tabla proporciona el área que queda comprendida entre0 yz.
z
162