estadistica

54
CAPITULO 1 DESCRIPCION DE UN CONJUNTO DE DATOS 1.1 DIAGRAMA DE TALLO Y HOJA Las técnicas del análisis exploratorio de datos consisten en operaciones sencillas y representaciones fáciles de trazar, que pueden emplearse para resumir con rapidez los datos. Muchas de ellas se usaban para tener una perspectiva sencilla de conjuntos de datos usando sólo lápiz y papel; hoy, la aplicación tan difundida del cómputo al análisis de datos propicia que se realice con mayor facilidad y eficiencia. El diagrama de tallo y hoja se utiliza para mostrar tanto el orden de rangos como la forma de un conjunto de datos. EJEMPLO 1.1 Considérense los datos de la tabla 1.1 los cuales representan el resultado de un examen de aptitudes de 150 preguntas, aplicado a 50 personas en cierta escuela. Los datos indican el número de respuestas correctas. 112 72 69 97 107 73 92 76 86 73 126 128 118 127 124 82 104 132 134 83 92 108 1

Upload: erikarriaga

Post on 30-Jun-2015

36.307 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: estadistica

CAPITULO 1

DESCRIPCION DE UN CONJUNTO DE DATOS

1.1 DIAGRAMA DE TALLO Y HOJA

Las técnicas del análisis exploratorio de datos consisten en operaciones sencillas y representaciones fáciles de trazar, que pueden emplearse para resumir con rapidez los datos. Muchas de ellas se usaban para tener una perspectiva sencilla de conjuntos de datos usando sólo lápiz y papel; hoy, la aplicación tan difundida del cómputo al análisis de datos propicia que se realice con mayor facilidad y eficiencia.

El diagrama de tallo y hoja se utiliza para mostrar tanto el orden de rangos como la forma de un conjunto de datos.

EJEMPLO 1.1

Considérense los datos de la tabla 1.1 los cuales representan el resultado de un examen de aptitudes de 150 preguntas, aplicado a 50 personas en cierta escuela. Los datos indican el número de respuestas correctas.

112 72 69 97 107 73 92 76 86 73 126 128 118 127 124 82 104 132 134 83 92 108 96 100 92 115 76 91 102 81 95 141 81 80 106 84 119 113 98 75 68 98 115 106 95 100 85 94 106 119

Tabla 1.1. Resultado de un examen de aptitud de 150 preguntas.

Para construir el diagrama de tallo y hoja primero los ordenamos, de acuerdo con los dígitos iniciales de cada uno, en el lado izquierdo de una línea vertical. Este diagrama es una buena manera de obtener una presentación visual informativa del conjunto de datos donde cada número está formado al menos por dos dígitos.

1

Page 2: estadistica

Para construir un diagrama de este tipo, los números se dividen en dos partes: un tallo, formada por uno o más de los dígitos principales, y una hoja, la cual contiene el resto de los dígitos. Por ejemplo el valor de 112 puede dividirse en un tallo 11 y una hoja 2. En general, debe escogerse un número relativamente pequeño de tallos en comparación con el número de observaciones. Lo usual es seleccionar entre 5 y 20 tallos. Una vez elegido el conjunto de tallos, éstos se enlistan en la parte izquierda del diagrama. Al lado de cada tallo, se ponen todas las hojas que corresponden a los valores observados, ordenados tal como se encuentran en el conjunto de datos.Una vez que se ordenan los datos se representan de la siguiente forma

NOTA Los elementos de la hoja no se separan con coma, solo se separa uno de

otro con espacio. En el caso que los datos tengan punto decimal, en la hoja se anotará, punto

y el número, es decir si se tuviera el dato 8.5, en el tallo estará el “8” (sin punto) y en la hoja “.5”.

EJEMPLO 1.2

Construir un diagrama de tallo y hoja para los datos de la tabla 1.2, que representan la calificación final de un grupo de primaria de cierta escuela.

8.6 7.2 6.9 9.7 7.3 9.2 7.6 8.6 7.3 8.3 8.2 6.5 8.2 6.6 9.4 8.3 9.2 7.3 8.4 9.2

Tabla 1.2. Calificación final de un grupo de primaria de cierta escuela

Solución

2

Page 3: estadistica

En la hoja se anota el punto y el número que esté a la derecha del punto decimal que quedaría representado como la siguiente forma.

1.2 DISTRIBUCION DE FRECUENCIAS E HISTOGRAMAS

La distribución de frecuencia ofrece un resumen más compacto de los datos que el diagrama de tallo y hoja. Así una distribución de frecuencias es un resumen tabular de un conjunto de datos que muestra la frecuencia (o la cantidad) de artículos en cada una de las clases que no se traslapan. El objetivo de elaborar una distribución de frecuencia es proporcionar una perspectiva de los datos, perspectiva que no se puede obtener rápidamente con sólo examinarlos.

Al resumir grandes colecciones de datos, es útil distribuirlos en clases o categorías y determina el número de individuos que pertenecen a cada clase, llamado frecuencia de clase. Una disposición tabular de los datos por clases junto con las correspondientes frecuencias de clase, se llama distribución de frecuencias (o tabla de frecuencia)

Un instrumento muy útil para resumir grandes conjuntos de datos es la distribución de frecuencia. Esta consiste en una representación de las categorías numéricas de la variable junto con el número de entidades que se clasifican en cada categoría.

EJEMPLO 1.3

3

Page 4: estadistica

La tabla 1.3 es una distribución de frecuencia de estatura (en pulgadas) de 100 estudiantes varones en cierta universidad.

Tabla 1.3. Distribuciones de frecuencias de estatura (en pulgadas) de 100 estudiantes

INTERVALO DE CLASE Es el símbolo que define una clase como 60-62

LIMITES DE CLASE límite inferior en el caso del intervalo de clase anterior es el valor 60 límite superior en el caso del intervalo de clase anterior es el valor 62

FRONTERA DE CLASEEl intervalo de clase 60-62 incluye todas las medidas desde 59.5 a 62.5 (ya que una estatura registrada como 60 pulgadas realmente está entre 59.5 y 60.5) por lo que la frontera inferior es 59.5 y la frontera superior es 62.5.

TAMAÑO O ANCHURA DE UN INTERVALO DE CLASEEs la diferencia entre las fronteras de clase superior e inferior; entonces sería 62.5-59.5=3Por lo tanto la anchura del intervalo es 3

MARCA DE CLASEEs el punto medio del intervalo de clase y se obtiene promediando los límites

inferiores y superiores de clase, es decir , así el punto medio de clase es

61.

RANGODel conjunto de datos que se tengan es la diferencia entre el valor mayor y el menor

REGLAS GENERALES PARA FORMAR DISTRIBUCIONES

Altura Frecuencia ( o número de estudiantes)

60-6263-6566-6869-7172-74

5 18 42 27 8

Total 100

4

Page 5: estadistica

1) determinar el mayor y el menor de todos los datos, encontrando así el rango2) dividir el rango en un número adecuado de intervalos de clase del mismo

tamaño3) determinar el número de observaciones que caen dentro del cada intervalo

de clase, esto es, hallar las frecuencias de clases.

EJEMPLO 1.4

La tabla 1.4 son datos de una muestra de 25 acciones comunes de banco. El rédito por dividendo para una acción es el porcentaje del precio de la misma representado por su dividendo.

3.1 4.2 2.3 3.3 2.85.3 3.5 3.1 2.6 3.34.7 3.7 3.0 2.6 4.03.8 4.4 3.2 3.2 3.85.1 3.7 2.3 4.3 3.9

Tabla 1.4. Acciones comunes de banco, 25 réditos.

Para construir la distribución de frecuencia primero se localiza en valor menor de la muestra es 2.3 y el mayor 5.3 y se encuentra el rango, para construir los intervalos de confianza. Si por ejemplo se desea hacer la distribución de frecuencia con 7 intervalos de clase sería hacer lo siguiente:

Rango=5.3-2.3=3,

Por lo tanto: (0.4 es la amplitud de clase)

La tabla 1.5 muestra la distribución de frecuencia de acciones comunes de banco con 7 intervalos de confianza

5

Page 6: estadistica

Intervalo de clase Frecuencia 2.3 ---- 2.7 2.8 ---- 3.2 3.3 ---- 3.7 3.8 ---- 4.2 4.3 ---- 4.7 4.8 ---- 5.2 5.3 ---- 5.7

4 6 5 5 3 1 1

Total 25

Tabla 1.5. Distribuciones de frecuencia de acciones comunes de banco

Con 5 intervalos de confianza quedaría como sigue:

Rango=5.3-2.3=3,

Por lo tanto: (0.6 es la amplitud de clase)

La tabla 1.6 muestra la distribución de frecuencia de acciones comunes de banco con 5 intervalos de confianza

Tabla 1.6. Distribuciones de frecuencia de acciones comunes de banco

HISTOGRAMA

Intervalo de clase Frecuencia 2.3 ---- 2.9 3.0 ---- 3.6 3.7 ---- 4.3 4.4 ---- 5.0 5.1 ---- 5.7

5 8 8 2 2

Total 25

6

Page 7: estadistica

El histograma, es un tipo especial de gráfico de barras, se emplea para representar una distribución de frecuencia o de frecuencia relativa

Para construir el gráfico se representa en un plano cartesiano donde el eje y representa la frecuencia y el eje x los intervalos de clase, se levanta una barra con centro en la marca de clase y altura dependiendo de la frecuencia. Así la figura 1.1 muestra un histograma usando los datos de la tabla 1.3 (la estatura de los 100 alumnos).

Figura 1.1 Gráfica de barras (histograma) estatura de 100 estudiantes.

Al observar el histograma se puede apreciar fácilmente como se distribuye la estatura de los estudiantes sobre el intervalo.

1.3 DISTRIBUCION DE FRECUENCIAS RELATIVAS

7

Page 8: estadistica

La frecuencia relativa de una clase es la proporción de la cantidad total de datos que pertenecen a esa clase se determina mediante la fórmula:

(1.1)

La frecuencia porcentual de una clase es la frecuencia relativa multiplicada por 100. Una distribución de frecuencias relativas es un resumen tabular de un conjunto de datos que muestran la frecuencia relativa de cada clase. Una distribución de frecuencias porcentuales es un resumen tabular de un conjunto de datos donde se ve la frecuencia porcentual de cada clase. Si aplicamos la ecuación (1.1) podemos formar una distribución de frecuencias relativas.

EJEMPLO 1.5

La tabla 1.7 muestra las distribuciones de frecuencia relativa y porcentual tomando la tabla 1.3 la cual presenta la distribución de frecuencias de la estatura de 100 estudiantes de cierta escuela.

Tabla 1.7. Distribuciones de frecuencia relativa y porcentual de la estatura de estudiantes

A veces conviene más graficar en el histograma las frecuencias relativas en lugar de las frecuencias de clase. La figura 1.2 muestra el histograma con las frecuencias relativas. Los estadísticos no hacen diferencia entre el histograma de frecuencias relativas y el de frecuencias y ambos se refieren como histograma de frecuencias o simplemente como histograma.

Altura Frecuencia relativa Frecuencia porcentual60-6263-6566-6869-7172-74

0.05 0.18 0.42 0.27 0.08

5 18 42 27 8

Total 1.00 100

8

Page 9: estadistica

Figura 1.2 Histograma de frecuencias relativas

1.4 DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS Y RELATIVAS ACUMULADAS Es posible también construir una distribución de frecuencia acumulada y relativa acumulada. Una variación de la distribución de frecuencias, que proporciona otro resumen tabular de datos cuantitativos, es la distribución de frecuencias acumuladas.

EJEMPLO 1.6 Tomando la tabla 1.3 se puede mostrar las diferentes distribuciones como lo muestra la tabla 1.8 (la distribución relativa ya se encontró en la tabla 1.7) y para encontrar la frecuencia acumulada se va sumando la frecuencia anterior, por ejemplo para el primer intervalo (60-62) la frecuencia y la frecuencia acumulada es la misma; para el segundo intervalo (63-65) la frecuencia acumulada es 23 ya que 18+5=23; para el tercer intervalo la frecuencia es de 42, así que la frecuencia acumulada ya sea que se tome la frecuencia de éste más la frecuencia acumulada anterior, es decir 42+23=65, o sumar 5+18+42=65, y así sucesivamente.

Así para llenar la columna de la frecuencia acumulada se toma en cuenta la frecuencia y siguiendo el procedimiento anterior.

Para llenar la columna de la frecuencia relativa acumulada se toma en cuenta la frecuencia relativa siguiendo el procedimiento anterior pero con tomando en cuenta a la frecuencia relativa.

9

Page 10: estadistica

Tabla 1.8. Distintas distribuciones de la tabla 1.3

1.5 POLIGONO DE FRECUENCIA

Los datos de una distribución de frecuencia se pueden describir por medio de otra representación gráfica que recibe el nombre de polígono de frecuencia. Se puede construir un polígono de frecuencia dibujando primero el histograma y luego conectando por medio de líneas rectas el punto medio de la parte superior de cada barra del histograma. La figura 1.3 muestra un polígono de frecuencia para el ejemplo 1.3.

Figura 1.3. Polígono de frecuencia de la figura 1.1

1.6 OJIVA

Altura Frecuencia Frecuencia acumulada

Frecuencia relativa

Frecuencia relativa acumulada

60-6263-6566-6869-7172-74

5 18 42 27 8

5 23 65 92 100

0.05 0.18 0.42 0.27 0.08

0.05 0.23 0.65 0.92 1

Total 100 1

10

Page 11: estadistica

Una gráfica de una distribución acumulada se llama ojiva. Los valores de los datos están en el eje horizontal y las frecuencias acumuladas, se muestra en el eje vertical; es decir tomando como ejemplo la tabla 1.8, los limites inferiores de cada clase marcan el eje horizontal y el eje vertical es la frecuencia acumulada como lo muestra la figura 1.4.

Figura 1.4. Ojiva de los datos de la tabla 1.8

1.7 DIAGRAMA DE BARRAS Y DE PARETO

Cuando se tienen datos que fueron colectados en distintos períodos de tiempo o distintas áreas geográficas es conveniente usar tablas o diagramas de diversos tipos para su presentación. En una tabla estadística se presenta una distribución de frecuencias clasificada o subdividida; en ella se comparan las frecuencias o las frecuencias relativas de muestras tomadas de dos o más poblaciones distintas. Las poblaciones pueden representar distintos períodos de tiempo, distintas áreas geográficas, distintas empresas de un ramo, distintos departamentos de una firma, etc. Dentro de cada muestra, las clasificaciones deben ser las mismas para permitir un análisis cruzado de los datos en forma adecuada.

Se cuenta también con auxiliares como los diagramas de barras o los diagramas circulares que sirven como un resumen visual de los datos.

La tabla 1.9 muestra, como ejemplo de una tabla estadística, el desglose por nivel académico y sexo de los empleados en un despacho de asesores para los años de 1974 a 1977. Las clasificaciones para cada uno de los cuatro años son las mismas,

11

Page 12: estadistica

lo cual permite hacer comparaciones entre los distintos años. Las entradas de la tabla dan el número total de empleados, desglosado en profesionales y no profesionales para cada año, así la suma de profesionales y no profesionales da el número total de empleados para un año dado. La tabla también desglosa a profesionales y no profesionales en número de hombres y mujeres.

Tab la

1.9 Análisis de los empleados en un despacho de asesorías

Algunas veces se usan porcentajes como entradas de las tablas estadísticas. Cuando sea éste el caso, las tablas deben ser examinadas cuidadosamente puesto que las comparaciones entre entradas correspondientes a distintas muestras pueden verse distorsionadas si el número de observaciones varía de muestra a muestra. Por ejemplo, dos entradas en un mismo renglón de la tabla pueden tener 50% ambas, pero la primera entrada puede representar 100 de 200 y la segunda puede representar 1 de 2. el 50% de la primera entrada basado en un total de 200 observaciones es, en este caso, más representativo que el segundo, basado en un total de 2. Por lo tanto, ambos porcentajes deben compararse con cuidado.

La figura 1.5 muestra como se puede usar un diagrama de barras para exhibir gráficamente algunos de los datos de los empleados en la tabla 1.9. Por lo general los diagramas de barras no se subdividen tan finamente como las tablas puesto que particiones adicionales hacen confusa la apariencia de la gráfica, lo que desvirtúa el objetivo de producir una gráfica que sea de lectura sencilla y permita un análisis rápido de los datos.

1974 1975 1976 1977Total de empleados 100 115 110 150Profesionales 40 44 42 58 Hombres 37 40 39 48 Mujeres 3 4 3 10No profesionales 60 71 68 92 Hombres 50 58 56 69 Mujeres. 10 13 12 23

12

Page 13: estadistica

Figura 1.5 Diagrama de barras

Es posible construir distintos diagramas de barras que exhiban la misma información.

Un diagrama de barras se construye simplemente contando los datos de las observaciones que se tengan.

EJEMPLO 1.7

La tabla 1.10 muestra la distribución de frecuencia de compra de refrescos en un día de cierta escuela primaria. Construye un diagrama de barras.

Marca Frecuencia Coca cola clásica 38 Coca cola de dieta 16 Fanta 10 Pepsi Cola 26 Sprite 10

Total 100 Tabla 1.10. Distribución de frecuencia y frecuencia relativa de compras de refrescos

13

Page 14: estadistica

Solución

Solo se levantan barras hasta donde indique la frecuencia, como lo muestra la figura 1.6.

Figura 1.6. Gráfica de barras sobre compras de refrescos

En la gráfica de la figura 1.6 se puede observar que la coca cola clásica, la pepsi cola y la coca de dieta son las marcas preferidas.

Un diagrama de Pareto es una variación importante de un histograma para datos categóricos. En otras palabras un diagrama de Pareto es una gráfica de barras que muestra grupos de causas organizadas según su frecuencia. Este diagrama tiene un empleo muy amplio en los esfuerzos por incrementar la calidad, y las categorías usualmente representan tipos distintos de defectos, modos de falla o problemas con el producto o el proceso. Las categorías están ordenadas de modo que en la parte izquierda aparezca la categoría con la mayor frecuencia, seguida por la categoría que tiene la segunda mayor frecuencia y así sucesivamente. Una grafica de barras es una forma gráfica de representar datos cualitativos que se han resumido en una distribución de frecuencias, de frecuencias relativas o de porcentuales. En el eje horizontal de la gráfica se especifican los indicadores o nombres que se usan para cada una de las clases. En el eje vertical puede representarse una escala de frecuencias, una de frecuencias relativas o una de porcentuales. Entonces, con una barra de una ancho fijo trazada sobre cada indicador de clase llegamos a la altura que corresponda a la frecuencia, a la frecuencia relativa o a la porcentual de la clase, indicada en el eje vertical. Las barras se separan a fin de señalar que cada clase es una categoría independiente.

Así un diagrama de Pareto es una gráfica de barras que muestra grupos de causas de errores organizadas según su frecuencia de ocurrencia. Se construye simplemente contando los datos de las observaciones de cosas que van mal. Por lo general, los resultados se ordenan en una secuencia que va del más común al menos común, con una categoría. Estos diagramas deben su nombre a Vilfredo Pareto (1848-1923), un economista italiano que estudió la distribución de la riqueza en la sociedad.

14

Page 15: estadistica

La ilustración de una gráfica son de gran utilidad para negocios complejos ya que empiezan con la comprensión de que todos los errores, defectos y problemas tienen causas, y que existe solamente un número finito de éstas. El primer paso consiste en identificar y discriminar entre las cosas van bien y las cosas van mal. En el ejemplo 1.8 se ilustra un ejemplo de ésta naturaleza.

EJEMPLO 1.8

En cierto aeropuerto se desea conocer las causas de los retrasos de los aviones. Si algunos de los aviones despegan a tiempo (las cosas van bien). Cuando existe un retraso en el despegue (las cosas van mal), y se puede elaborar una lista de causas que ocasionan los retrasos, algunos se deben a problemas con los propios aviones, otros son resultado del manejo de equipaje, y así por el estilo. Conforme se recolectan las diferentes razones de retraso en grupos lógicos, se hace evidente que existen relaciones de causa y efecto entre ellas. La tabla 1.11 muestra algunas razones de salidas retrasadas en el aeropuerto. Construye un diagrama de Pareto.

Motivos FrecuenciaEquipaje 27Equipo 18Pasajeros 9Servicio 4Tripulación 2Otros 8

Tabla 1.11 Razones de salidas retrasadas en el aeropuertoSolución La figura 1.7 muestra la gráfica de Pareto para las razones de salidas retrasadas en

el aeropuerto. En ésta puede observarse que cerca de de los retrasos (45 de 68

observaciones) fueron ocasionados por el manejo de equipaje y por problemas con el equipo. El administrador del aeropuerto deberá centrar sus esfuerzos de mejoramiento en estas dos áreas.

27

18

9

42

8

0

5

10

15

20

25

30

Equipaje Equipo Pasajeros Servicio Tripulación Otros

Figura 1.7 Diagrama de Pareto para las razones de salidas retrasadas en el aeropuerto

15

Page 16: estadistica

1.8 DIAGRAMA CIRCULAR

Los diagramas de barras sirven principalmente para representar el total de una cierta cantidad para cada año o parte cada categoría presentada. En contraste, los diagramas circulares se usan para mostrar como una cantidad total se reparte en un grupo de categorías. El diagrama circular o de pastel es un método gráfico que se usa mucho para presentar distribuciones de frecuencias relativas de datos cualitativos.

EJEMPLO 1.9

Tomando el ejemplo 1.7 construir un diagrama circular. La tabla 1.12 muestra la distribución de frecuencia y la frecuencia relativas de compra de refrescos.

Marca Frecuencia Frecuencia relativa Coca cola clásica 38 0.38 Coca cola de dieta 16 0.16 Fanta 10 0.10Pepsi Cola 26 0.26Sprite 10 0.1

Total 100 1 Tabla 1.12. Distribución de frecuencia y frecuencia relativa de compras de refrescos

Para trazar el diagrama circular, se dibuja primero un círculo, a continuación, con las frecuencias relativas, se divide el círculo en sectores o partes, que corresponden a la frecuencia relativa de cada clase. Por ejemplo, tomando los datos de la tabla 1.12; como hay 360 grados en un circulo, y se tiene que la coca cola clásica tiene 0.38 de frecuencia relativa, el sector de la gráfica de pastel que le corresponde debe tener (0.38)(360)=136.8 grados. Se efectúan cálculos semejantes para las demás clases, obteniéndose el diagrama de pastel de la figura 1.8. Los valores numéricos que se ven para cada sector pueden ser frecuencias, frecuencias relativas o porcentajes.

Figura 1.8. Gráfica circular de los datos de la tabla 1.12

16

Page 17: estadistica

1.9 INICIAR A TRABAJAR CON MINITAB PARA CREAR LAS DIFERENTES GRAFICAS (analizadas en éste capítulo)

MINITAB es un paquete estadístico que incluye los principales métodos analíticos y gráficos de la estadística, para propósitos de exploración, análisis e inferencia.

Una vez que instale en su computadora el paquete estadístico MINITAB, es posible realizar procedimientos estadísticos, propiamente métodos estadísticos (analíticos o gráficos), con los que es posible analizar conjuntos de datos. Como por ejemplo estadística descriptiva, análisis de regresión, métodos de control de calidad y diseño de experimentos.

MINITAB, inicia con dos ventanas principales: La ventana “sesión” muestra los resultados del análisis en forma de texto.

Además, en esta ventana puede ingresar comandos en lugar de usar los menús de MINITAB.

La ventana “data” contiene una hoja de trabajo abierta, que es similar en apariencia a una hoja de cálculo. Se pueden abrir varias hojas de trabajo, cada una en una ventana “data” distinta.

:Las características de las gráficas en MINITAB incluyen ٭

- Una galería gráfica para seleccionar un tipo de gráfica- Flexibilidad en la personalización de gráficas, desde la creación de

subconjuntos de datos hasta la especificación de títulos y notas al pie.- Capacidad de cambiar la mayoría de los elementos de la gráfica, tal como

fuentes, símbolos, líneas, colocación de vistos buenos y presentación de datos, después de su creación.

- Capacidad de actualizar automáticamente las gráficas.

La figura 1.9 muestra la página inicial para iniciar a trabajar con MINITAB. Se puede abrir una nueva hoja de trabajo vacía en cualquier momento. También se puede abrir uno o más archivos con datos. Cuando abre un archivo, usted copia su contenido en el proyecto MINITAB actual. Los cambios que efectúa en la hoja de trabajo mientras se encuentra en el proyecto no afectan el archivo original.

Los datos de los tres centros de envío están guardados en la hoja de trabajo SHIPPINGDATA.MTW.

17

Page 18: estadistica

Figura 1.9 Página inicial de MINITAB

Introducimos los datos como en una hoja de Excel y se puede identificar las columnas con nombre a cada una de ellas como muestra la figura 1.10.

Figura 1.10 Datos en la página inicial de MINITAB

18

Page 19: estadistica

PARA CREAR UNA GRAFICA DE PUNTOS

Se puede crear una gráfica de Dotplot (gráfica de puntos) para los datos de la tabla 1.1. Seleccionar Graph ➤ Dotplot (Como lo muestra la figura 1.11). Para la mayoría de las gráficas, MINITAB muestra una galería gráfica. Su opción en la galería determina las opciones de creación disponibles para la gráfica. En One Y, seleccionar la opción Simple. Como lo muestra la figura 1.12. Al darle clic en OK (opción para seleccionar el tipo de gráfica), como en éste caso solo se tiene una variable entonces se selecciona Graph variables, ingresar CALIFIC. Tal como lo muestra la figura 1.13.

Figura 1.11. Opción para realizar la gráfica de tallo y hoja en MINITAB

19

Page 20: estadistica

Figura 1.12. Pantalla que nos permite seleccionar la gráfica deseada

Figura 1.13. Pantalla en la cual se introducen las variables para su análisis

Al darle clic en OK en la figura 1.13, presenta la grafica de la figura 1.14

Figura 1.14 Gráfica de puntos para los datos de la tabla 1.1

La edición de gráficas en MINITAB, puede editar prácticamente cualquier elemento de una gráfica. Por ejemplo para la gráfica de la figura 1.14; se puede modificar el título, el tamaño del texto del gráfico haciendo doble clic en el título aparece una pantalla como la muestra la figura 1.15, la cual permite modificar el título del gráfico.

20

Page 21: estadistica

Figura 1.15. Pantalla para modificar el título del gráfico

Además también permite modificar el texto del eje de las “x” haciendo doble clic sobre éste, tal como muestra la figura 1.16. Haciendo las modificaciones del gráfico, del título más descriptivo y la modificación en la leyenda del eje de las “x”, como lo muestra la figura 1.17

Figura 1.16. Pantalla la cual permite hacer modificaciones en la escala

21

Page 22: estadistica

Figura 1.17. Gráfico en el cual se modificó la leyenda y el título

PARA CREAR UN HISTOGRAMA

Para crear un histograma en MINITAB (utilicemos los datos de la tabla 1.1). Primero Seleccionar Graph ➤ Histogram, como aparece en la figura 1.18; al darle clic aparece la pantalla que permite seleccionar el tipo de gráfico, en este caso seleccionar Simple porque se tiene una sola variable y hacer clic en OK, como lo muestra la figura 1.19.

Figura 1.18 Pantalla para realizar un histograma

22

Page 23: estadistica

Figura 1.19 Pantalla para seleccionar el tipo de gráfico

Al darle clic aparece la pantalla la cual se debe introducir la variable como en la pantalla de la figura 1.13, al presionamos Ok presenta la gráfica de la figura 1.20

Figura 1.20. Histograma correspondiente a los datos de la tabla 1.1

En la pantalla de la figura 1.13 permite modificar las etiquetas de la grafica, por ejemplo si se seleccionar la opción Labels, presenta la pantalla de la figura 1.21, en ésta pantalla permite escribir el título, dos subtítulos más y dos etiquetas que aparecen en la parte inferior izquierdo de la gráfica, al darle OK presenta la gráfica de la figura 1.22

23

Page 24: estadistica

Figura 1.21 Pantalla que permite escribir el título, subtítulos en la gráfica

Figura 1.22 Histograma con títulos y subtítulos de los datos de la tabla 1.1

En la pantalla de la gráfica 1.13, si se selecciona la opción Data Labels, presenta la pantalla, la cual si selecciona la opción Use y-value labels, como lo muestra la figura 1.23 y al darle Ok, presenta la gráfica con números (frecuencia) en la parte superior de las barras, como lo muestra la figura 1.24.

24

Page 25: estadistica

Figura 1.23 Pantalla en la cual permite seleccionar opción para que en las barras aparezca número

Figura 1.24 Histograma que presenta números en cada una de las barras correspondiente a los datos de la tabla 1.1

25

Page 26: estadistica

PARA CREAR UN POLIGONO DE FRECUENCIAS

Minitab construye un polígono de frecuencia tomando de base la distribución normal. Para crearlo (utilicemos los datos de la tabla 1.1). Primero Seleccionar Graph ➤ Histogram, (pantalla de la figura 1.18) y seleccionamos la opción With Fit, figura 1.25, al darle clic aparece la gráfica de la figura 1.26.

Figura 1.25 Pantalla que permite seleccionar la gráfica

Figura 1.26. Polígono de frecuencias de los datos de la tabla 1.1

26

Page 27: estadistica

PARA CREAR UN DIAGRAMA CIRCULAR

Para crear un diagrama circular con MINITAB, tomando los datos de la tabla 1.12 seleccionar la opción “Graph➤pie chart”, como lo muestra la figura 1.27.

Figura 1.27. Opción para crear un diagrama circular.

Al darle clic se desprende otra pantalla en la cual debemos introducir la variable categórica, como lo muestra la figura 1.28, ésta ventana también permite hacer modificaciones en el gráfico.

Figura 1.28. Pantalla para introducir la variable.

Al darle OK presenta la grafica de la figura 1.29.

27

Page 28: estadistica

Figura 1.29. Grafica circular de los datos de la tabla 1.9

PARA CREAR UN DIAGRAMA DE BARRAS O DE PARETO

Para realizar el diagrama de barras, en la pantalla de la figura 1.27, seleccionar la opción “Graph➤Bar_Chartt”. Al darle clic, se desprende una ventana en la cual presenta opciones para realizar la gráfica, al darle OK se desprende una pantalla en la que introducimos la columna en la cual tenemos los datos categóricos que queremos que realice el gráfico y al darle OK presenta la gráfica de la figura 1.30.

Figura 1.30. Gráfica de Pareto de los datos de la tabla 1.12

1.10 COMPARACION DE VARIOS GRUPOS

28

Page 29: estadistica

En investigación es de gran utilidad hacer una comparación entre grupos y que presente las gráficas en una sola pantalla para facilitar su análisis. Veamos con un ejemplo utilizando una base de datos que MINITAB proporciona. Es recomendable preparar una hoja de trabajo antes de comenzar un análisis.

PASO 1. Seleccione File ➤ Open Worksheet. (Como lo muestra la figura 1.31)

Figura 1.31 Pantalla para abrir una hoja de trabajo

PASO 2. En la carpeta Data, hacer doble clic en Meet MINITAB.Se puede cambiar la carpeta predeterminada para abrir y guardar archivos en MINITAB al seleccionar Tools ➤ Options ➤General. (Como lo muestra la figura 1.32)

29

Page 30: estadistica

Figura 1.32 Para seleccionar la hoja de trabajo

PASO 3. Seleccionar SHPPINGDATA.MTW y hacer click en Open. Si aparece un cuadro de mensaje, marque Do not display this message again, y hacer clic en OK. (como lo muestra la figura 1.33). Para restaurar este mensaje y para que aparezca cada vez que abre una hoja de trabajo y se restablezca la configuración predeterminada de MINITAB.

Figura 1.33 Pantalla para restablecer la configuración predeterminada de MINITAB

Examinemos una hoja de trabajo, los datos están ordenados en columnas, que también se denominan variables. El número y el nombre de las columnas aparecen en la parte superior de cada columna, como la muestra la figura 1.34. Cada fila de la hoja de trabajo representa un caso.

30

Page 31: estadistica

Figura 1.34. Hoja la cual presenta los diferentes tipos de datos.

MINITAB acepta tres tipos de datos: numéricos, de texto, y de fecha/hora. La figura 1.34 contiene cada uno de estos tres tipos.

Los datos incluyen: Nombre del centro de envío Fecha de pedido Número de días de entrega Estado de entrega (“on time” indica que el envío del libro se recibió a

tiempo; “Back order” indica que el libro no está actualmente en stock; “Late” indica que el envío del libro se recibió seis o más días después del pedido).

Distancia desde el centro de envío hasta la dirección de entrega.

Exploremos los datos de los centros de envío, que podrían ser gráficas para comparar medias, explorar la variabilidad, comprobar la normalidad y examinar la relación entre las variables.

Antes de realizar un análisis estadístico, es de gran utilidad crear gráficas que muestren características importantes de los datos.

Para los datos de los centros de envío, suponiendo que se desea conocer el tiempo de entrega promedio de cada centro de envío y qué tan variables son los datos dentro de cada centro de envío. También se puede determinar si los datos de los centros de envío siguen una distribución normal de modo que pueda usar métodos estadísticos estándar para probar la igualdad de las medias.

31

Page 32: estadistica

Si se sospecha que el tiempo de entrega difiere para los tres centros de envío. Se puede crear una gráfica de valor individual para comparar los datos de los centros de envío.

Tomando el archivo que se abrió en la figura 1.34. Si no está abierto seleccione File ➤ Open Worksheet. Hacer doble clic en Meet MINITAB y seleccionar SHIPPINGDATA.MTW. Hacer clic en Open. (esto si no se tenían abierto)Siguiente paso seleccionar Graph ➤ Individual Value Plot. Como lo muestra la figura 1.35. Le damos clic en esta opción y presenta la figura 2.36.

Figura 1.35 Opción de Graph➤Individual Value Plot.

Para la mayoría de las gráficas, MINITAB muestra una galería gráfica. Su opción en la galería determina las opciones de creación disponibles para la gráfica. En One Y, seleccionar la opción With Groupos. Como lo muestra la figura 1.36. Al darle OK muestra la pantalla de la figura 1.37.

32

Page 33: estadistica

Figura 1.36. Opciones para seleccionar el tipo de gráfica

En la pantalla de la figura 1.37 se introducen los datos en Graph variables, ingresar Day; en Categorical variable for grouping (1-4, outermost first), introducir Center. En el lado izquierdo muestra la lista de las variables de la hoja de trabajo que están disponibles para el análisis. Los cuadros de la derecha muestran las variables que debemos seleccionar para su análisis.

Figura 1.37 Se introducen los datos para su análisis

Siguiente paso es hacer clic en Data View, (ver figura 1.38) y marcar Mean connect line, para que realice la gráfica y darle clic en Ok En cada cuadro de diálogo que aparece hacer lo mismo y presenta la grafica de la figura 1.39.

33

Page 34: estadistica

Figura 1.38 añadir la opción de Mean connect line

Figura 1.39 Graficas de valor individual

Las gráficas de valor individual de la figura 1.39, muestran que cada centro tiene un tiempo de entrega promedio diferente. El centro Western tiene un tiempo de entrega menor que el de los centros Central y Eastern. La varianza dentro de cada centro de entrega parece ser la misma.

34

Page 35: estadistica

Para crear un histograma en la figura 1.19 seleccionar With Fit And Groups como en la figura 1.40 al darle clic en OK, desprende una ventana como lo muestra la pantalla de la figura 1.41, en Graph variables, introducir Days; en Categorical variables for grouping (0-3), ingresar Center. Al hacer clic en Ok. Presenta las graficas de la figura 1.42.

Figura 1.40. Opciones para seleccionar el histograma

Figura 1.41. Pantalla en la que se introducen los datos para su análisis

35

Page 36: estadistica

Figura 1.42. Presenta las tres graficas para su comparación

Tal como se observó en la gráfica de valor individual (figura 1.39) las medias de cada centro son distintas. Como lo muestra en la parte superior del lado derecho la gráfica de la figura 1.42. Donde los tiempos de entrega promedio son:Central: 3.984 díasEastern: 4.452 díasWestern: 2.981 días

Se observa que los centros Central y Eastern son similares en cuanto al tiempo de entrega promedio y la dispersión del tiempo de entrega. En contraste, el tiempo de entrega promedio del centro Western es más breve y su dispersión es menor.

Para crear un histograma paneles, es de gran utilidad para determinar si los datos de los centros de envío siguen una distribución normal, se puede crear un histograma en paneles del lapso de tiempo entre el pedido y la fecha de entrega. Primero seleccionar la opción Graph ➤ Histogram, al darle clic, seleccionar With Fit, al darle Ok se desprende una ventana y en Graph variables, introducir Days. Tal como lo muestra pantalla de la figura 1.43.

36

Page 37: estadistica

Figura 1.43. Pantalla la cual se introduce la variable que se desea graficar.

En la pantalla de la figura 1.43, hacer clic en Multiple Grapas y en la pestaña By Variables, en By variables with groups in separate palens, introducir Center. Tal como aparece en la figura 1.44.

1

Figura 1.44. Pantalla para introducir variable

Al hacer clic en OK, en cada cuadro de diálogo, presenta la grafica en el cual muestra los tres histogramas, como lo muestra la figura 1.45.

37

Page 38: estadistica

Figura 1.45. La cual muestra los tres histogramas.

38

Page 39: estadistica

EJERCICIOS

1.1 La siguiente tabla muestra una distribución de frecuencias relativa.

Clase Frecuencia relativaA 0.25B 0.20C 0.42D

a) ¿Cuál es la frecuencia relativa de la clase D?b) Encuentra la frecuencia relativa acumulada

1.2 Un artículo publicado en Technometrics, presenta datos sobre el precio de venta anual de 24 almacenes. Los datos aparecen en la siguiente tabla.

23.9 27.9 33.9 28.0 41.9 36.9 27.5 27.9 29.5 34.9 35.9 34.9 25.9 29.9 29.0 39.9 35.9 43.8 23.9 26.9 28.9 38.5 42.5 42.5

Construye un diagrama de tallo y hoja

1.3 Del ejercicio 1.2 Encuentra la distribución de frecuencias usando 5 intervalos de clase de la misma longitud.

1.4 Del ejercicio 1.2 Construye un histograma de frecuencias y un polígono de frecuencias usando 5 intervalos de clase de la misma longitud.

1.5 Del ejercicio 1.2 Encuentra las distribuciones de frecuencias relativas, acumuladas y acumuladas relativas.

1.6 Del ejercicio 1.2 Construye la gráfica de ojiva1.7 En un cuestionario se obtuvieron 49 respuestas sí, 35 no y 15 sin opinión.

Construye un diagrama circular.1.8 Se pidió a los alumnos de cierta escuela llenar un cuestionario de evaluación

del curso al final del mismo. Consiste en una diversidad de preguntas cuyas respuestas se clasifican en cinco categorías. Una las preguntas es: En comparación con otros cursos que has estudiado, ¿cuál es la calidad general de éste? Se usó una escala (mala, regular, buena, muy buena y excelente)En una muestra de 70 alumnos; 10 contestaron mala, 30 contestaron regular, 10 contestaron buena, 15 contestaron muy buena y 5 excelente. Construye un diagrama de Pareto.

39

Page 40: estadistica

1.9 Construye un diagrama de Pareto para los siguientes datos

Defectos que afecta la producción de hornos microondas comercializados.

Porcentaje de defectos

Dispositivo de descongelación automática

Dispositivo de conservación de la temperatura

Arranque automático

Pulsadores

Cocción por fases

38

31

10 5

2

1.10 Northway Computers acaba de iniciar un programa para controlar la calidad de las computadoras personales que ensambla. Un cuidadoso análisis de 25000 equipos localizó las siguientes fallas.

Componentes Número de defectosCPU 25Unidades de disco flexible 106Unidades de disco duro 237Puertos I/0 36Teclado 60Monitor 42Fuente de poder 186Memoria RAM 30ROM BIOS 7Adaptadora de video 47Otros 163

Elabora un diagrama de Pareto para Northway. El prsidente de la compañía, programará una serie de juntas con sus proveedores de componentes. ¿Con quién debe entrevistarse primero?

1.11 De la siguiente distribución de frecuencias encuentra, la frecuencia acumulada, frecuencia relativa, la frecuencia acumulada relativa

Intervalo de clase Frecuencia 2.3 ---- 2.7 2.8 ---- 3.2 3.3 ---- 3.7 3.8 ---- 4.2 4.3 ---- 4.7 4.8 ---- 5.2 5.3 ---- 5.7

4 6 7 5 3 2 1

Total 28

40

Page 41: estadistica

1.12 De la siguiente distribución de frecuencias elabora un histograma y un polígono de frecuencias.

1.13 Del ejercicio 1.11, encuentra el diagrama de ojiva.

1.14 En una encuesta que se aplico a los alumnos de quinto semestre de cierta escuela que evaluaran los cursos en línea. 57 alumnos contestaron “malo”, 45 contestaron “bueno”, 26 contestaron “excelente”. Construye un diagrama de Pareto.

Intervalo de clase Frecuencia 2.3 ---- 2.9 3.0 ---- 3.6 3.7 ---- 4.3 4.4 ---- 5.0 5.1 ---- 5.7

5 9 12 4 2

Total 32

41