estadÍstica y probabilidades: estadística descriptiva
TRANSCRIPT
ESTADÍSTICA Y PROBABILIDADESTEMA 2: ESTADÍSTICA DESCRIPTIVA
Presentaciones tabulares y gráficas
Prof. Alberto Grados Mitteenn
INTRODUCCIÓN
Los datos se clasifican en cualitativos y cuantitativos.
Para resumir un conjunto de datos se usan tablas y gráficos.
Para la elaboración de tablas y gráficos se debe emplear el software adecuado: Excel y Minitab.
RESUMEN DE DATOS CUALITATIVOS• Distribución de frecuencia• Distribuciones de frecuencia relativa y
porcentual• Gráficas de barras y circulares
EJEMPLO:
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS (ABSOLUTAS):
DISTRIBUCIONES DE FRECUENCIA RELATIVA Y FRECUENCIA PORCENTUAL
La frecuencia relativa de una clase es la fracción o proporción de elementos que pertenecen a cada clase.
Donde n es el número total de elementos
EJEMPLO:
Para calcular la frecuencia relativa de la Coke Classic se divide 19 entre 50: 19/50=0,38. Lo que implica que el 38% de los elementos corresponden a esta clase.
GRÁFICAS DE BARRAS Y CIRCULARES
Del ejemplo anterior, la gráfica de barras:
La gráfica circular o de pastel (cake):
NOTAS:
Los expertos estadísticos recomiendan que las clases con frecuencias menores se agrupen en una clase agregada llamada: otros (frecuencias menores a 5%)
La suma de frecuencias relativas es siempre igual a 1.
EJERCICIO DE AUTOEVALUACIÓN:
FORMALIZACIÓN:
RESUMEN DE DATOS CUANTITATIVOS• Distribución de frecuencia• Distribución de frecuencia relativa y frecuencia porcentual• Diagrama de puntos• Histograma• Distribuciones acumuladas• Ojiva
DISTRIBUCIÓN DE FRECUENCIA
Los 3 pasos para definir las clases de una distribución de frecuencia con los datos cuantitativos son:1. Determinar el número de clases que no se
superponen.2. Definir el ancho de cada clase.3. Determinar los límites de clase.
PASO 1: NÚMERO DE CLASES
Se recomienda usar entre 5 y 20 clases. El número de clases (k) debe ser el menor
número entero tal que 2k > n, donde n es el número de elementos (existen otros métodos).
Por ejemplo, si el número de elementos es 50; entonces buscamos la potencia de 2 menor y más cercana a ese valor: 26 > 50. En consecuencia k=6; es decir, se emplearán 6 clases.
PASO 2: DEFINIR EL ANCHO DE CADA CLASE
Es recomendable que sea el mismo para todas.
El ancho de clase o tic (tamaño del intervalo de clase) se calcula:
Donde H: máximo valor y L: mínimo valor
El valor del tic se redondea por exceso; es decir, si los datos tienen una cifra decimal y el tic=3,345 entonces se usa tic=3,4
PASO 3: DETERMINAR LOS LÍMITES DE CADA CLASE Deben elegirse de modo que cada elemento
pertenezca a una y solo una clase. Para la primera clase, el límite inferior es el dato
menor de los elementos. Para cada clase el límite superior se calcula:
LSn = LIn + tic Cuando los datos son discretos se emplean
representaciones simples como: 12 – 18; 19 – 25; etc. Cuando los datos son continuos se suelen emplear
intervalos como: [2,3;4,5[; [4,5;6,7[; etc. Aunque, a veces dichos intervalos se representan como: 2,3 – 4,5; 4,5 – 6,7; etc.; los cuales deben interpretarse de la misma forma (cerrado el límite inferior y abierto el límite superior).
NOTAS:
El punto medio de clase o marca de clase, es el valor medio entre los límites superior e inferior de cada clase; es decir, se obtiene de la semisuma de dichos valores.
Por ejemplo, si un intervalo de clase es 15 – 21; la marca de clase sería igual a (15+21)/2 = 18
La distribución de frecuencia relativa y frecuencia porcentual para datos cuantitativos se elabora de la misma forma que en la tabla de frecuencias para datos cualitativos.
EJEMPLO:
Elabora la tabla de distribución de frecuencias para los siguientes datos:Se tomaron los tiempos que demoran los trabajadores de una empresa en realizar el empaquetado de un producto en una línea de producción (en segundos).
10.8 12.5 15 15.8 15.8 14.6 14 15 18 20
15.4 16.4 15.9 16.4 16.8 19 20.4 22 24 25.4
18 16.8 18.4 18.4 21.5 20.3 25.8 30.2 30.4 32.5
25.4 26.2 28.4 29.2 35.4 36.4 38.4 39.2 38.8 40
RESPUESTA:
N° fi hi hi% xi1 10.8 15.7 7 0.175 17.5 13.252 15.7 20.6 15 0.375 37.5 18.153 20.6 25.5 5 0.125 12.5 23.054 25.5 30.4 5 0.125 12.5 27.955 30.4 35.3 2 0.05 5.0 32.856 35.3 40.2 6 0.15 15.0 37.75
40 1 100.0
TIEMPO
DIAGRAMA DE PUNTOSEjemplo: De una muestra de 20 clientes de la auditora Pricewaterhousecoopers (pwc), se obtuvo:
El diagrama de puntos correspondiente sería:
HISTOGRAMA
Gráfico que se elabora para datos previamente resumidos.
La variable de interés se coloca en el eje horizontal y la frecuencia (absoluta o relativa) en el eje vertical.
Del ejemplo anterior:
NIVELES DE SESGO EN LOS HISTOGRAMAS:
DISTRIBUCIONES ACUMULADAS
En lugar de indicar la frecuencia de cada clase, muestran el número de elementos con valores menores o iguales que el límite superior de cada clase.
EJEMPLO:
OJIVA Es la gráfica de una distribución acumulada. Muestra los valores de los datos en el eje
horizontal, y las frecuencias absolutas acumuladas o relativas acumuladas, sobre el eje vertical.
EJERCICIO DE AUTOEVALUACIÓN:
FORMALIZACIÓN:
BIBLIOGRAFÍA
Anderson, Sweeney, Williams (2012). Estadística para Negocios y Economía (11° Ed.). Estadística Descriptiva: Presentaciones tabulares y gráficas (pp. 31-48) México. CENGAGE Learning.
Estadística para los Negocios: Organización de datos (2013). Universidad San Ignacio de Loyola.