mic sesión 3
TRANSCRIPT
MÉTODOS DE INVESTIGACIÓN CUANTITATIVA
Sesión 3:
ESTADÍSTICA DESCRIPTIVA: Agrupación y Presentación de Datos.
FÁTIMA PONCE 1
FÁTIMA PONCE 2
PUNTOS A TRATARSesión 3:
Estadística Descriptiva: Agrupación y Presentación
Uso e importancia de la Estadística.
Estadística Descriptiva: Presentación y análisis de datos. oTablas de Frecuencia e Histograma.oRepresentaciones Gráficas.
FÁTIMA PONCE 3
ESTADÍSTICA DESCRIPTIVA:AGRUPACIÓN Y
PRESENTACIÓN DE DATOS
FÁTIMA PONCE 4
Permite construir y analizar cuadros estadísticos y gráficos resúmenes, con el objetivo de resumir los datos, de manera que sean entendibles e interpretables con facilidad, a fin de que nos sirva la información para la toma de decisiones: Distribuciones de frecuencias e histograma, Gráficas de barras, líneas, pie, otros.
Aplicar e interpretar medidas numéricas que resumen los datos: Medidas de localización central (media, mediana,
moda), variabilidad (varianza, desviación estándar, coefi- ciente de variabilidad) y emplearlos como medidas de
tendencia y riesgo.
ESTADÍSTICA DESCRIPTIVA
FÁTIMA PONCE 5
Los datos pueden organizarse de varias maneras.
Datos sin procesar: Recolectar y presentarlos (Datos no agrupados).
Datos Procesados: Organizados (agrupados) a fin de ver rápidamente alguna(s) de su(s) característica(s) para entender mejor la población y tomar una mejor decisión:
o Distribución de frecuencias: Método para agrupar datos. Se dividen en clases y se cuenta el número de observaciones en cada clase.
o Representaciones Gráficas.
BÚSQUEDA DE UN PATRÓN SIGNIFICATIVO EN LOS DATOS
FÁTIMA PONCE 6
Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. En ambos casos se han ordenado los datos de la muestra.
PRESENTACIÓN ORDENADA DE LOS DATOS
Género FrecuenciaHombres 3Mujeres 8
3
8
0
5
10
Hombres Mujeres
FÁTIMA PONCE 7
DISTRIBUCIÓN DE FRECUENCIAS
FÁTIMA PONCE 8
DISTRIBUCIÓN DE FRECUENCIASEs un resumen tabular de datos organizados en clases, es decir, en grupos de valores que describen una característica de los datos.
Indica el número de veces que ocurre cada dato en la clase.
Notas14119
1868
141516131112
Este resumen aporta más claridad.
Dat
os D
esor
dena
dos
Número de veces que ocurre cada dato en la clase disjunta.
Frecuencia0372
12
clase0-5
6-1011-1516-20
FÁTIMA PONCE 9
Las frecuencias pueden ser: Absoluta, Relativa Porcentual.
y pueden presentarse
Simple / No acumuladas, Acumuladas: Sólo tienen sentido para variables
numéricas u ordinales. Útiles para calcular cuantiles.
DISTRIBUCIÓN DE FRECUENCIAS
FÁTIMA PONCE 10
Tipo de Clases
Cuantitativas: Discretas (con poca variabilidad) Discretas (con mucha variabilidad) Continuas
Las clases están compuestas por datos discretos (conteo) y datos continuos (medición).
Cualitativas: Emplean etiquetas o nombres para determinar las
categorías.
FÁTIMA PONCE 11
Distribución de Frecuencias: PASOS1. Determinar el número de clases disjuntas en las
que se dividen los datos: Debe permitir observar la variación en los datos. Cuanto más grande sea el rango de los datos, más clases puntuales se requiere. El número de clases es arbitrario, pero se recomienda
esté entre 5 y 15 clases.Para determinar el número de clases en las que se dividen los datos (n) de la muestra se emplea:
Número de clases = raiz (n), ó Número de clases = 3 log(n), ó Fórmula de Sturges: Número de clases = 1 + 3.3 log(n)
Es referencial.
FÁTIMA PONCE 12
Distribución de Frecuencias: PASOS
2. Determinar el Ancho o tamaño del intervalo o amplitud de clase: El ancho debe ser el mismo para todas las clases.
Rango Ancho aprox de clase = ----------------------------- número de clases
Dato mayor – Dato menor Ancho aprox de clase = --------------------------------------- número de clases
FÁTIMA PONCE 13
Distribución de Frecuencias: PASOS
3. Determinar los límites de clase: Cada clase tiene un límite inferior y un límite superior.
Se recomienda que el límite inferior de la primera clase sea el valor mínimo de los datos.
Las clases son completamente incluyentes (abarcan a todos los datos) y mutuamente excluyentes (ningún dato entra en más de una clase): Cada dato pertenece a una y sólo una de las clases.
FÁTIMA PONCE 14
Distribución de Frecuencias: PASOS4.Tabular o Determinar la frecuencia:
Contar el número de datos que cae dentro
de cada clase para construir la tabla.
012345678
0-5 6-10 11-15 16-20
Histograma de frecuencias Absolutas
clase0-5
6-1011-1516-20
Frecuencia0372
5.Ilustrar los datos en un Histograma de frecuencia.Informa acerca de la forma de
la distribución de los datos.Se construyen rectángulos
sobre c/u de las clases, con alturas proporcionales al número de elementos que caen en la clase (frecuencia).
FÁTIMA PONCE 15
Si se tiene el número de horas que demoran las Municipalidades en dar respuesta a una solicitud en 50 gobiernos distritales. Elabore una distribución de frecuencias
Datos sinProcesar:
85 54 56 73 7351 59 66 67 6464 71 63 65 6468 71 74 61 6273 64 53 60 6156 65 56 65 7180 68 64 72 6765 63 65 64 7264 61 86 67 8273 70 65 59 84
Ejemplo: Distribución de frecuencia
FÁTIMA PONCE 16
EJEMPLO: Distribución de frecuencia
1. Número de Clases 62. Ancho o amplitud de clase: Valor Máximo – Valor mínimo (86 – 51) 35 = -------------------------------------- = ---------- =---- 6 Número de clases 6 6
Clases Límite inferior Límite superior 1 51 56 2 =51+6 =57 62 3 =57+6 =63 68 4 =63+6 =69 74 5 =69+6 =75 80 6 =75+6 =81 86
3. Límites de clase: Definir límite inferior y superior de c/clase
FÁTIMA PONCE 17
21 de los 50 gobiernos locales tuvieron una demora entre 63 y 68 horas.
Ningún gobierno distrital se demoró menos de 51 horas ni más de 86.
Punto Medio de Clase (51 + 56)/2 = 53.5
Clases (demora en horas) Cuenta
Frecuencia Absoluta (gobiernos
distritales)51-56 IIIII I 657-62 IIIII II 763-68 IIIII IIIII IIIII IIIII I 2169-74 IIIII IIIII I 1175-80 I 181-86 IIII 4
50
4. Determinar las frecuencias
EJEMPLO: Distribución de frecuencia
FÁTIMA PONCE 18
EJEMPLO: Distribución de Frecuencia
5. Ilustrar en un gráfico: Histograma de frecuencias. Informa acerca de la forma de la distribución de los datos. Se construyen rectángulos sobre c/u de las clases, con
alturas proporcionales al número de elementos que caen en la clase (frecuencia).
Clases (horas)
Frecuencia Absoluta (gob.
distritales)51-56 657-62 763-68 2169-74 1175-80 181-86 4
50
51-56 57-62 63-68 69-74 75-80 81-860
5
10
15
20
25
Demora (en horas)
Frec
uenc
ia
FÁTIMA PONCE 19
Frecuencia Relativa y Porcentual
Muestra que la frecuencia relativa porcentual de la tercera clase es 42%.
Clases (horas)
Frecuencia Absoluta
(gob. distritales)51-56 657-62 763-68 2169-74 1175-80 181-86 4
50
Frecuencia Relativa = 6/50 = 0.12= 7/50 = 0.14= 21/50 = 0.42= 11/50 = 0.22= 1/50 = 0.02= 4/50 = 0.08
1
Frecuencia Porcentual
12%14%42%22%2%8%
100%
FÁTIMA PONCE 20
FRECUENCIAS ACUMULADAS
Una distribución de frecuencias acumuladas permite ver cuántas observaciones están por encima de ciertos valores. En ejercicio anterior:
OJIVA: Gráfica de una frecuencia acumulada.
Clases (horas)
Frecuencia Absoluta
(gob. distritales)51-56 657-62 763-68 2169-74 1175-80 181-86 4
50
Frecuencia Acumulada
6 13 34 45 46 50
Frecuencia Acumulada
%12%26%68%90%92%
100%
FÁTIMA PONCE 21
POLÍGONO DE FRECUENCIA Es una línea que conecta los puntos medios de todas las
barras de un histograma y bosqueja con mayor claridad un perfil del patrón de los datos.
Se utiliza para representar distribuciones de frecuencias de variables cuantitativas continuas, pero se emplean segmentos de recta, de ahí el nombre de polígono.
0
1
2
3
4
5
6
7
8
2.5 8 13 18 23
Polígono de Frecuencias
0
2
4
6
8
2.5 8.0 13.0 18.0 23.0
Histograma de Frecuencias Absolutas y Polígono de Frecuencias
FÁTIMA PONCE 22
REPRESENTACIONES GRÁFICAS
Constituyen uno de los principales y más sencillos métodos de presentar
la información.
FÁTIMA PONCE 23
¿Qué Gráfico Usar: Barra, Línea o Círculo?
Depende de los datos y lo que queremos mostrar. El gráfico debe ayudar a interpretar correctamente lo que los datos nos dicen:
Las barras se emplean para comparar.
Las líneas se usan más para ver su comportamiento en el tiempo (la tendencia).
Círculo o Pie se emplea para mostrar proporciones o participaciones de un todo.
FÁTIMA PONCE 24
Gráfico: Gráficos de Barra (comparativos)
Pueden ser: Sencillo: Contiene una única serie
de datos.
Agrupado: Contiene varias series de datos y cada una se representa por un tipo de barra de un mismo color o textura.
Apilado: Contiene varias series de datos. La barra se divide en segmentos de diferentes colores o texturas y cada uno de ellos representa una serie
Intención de postular a la Universidad
FÁTIMA PONCE 25
Gráfico de Líneas
12345678910
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
5000
55006000
65007000
75008000
8500Consumo Mensual de Energía Eléctrica
Muestra proporciones (%) relativas de una variable.
Gráfico Circular
Participación del Mercado de Internet Móvil 2015, según tipo de terminal
Fuente: OSIPTEL.
FÁTIMA PONCE 26
Por ejemplo de cotizaciones de acciones. Muestra el valor más alto, el más bajo y el de cierre de la acción.
Gráfico de Máximos y Mínimos (datos financieros)
FÁTIMA PONCE 27
Es un gráfico que representa mediante figuras o símbolos las frecuencias de una variable cualitativa o discreta.
Suelen usarse para comparar magnitudes o ver la evolución en el tiempo de una categoría concreta.
Por ejemplo:
PICTOGRAMA
Transporte Residencial/ Industria/ Otros Comercio Minería 42% 29% 25% 4%
Consumo final de energía total por sectores
FÁTIMA PONCE 28
BIBLIOGRAFIA
Anderson, D., Sweeney, D. y Williams T. (2008). Cap 2.
Levin, R. y Rubin, D. (2010). Cap. 2.