estadística aplicada a las ciencias políticas 2.2: resumen numérico medidas de localización....

22
Estadística Aplicada a las Ciencias Políti 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas: Capítulos 2 a 6 del libro de Peña y Romo (1997) Capítulos 3 a 7 del libro de Portilla (2004)

Upload: pedro-caceres-miranda

Post on 02-Feb-2016

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

2.2: Resumen numérico

Medidas de localización. Medidas de dispersión. Medidas de forma.

Lecturas recomendadas:

• Capítulos 2 a 6 del libro de Peña y Romo (1997)• Capítulos 3 a 7 del libro de Portilla (2004)

Page 2: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

MEDIDAS DESCRIPTIVAS

¿Para qué nos sirven?

¿Se pueden calcular todas con todo tipo de variables?

¿Cuáles son las más adecuadas en cada caso?

¿De qué forma podemos sacar partido a nuestra calculadora?

Page 3: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

Medidas de localización

Existen tres medidas comunes: la moda, la mediana y la media.

Una muestra del número de años en el ayuntamiento de los últimos 24 alcaldes de Madrid

3 1 1 1 1 1 2 17 6 13 8 3 2 1 12 1 1 7 3 2 12 6

Page 4: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

La moda

Clase Frecuencia1 102 43 34 05 06 27 28 19 0

10 011 012 113 1

y mayor... 0

Es el valormás frecuente

Puede haber más de una moda: bimodal-trimodal-plurimodal

¿Podemos calcular la moda con datos cualitativos?

¿Tiene sentido esta definición con datos continuos?

Page 5: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

La moda con datos (continuos) agrupados

Tenemos una clase modal

¿Qué hacemos si las clases son de distintas anchuras?

Ingresos y Derechos liquidados

(millones de PTAS)

Frecuencia absoluta

≤ 30 0

(30,45] 2

(45,60] 9

(60,75] 9

(75,90] 10

(90,105] 3

(105,120] 3

> 120 0

Total 60

Page 6: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

Un valor exacta para la moda con datos agrupados

Ingresos de ayuntamientos de Madrid (millones de PTAS)

0

2

4

6

8

10

12

15 37,5 52,5 67,5 82,5 97,5 112,5 >120

Ingresos

El centro del intervalo modal

La moda

Page 7: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

La mediana

Es la observación que ocupa el lugar central.

5 3 11 21 7 5 2 1 3

¿Qué valor toma la mediana?

1. Ordenamos los datos de menor a mayor.

2. Tenemos en cuenta también los que se repiten.

3. La mediana, es el “CENTRO FÍSICO”

¿Cómo cambia el cálculo si N es par o impar?

¿Podemos calcular la mediana para datos cualitativos?

Page 8: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

3 1 1 1 1 1 2 17 6 13 8 3 2 1 12 1 1 7 3 2 12 6

1 1 1 1 1 1 1 11 1 2 2 2 2 3 33 6 6 7 7 8 12 13

La mediana es ½*(2+2)=2

Los alcaldes

Page 9: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

x i n i N i f i F i

1 10 10 0,41666667 0,416666672 4 14 0,16666667 0,583333333 3 17 0,125 0,708333334 0 17 0 0,708333335 0 17 0 0,708333336 2 19 0,08333333 0,791666677 2 21 0,08333333 0,8758 1 22 0,04166667 0,916666679 0 22 0 0,91666667

10 0 22 0 0,9166666711 0 22 0 0,9166666712 1 23 0,04166667 0,9583333313 1 24 0,04166667 1

y mayor... 0 24 0 1

Mediana<0,5>0,5

La mediana a través de la tabla de frecuencias (datos discretos)

Page 10: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

La mediana con datos agrupados

Ingresos ni Ni fi Fi

≤ 30 0 0 0 0

(30,45] 2 2 0,05555556 0,05555556

(45,60] 9 11 0,25 0,30555556

(60,75] 9 20 0,25 0,55555556

(75,90] 10 30 0,27777778 0,83333333

(90,105] 3 33 0,08333333 0,91666667

(105,120] 3 36 0,08333333 1

> 120 0 36 0 1

Total 36   1  

Intervalo mediano

Page 11: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

Frecuencias relativas acumuladas de los ingresos de ayuntamientos

0

0,2

0,4

0,6

0,8

1

1,2

15 37,5 52,5 67,5 82,5 97,5 112,5 >120

Ingresos

0,5

La mediana

Un valor exacta para la mediana con datos agrupados

Page 12: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

Una fórmula para calcular la mediana con datos agrupados

donde el intervalo mediano es (ai-1,ai] de tamaño li = ai-ai-1

¿Cuál es el valor de la mediana de los ingresos de ayuntamientos?

Page 13: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

La media

La media o media aritmética es el promedio de todos los datos de la muestra.

Para los alcaldes, la suma de los datos es:

3 + 1 + 1 + 1 + 1 + 1 + 2 + 17 + 6 + 13 + 8 + 3 + 2 + 1 + 12 + 1 + 1 + 7 + 3 + 2 + 12 + 6 = 86

Luego, la media es 86/24 ≈ 3,583 años.

¿Podemos calcular la media para datos cualitativos?

Page 14: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

La media a través de la tabla de frecuencias (datos discretos)

xi ni ni * xi

1 10 102 4 83 3 94 0 05 0 06 2 127 2 148 1 89 0 0

10 0 011 0 012 1 1213 1 13

y mayor … 0 0Total 24 86 3,58333333

Page 15: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

La fórmula

Page 16: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

La media con datos agrupados

Ingresos xi ni xi*ni

<= 30 22,5 0 0(30,45] 37,5 2 75(45,60] 52,5 9 472,5(60,75] 67,5 9 607,5(75,90] 82,5 10 825(90,105] 97,5 3 292,5(105,120] 112,5 3 337,5> 120 127,5 0 0Total 36 2610 72,5

Es la misma fórmula pero usando la marca de clase.

Page 17: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

La moda, mediana y media para datos asimétricos

Page 18: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

Otros puntos de la distribución: mínimo, máximo y cuartiles

Ordenando los datos, el mínimo y máximo son fáciles de calcular.

1 1 1 1 1 1 1 11 1 2 2 2 2 3 33 6 6 7 7 8 12 13

¿Y los cuartiles?

1 1 1 1 1 1 1 11 1 2 2 2 2 3 33 6 6 7 7 8 12 13

3er cuartil = (6+6)/2 2º cuartil = mediana = (2+2)/2

1er cuartil = (1+1)/2

Page 19: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

Cálculo de cuartiles

Tenemos el siguiente conjunto de datos:

47 52 52 57 63 64 69 7172 72 78 81 81 86 91

1. Ordenamos los datos de menor a mayor.

2. Calculamos c2 , que ocupa la posición correspondiente a la “mitad”,

¿con qué parámetro visto ya coincide este segundo cuartil?

3. Ahora calculamos, la “mitad” de la primera parte: c1 .

4. Y la “mitad” de la segunda parte: c3 .

Page 20: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

47 47

52 52

52 52

57 57

63 63

64 64

69 69

71 71 71

72 72

72 72

78 78

81 81

81 81

86 86

91 91

c2 = 71

c1 = 60

c3 = 79,5

Page 21: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

Representación gráfica de los datos con los cuartiles

1. Los cálculos:Primer cuartil: 60Segundo cuartil: 71Tercer cuartil: 79,5Media aritmética: 69,07

2. Hay datos que pueden provenir de observaciones “mal tomadas”: datos atípicos.

Para detectarlas, calculamos:LI=c1-1,5(c3-c1)

LS=c3+1,5(c3-c1)

Box-and-Whisker Plot

47 57 67 77 87 97

Page 22: Estadística Aplicada a las Ciencias Políticas 2.2: Resumen numérico Medidas de localización. Medidas de dispersión. Medidas de forma. Lecturas recomendadas:

Estadística Aplicada a las Ciencias Políticas

Ejercicio

Construir un diagrama de caja para el siguiente conjunto de datos.

35 45 45 55 57 62 64 64

64 65 73 74 74 76 78 80

82 84 86 92 92 92 93 94

97 112 116 116 123 123 124 128

140 143 173 214 255 277