5. dispersion

25
MEDIDAS DE MEDIDAS DE DISPERSIÓN O DE DISPERSIÓN O DE VARIABILIDAD VARIABILIDAD Lic. Tatiana Rettis Lic. Tatiana Rettis

Upload: cesar-alvarez-apuela

Post on 04-Jul-2015

93 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 5. Dispersion

MEDIDAS DE MEDIDAS DE DISPERSIÓN O DE DISPERSIÓN O DE

VARIABILIDADVARIABILIDAD

Lic. Tatiana RettisLic. Tatiana Rettis

Page 2: 5. Dispersion

¿Qué tan separados están nuestros datos?

¿Qué tan "desparramados" están los datos?

Estas medidas nos permiten analizar la DISPERSIÓN o

VARIABILIDAD de las distribuciones que queremos

analizar

Medidas de Dispersión

Page 3: 5. Dispersion

Algunas medidas de variabilidad son:

Rango

Rango intercuartilico

Varianza

Desviación estándar

Coeficiente de variación

Page 4: 5. Dispersion

RANGO

Una alternativa como medida de dispersión es el RANGOCorresponde a la diferencia entre el mayor y el menor de nuestras observaciones

Claramente influenciado por valores extremos

Estimador “grueso”

Por esta razón no es una buena medida de dispersión.

RECORRIDO INTERCUARTILICO O AMPLITUD INTERCUARTILICA

Rq = Q3 - Q1

Page 5: 5. Dispersion

DESVIACIÓN MEDIADESVIACIÓN MEDIA

Es una medida de variabilidad que se obtiene promediando Es una medida de variabilidad que se obtiene promediando los valores absolutos de las desviaciones de los datos con los valores absolutos de las desviaciones de los datos con respecto al promedio.respecto al promedio.

Ejemplo: Halle la Desviación Media de los siguientes datos: Ejemplo: Halle la Desviación Media de los siguientes datos: 2, 3, 6, 8, 112, 3, 6, 8, 11

2-4 0 2 5

3 8 116

X = 6

-3

Page 6: 5. Dispersion

DESVIACIÓN MEDIA

n

XxDM

n

ii

1

n

nXxDM

k

iii

1

Datos No Agrupados Datos Agrupados

Page 7: 5. Dispersion

2

-42 02 22 52

3 8 116

X = 6

-32

Varianza Varianza Es una medida de variabilidad cuyo valor nos indicará si Es una medida de variabilidad cuyo valor nos indicará si los datos están concentrados o dispersos con respecto al los datos están concentrados o dispersos con respecto al promedio y se define como el promedio de los cuadrados promedio y se define como el promedio de los cuadrados de las desviaciones de cada valor con respecto a la media.de las desviaciones de cada valor con respecto a la media.

Ejemplo: Halle la Varianza de los siguientes datos: 2, 3, 6, Ejemplo: Halle la Varianza de los siguientes datos: 2, 3, 6, 8, 118, 11

Page 8: 5. Dispersion

VARIANZA POBLACIONAL

2

2 1

N

i

i

x

N

Cuantifica la cantidad de variabilidad o dispersión en relación a la media (o promedio) de las

observaciones.

PARA DATOS NO TABULADOS2

2 21

N

ii

x

N

n

XxS

n

ii

1

2

2

)(21

2

2 Xn

xS

n

ii

VARIANZA MUESTRAL

Page 9: 5. Dispersion

VARIANZA POBLACIONAL para Datos Agrupados en tabla de Frecuencia

N

nxk

iii

1

2

2

21

2

2

N

nxk

iii

n

nXxS

k

iii

1

2

2

21

2

2 Xn

nxS

k

iii

VARIANZA MUESTRAL para Datos Agrupados en tabla de Frecuencia

Page 10: 5. Dispersion

DESVIACIÓN ESTÁNDAR

2

La desviación estándar se define como la raíz La desviación estándar se define como la raíz cuadrada de la varianzacuadrada de la varianza

En la práctica, la desviación estándar se utiliza con más frecuencia que la varianza

Una de las razones es que se expresa en las mismas unidades de medida de la variable.

Page 11: 5. Dispersion

COEFICIENTE DE VARIACIÓN

Como el coeficiente de variación no tiene unidad de medida , permite comparar variabilidad entre distribuciones.

Se define como el cuociente entre LA DESVIACIÓN ESTÁNDAR y LA MEDIA:

SCV

X

Page 12: 5. Dispersion

APLICACIONES DEL COEFICIENTE DE VARIACIÓN

1.- Comparar variabilidad de dos distribuciones de una misma variable con unidades de medida

distintas.

Ejemplo: comparar la estatura de los estadounidenses , en pulgadas con la estatura

de los chilenos en cm.

Page 13: 5. Dispersion

2.- Comparar variabilidad de dos distribuciones de variables distintas.

Ejemplo: comparar la estatura en cm y el peso en kg. de los 20 niños seleccionados de

gimnasia artística:Estatura (X)Estatura (X) Peso (Y)Peso (Y)

128,5

8,4X

X

S

9,4

4,36

YS

Y

Comparar la variabilidad de estas dos distribuciones.

Page 14: 5. Dispersion

Peso de Corderos: s=40 k ; = 98 k

Peso de Toros: s=50 k; = 400 k

Peso de Elefantes: s=120 k; = 1500 k

¿Qué grupo presenta la menor dispersión?

3.- Comparar la variabilidad de distribuciones con promedios distintos.

X

X

X

Page 15: 5. Dispersion

MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN

Partimos de una muestra de tamaño

n=15, 2 2 3 3 4 4 4 5 6 6 6 7 7 8 8

• RANGO O RECORRIDO: R = Max-Min =

7

1jj

2j

n

1i

2i

2 nXx151

Xxn1

S

8 - 2 = 6

7 -3 = 4

3.87

• RECORRIDO INTERCUARTÍLICO: RQ = Q3 - Q1 =

• VARIANZA

Page 16: 5. Dispersion

• CUASIDESVIACIÓN TÍPICA:

2sS = 2.04

• DESVIACIÓN TÍPICA:

= 1.97

7

1jj

2j

n

1i

2i

2 nxx141

xx1n-

1 S 4.14

• CUASIVARIANZA:

2sS

Page 17: 5. Dispersion

D mC V m

M e = 0.347

• COEFICIENTE DE VARIACIÓN MEDIA:

• COEFICIENTE DE VARIACIÓN DE PEARSON:

= 0.394

j

7

1jj

n

1ii nx

151

xn1

Dm

XX = 1.73

• DESVIACIÓN MEDIA:

XS

CV

Page 18: 5. Dispersion

AlturaAltura(cm)(cm)

Frecuencia Frecuencia AbsolutaAbsoluta

157 – 162157 – 162 77

162 – 167162 – 167 88

167 – 172167 – 172 99

172 – 177172 – 177 3030

177 – 182177 – 182 2525

182 – 187182 – 187 1414

TOTALTOTAL 9393

Distribución de frecuencia de la altura (cm) de los estudiantes de la generación 2008

0

10

20

30

40

50

60

149.5 154.5 159.5 164.5 169.5 174.5 179.5 184.5 189.5

Altura (cm)

Fre

cue

nci

a r

ela

tiva

Calcule la VARIANZA POBLACIONAL y la DESVIACIÓN ESTÁNDAR

Page 19: 5. Dispersion

MEDIDAS DE ASIMETRÍAMEDIDAS DE ASIMETRÍAMide el grado de deformación horizontal de la distribución de Frecuencias y se define:

I. Sk es la mas usada.

II. Sk se usa cuando la distribución es unimodal.

III. Sk, llamada también media asimétrica, se usa cuando existen intervalos extremos abiertos ilimitados y no es posible calcular el promedio y consecuentemente la varianza.

SMeX

Sk3

SMoX

Sk

13

31 2QQMeQQ

Sk

Si es una Distribución Asimétrica Sk = o o tiende a cero.

Si es una Distribución Asimétrica Positiva o sesgada a la derecha Sk > 0

Si es una Distribución Asimétrica Negativa o sesgda a la izquierda Sk < 0

Page 20: 5. Dispersion

Valor del Coef. AsimetríaValor del Coef. Asimetría CalificaciónCalificación

(-0.05(-0.05≤≤SSkk<0) ó (0<S<0) ó (0<Skk≤≤0.05)0.05) Casi simétricaCasi simétrica

(-0.3(-0.3≤≤SSkk<-0.05) ó (0.05<S<-0.05) ó (0.05<Skk≤≤0.30.3 Ligeramente asimétricaLigeramente asimétrica

(-0.6(-0.6≤≤SSkk< -0.3) ó (0.3 < S< -0.3) ó (0.3 < Skk≤≤0.6)0.6) ModeradamenteModeradamente

(S(Skk<-0.6) ó (S<-0.6) ó (Skk>0.6)>0.6) Muy asimétricaMuy asimétrica

Propiedades del Coeficiente de Asimetría (Continuación)

Page 21: 5. Dispersion

Renta familiar Longitud de piezas

Tamaño de partículasGasto en transporte

A B Longitud de piezas Tiempo entre accidentes

Page 22: 5. Dispersion

MEDIDAS DE KURTOSIS

)(2 1090

13

PPQQ

K

Mide el grado de deformación vertical de la distribución de Frecuencias y se define:

Si 0,2630 < K < 0,5 es una Distribución Leptokúrtica ( picuda o puntiaguda).

Si K< 0,2630 es una Distribución Mesokúrtica (moderada o normal).Si 0 < K < 0,2630 es una Distribución Platikúrtica (achatada o plana).

1.No tiene unidad de medida.

2.Se aplica a distribuciones unimodales con un valor del coeficiente de asimetría entre –0.3 y 0.3.

3.Su valor debe encontrarse en el intervalo 0 á 0.5.

Page 23: 5. Dispersion

DIAGRAMA DE CAJA (BOX-PLOT)DIAGRAMA DE CAJA (BOX-PLOT)Se construye del siguiente modo:

•Con los datos ordenados se obtienen los tres cuartiles

•Se dibuja un rectángulo cuyos extremos son Q1 y Q3 y se indica la posición de la mediana mediante una línea.

•Se calculan los límites de admisión ( los valores que queden fuera se consideran atípicos)

)QQ(5'1QLS

)QQ(5'1QLI

133

131

•Se dibuja una línea desde cada extremo del rectángulo hasta el valor más alejado no atípico.

•Se marcan todos los datos considerados como atípicos.

Page 24: 5. Dispersion

DIAGRAMA DE CAJA (BOX-DIAGRAMA DE CAJA (BOX-PLOT)PLOT)

Dato menor no atípicoMedia

Mediana

Dato mayor no atípico

Dato atípico

Box-and-Whisker Plot

Altura150 160 170 180 190 200

Dato atípicoQ1

Q3

Page 25: 5. Dispersion

PromedioPromedio 174.9174.9 MeMe 175.75175.75 MoMo 176.038462176.038462

S2S2 49.5949.59 Q1Q1 171.58333171.58333 Q3Q3 180.15180.15

SS 7.0427.042 LILI 158.73333158.73333

LSLS 193193

0

5

10

15

20

25

30

35

159.5 164.5 169.5 174.5 179.5 184.5