estadistica para la investigación (sesión4)
DESCRIPTION
ESTADISTICA, SPSS, LENIN, INVESTIGACIONTRANSCRIPT
Lenin H. Cari Mogrovejo
La dispersión es la variación en un conjunto de datos
que proporciona información adicional y permite juzgar
la confiabilidad de la medida de tendencia central.
¿QUÉ ES LA DISPERSIÓN?
CLASIFICACIÓN
Las medidas de resumen más importantes se
clasifican en tres grupos:
MEDIDAS DE TENDENCIA CENTRAL :
Media, mediana, moda
MEDIDAS DE FORMA
Asimetria y curtosis
MEDIDAS DE POSICIÓN :
Deciles, cuartiles, percentiles
MEDIDAS DE DISPERSIÓN :
Desviación estándar, varianza, coeficiente de variación
MEDIDAS DE FORMA
ASIMETRIA CURTOSIS
4
0,0000
0,0500
0,1000
0,1500
0,2000
0,2500
0,3000
0,3500
0,4000
0,4500
0,5000
4 5 6 70 1 2 3
Q1 Q2 Q3 Q4
Rango
EAI02
la curva que forman los valores de la serie presenta la misma
forma a izquierda y derecha de un valor central (media
aritmética).
(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de la media.
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se
tienden a reunir más en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se
tienden a reunir más en la parte derecha de la media.
ASIMETRIA:
analiza el grado de concentración que presentan los
valores alrededor de la zona central de la distribución.
Para detectar tanto asimetría como curtosis, es útil dibujarel histograma. Además, para asimetría se comparan lasmedidas de posición, Media, Mediana y moda.
CURTOSIS :
7
Si una distribución es simétrica, la media,
mediana y modo coinciden
• Si una distribución no es simétrica, las tres
medidas difieren.
Asimetría hacia la derecha
(asimetría positiva)
Media
MedianaModo
Media
Mediana
Modo
Asimetría hacia la izquierda
(asimetría negativa)
Media, Mediana y Moda
RENDIMIENTO RENDIMIENTO
NO ADECUADO ADECUADO
8
Asimetría hacia la derecha
(asimetría positiva)
Media
MedianaModo
Media
Mediana
Modo
Asimetría hacia la izquierda
(asimetría negativa)
CURTOSIS
(g2 = 0) la distribución es Mesocúrtica: (± 0.5 aprox.)
(g2 > 0) la distribución es Leptocúrtica
(g2 < 0) la distribución es Platicúrtica
Leptocúrtica: Cuando la distribución de
frecuencias es más apuntada que la normal.
Medidas de Apuntamiento
(Curtosis o Kurtosis)
Mesocúrtica: Cuando la distribución de frecuencias es tan
apuntada como la normal.
Medidas de Apuntamiento
(Curtosis o Kurtosis)
Platicúrtica: Cuando la distribución de frecuencias
es menos apuntada que la normal.
Medidas de Apuntamiento
(Curtosis o Kurtosis)
Asimetría Positiva
Mo < Me < X
Simetría
Mo = Me = X
Asimetría Negativa
Mo > Me > X
MEDIDAS DE POSICIÓN
CUARTILES: permiten dividir un conjunto de datos en 4
partes iguales.
DECILES: son muy parecidos a los cuartiles; pero dividen al
conjunto de datos en 10 partes iguales
PERCENTILES: también se lo conoce como centil, y
permite dividir un conjunto de datos en 100 partes iguales.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión nos permiten conocer si los
valores en general están cerca o alejados de los valores
centrales, muestran la variabilidad de una distribución
de datos, indicando por medio de un número si las
diferentes puntuaciones de una variable están muy
alejadas de la medida de tendencia central.
RANGO (AMPLITUD DE VARIACIÓN): Es la diferencia
entre el valor máximo y el mínimo en nuestros datos, esta
medida de dispersión aunque es la más fácil de obtener, en lo
general es muy poco usada.
MEDIDAS DE DISPERSIÓN
Dispersión: Amplitud Total
Amplitud Total = Valor Mayor – Valor Menor
VARIANZA
La varianza esta basada en las desviaciones con respecto a la
media.
VARIANZA: Es el promedio de los cuadrados de las
desviaciones de cada observación con respecto de la media.
Esta varianza es cero si todas las observaciones son iguales.
Existen dos tipos de varianza.
•Varianza poblacional.
•Varianza muestral.
VARIANZA POBLACIONAL: Varianza de toda la población.
Es el valor medio de las desviaciones con respecto a la media,
elevadas al cuadrado.
Su fórmula es:
El proceso para calcular la varianza poblacional es el siguiente:
1. Calcular la media aritmética.
2. Comprobar ٤(X-u) = 0, por cada número se resta la media
poblacional y se realiza la sumatoria.
3. Calcular (X-u) 2
4. Obtener varianza.
VARIANZA MUESTRAL: varianza de una muestra de la
población.
Su fórmula es:
La varianza muestral es el valor medio de las desviaciones
con respecto a la media, elevadas al cuadrado.
El proceso para calcularla es el siguiente:
1. Calcular X 2
2. Calcular ٤X y ٤ X 2
3. Reemplazar en la fórmula.
EJEMPLO DE DISPERSIÓN
8 cms.
Aquí tenemos 9 rectángulos cuya altura es de 8 centímetros (y todos
tienen la misma base).
¿Existe alguna variación respecto de su altura entre estos rectángulos?
¿Cuál es el promedio de la altura de estos rectángulos?
8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8
9=
72
9= 8
EJEMPLO DE DISPERSIÓN
El quinto rectángulo y el octavo rectángulo en un acto de rebeldía cambiaron su
altura. El quinto rectángulo, ahora de color rojo, mide 10 centímetros, y el
octavo rectángulo, de color azul, mide 6 centímetros?
¿Cuál es el nuevo promedio de estos 9 rectángulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9=
72
9= 8
... ¡el mismo promedio! Pero... ¿ha habido variación?
8 cms.
10 cms
6 cms
EJEMPLO DE DISPERSIÓN
El rectángulo rojo tiene +2 centímetros sobre el promedio, y el rectángulo azul
tiene –2 centímetros bajo el promedio. Los otros rectángulos tienen cero
diferencia respecto del promedio.
8 cms.
10 cms
6 cms
Si sumamos estas diferencias de la altura respecto del promedio, tenemos
0 + 0 + 0 + 0 + 2 + 0 + 0 – 2 + 0 = 0
Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin embargo,
ante nuestros ojos, sabemos que hay variación.
EJEMPLO DE DISPERSIÓN
8 cms.
10 cms
6 cms
Una forma de eliminar los signos menos de aquellas diferencias que sean
negativas, esto es de aquellos mediciones que estén bajo el promedio, es
elevar al cuadrado todas las diferencias, y luego sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectángulos, es decir lo dividimos por
el número de rectángulos que es 9
02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 =
9 9
8= 0,89
EJEMPLO DE DISPERSIÓN
8 cms.
10 cms
6 cms
Se dice entonces que la varianza fue de 0,89
Observemos que las unidades involucradas en el cálculo de la varianza están al
cuadrado. En rigor la varianza es de 0,89 centímetros cuadrados. De manera
que se define
0,89 0,943
La raíz cuadrada de la varianza se llama desviación estándar
EJEMPLO DE DISPERSIÓN
8 cms.
10 cms
6 cms
Que la desviación estándar haya sido de 0,943 significa que en promedio la
altura de los rectángulos variaron (ya sea aumentando, ya sea disminuyendo) en
0,943 centímetros.
Es claro que esta situación es “en promedio”, puesto que sabemos que los
causantes de la variación fueron los rectángulos quinto y octavo. Esta
variación hace repartir la “culpa” a todos los demás rectángulos que se
“portaron bien”.
La desviación estándar mide la dispersión de los datos respecto del
promedio
EJEMPLO DE DISPERSIÓN
8 cms.
10 cms
6 cms4 cms
8 cms.8 cms. 8 cms.7 cms.
8 cms.
¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos?
En primer lugar debemos calcular el promedio
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
9= 7,44
Luego debemos calcular la varianza
EJEMPLO DE DISPERSIÓN
8 cms.
10 cms
6 cms4 cms
8 cms. 8 cms. 8 cms.7 cms.
8 cms.
Promedio
7,44
0,56-
3,44
0,56 0,56 2,56 0,56 -
0,44-
1,440,56
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562
9
22,2224
9=
= 2,469Este es el valor de la varianza
EJEMPLO DE DISPERSIÓN10 cms
8 cms.
6 cms4 cms
8 cms. 8 cms. 8 cms.7 cms.
8 cms.
Promedio
7,44
Si la varianza fue de 2,469, entonces la desviación estándar es de...
2,469 1,57
Lo que significa que, en promedio, los rectángulos se desviaron más o menos
(más arriba o más abajo) en 1,57 centímetros.
DESVIACIÓN
Es la medida de dispersión mas utilizada, también se la
conoce como desviación típica, y es la raíz cuadrada de la
varianza.
Esta medida pretende conseguir que la medida de dispersión
se exprese en las mismas unidades que los datos u
observaciones, al igual que la varianza existen dos tipos:
•Desviación estándar poblacional
•Desviación estándar muestral.
DESVIACIÓN ESTÁNDAR POBLACIONAL: Para
toda la población o datos, es la raíz cuadrada de la
varianza poblacional.
DESVIACIÓN ESTÁNDAR MUESTRAL: Es un
estimado de la desviación estándar poblacional. Es la raíz
cuadrada de varianza muestral, su fórmula es:
Muchas gracias
Lenin H. Cari MogrovejoCel. [email protected][email protected]