7. metodologia y estadistica aplicada a la educacion

132
1 Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa UNSE LGE ESPACIO CURRICULAR METODOLOGÍA Y ESTADÍSTICA APLICADA A LA EDUCACIÓN Autores: Dra. Marta Graciela del Valle Pece Mg. Ing. Margarita Juárez de Galíndez Mg. Lic. María Mercedes Simonetti

Upload: maria-fatima-alfaro-ventimiglia

Post on 18-Nov-2014

2.309 views

Category:

Documents


9 download

DESCRIPTION

 

TRANSCRIPT

Page 1: 7. metodologia y estadistica aplicada a la educacion

1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

LGE

ESPACIO CURRICULAR METODOLOGÍA Y ESTADÍSTICA

APLICADA A LA EDUCACIÓN

Autores: Dra. Marta Graciela del Valle Pece

Mg. Ing. Margarita Juárez de Galíndez Mg. Lic. María Mercedes Simonetti

Page 2: 7. metodologia y estadistica aplicada a la educacion

2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

PROGRAMA DE ESPACIO CURRICULAR

UNIDAD I: Estadística Concepto. Etapas en el trabajo estadístico. Estadística Descriptiva e Inferencial. Variable: concepto. Clasificación de variables. Series simples. Agrupamiento de datos en series de frecuencias. Frecuencias absolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas, frecuencias relativas acumuladas y porcentajes acumulados. Tasas de uso común: de escolarización, de analfabetismo, de desgranamiento, de retención.

UNIDAD II: Presentación de datos estadísticos. Partes funcionales y construcción de tablas estadísticas. Elementos estructurales de las tablas. Tablas simples, cruzadas. Análisis de tablas estadísticas. Técnicas de representaciones gráficas. Reglas de construcción. Gráficos según los distintos tipos de variables.

UNIDAD III: Medidas de resumen. Medidas de tendencia central. Media aritmética, mediana y moda. Comparación de media, mediana y moda. Distribuciones simétricas y asimétricas. Medidas de dispersión. Rango, variancia y desviación estándar y desviación mediana. Coeficiente de variación. Medidas de localización. Percentiles y rango percentil. Aplicaciones.

UNIDAD IV: Nociones elementales de probabilidad. Inferencia estadística. Experimentos aleatorios: conceptos básicos. Probabilidad clásica, frecuencial y axiomática. Teorema de la suma y del producto de probabilidades. Tabla de contingencia. Cálculo de probabilidades. Distribución de probabilidades de variables aleatorias discretas: Uniforme y Binomial. Cálculo de probabilidad en variables aleatorias continuas: distribución normal y distribución normal estándar. Población. Definición de muestra aleatoria. Diseños de muestreo. Muestreo al azar simple. Muestreo sistemático. Muestreo por estratos. Muestreo por conglomerados. Concepto. Estimación puntual y por Intervalos de confianza para muestras grandes en el Muestreo al Azar Simple.

Page 3: 7. metodologia y estadistica aplicada a la educacion

3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

UNIDADES I y I I

INTRODUCCIÓN

La palabra Estadística proviene del latín status (estado). Precisamente la primera aplicación de la estadística consistió en la recopilación de datos y la construcción de gráficos para describir el estado de un país. Con el correr del tiempo esta herramienta fue evolucionando hasta que en la actualidad podríamos decir que no hay aspectos de la vida cotidiana donde no se aplique la Estadística. Hogares, gobiernos y negocios se apoyan en datos estadísticos para dirigir sus acciones.

El objetivo que se persigue con este módulo es proporcionar al docente herramientas y técnicas para obtener datos, procesarlos para obtener información que sirva para la interpretación correcta de fenómenos que se producen en su ámbito de trabajo.

ESTADÍSTICA. CONCEPTOS.

La Estadística es una colección de métodos para planear experimentos, obtener datos, y después organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en ellos (Triola, 2004).

Otra definición considera a la Estadística como una disciplina perteneciente a la Matemática Aplicada que se dedica al estudio cuantitativo de fenómenos colectivos. Proporciona los métodos para:

• La recolección de datos • Su ordenamiento, resumen y presentación, • Su análisis e interpretación y • Posterior enunciado de conclusiones.

Los cuatro pasos que se han enumerado constituyen las etapas del trabajo estadístico.

La primera etapa tiene como objetivo recolectar datos proveniente de medición, conteo u observación efectuado sobre el material objeto de estudio en base a un plan formulado según los principios del diseño experimental y las técnicas de muestreo.

Page 4: 7. metodologia y estadistica aplicada a la educacion

4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

La segunda etapa consiste en ordenar los datos en tablas estadísticas, presentarlos mediante gráficos y diagramas y resumirlos a través del cálculo de promedios, porcentajes e índices.

En la tercera etapa se analizan los resultados obtenidos en la etapa anterior, y comienzan a distinguirse las características del fenómeno, lo que permite utilizar diferentes métodos para analizarlos e interpretarlos.

En la última etapa se debe concluir acerca del estudio realizado.

Si las conclusiones, se refieren exclusivamente a los datos de los que se dispone (una parte de la población que se desea estudiar), se dice que la Estadística es Descriptiva .

Si por el contrario, las conclusiones van más allá de los datos que se dispone y se refieren a un conjunto mayor (población), del cual se extrajeron, se dice que la Estadística es Inferencial ; las conclusiones van de lo particular (muestra) a lo general (la población).Esta se basa en el estudio de la teoría de probabilidades que nos permite medir el error de nuestras afirmaciones.

Las estadísticas (en plural) se obtienen como resultado del trabajo estadístico y están constituidas por porcentajes, promedios, tablas, gráficos y otros elementos que describen un fenómeno y ayudan a su comprensión (Ej.: estadísticas demográficas, estadísticas del fútbol, estadísticas de accidentes de tránsito, estadísticas universitarias, etc.).

Es necesario definir algunos conceptos importantes: por ejemplo

Población. Se define población como el conjunto de individuos u objetos que comparten una característica común, en la que el investigador está interesado.

Muestra. Es un subconjunto de la población. Debe ser representativa, es decir se deben mantener las mismas características de la población en estudio.

Una población puede ser finita o infinita.

Población finita Una población finita es aquella que puede ser físicamente listada

Población infinita. Una población es infinita, cuando en la práctica no puede ser físicamente listada

Page 5: 7. metodologia y estadistica aplicada a la educacion

5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Ejemplo. Una población puede ser definida como los alumnos de la escuela San Francisco. Los alumnos pueden ser listados e individualizados a través de los registros áulicos. Es un ejemplo de población f inita.

Personas portadoras de SIDA en Santiago del Estero, constituyen un ejemplo de población infinita.

Unidad de observación: es aquélla sobre la cual se efectúan las mediciones u observaciones. La unidad de observación puede ser una persona, una familia, una planta, una parcela, etc.

Dato: es el valor que se obtiene de la medición, observación o conteo efectuada en la unidad de observación o unidad de muestreo.

Por ejemplo si el objetivo de una investigación es el rendimiento de los alumnos, la unidad de observación es el alumno.

El número de materias rendidas contadas en un alumno es el dato.

El conjunto de datos obtenidos de cada unidad de observación constituirá la base para el análisis estadístico del rendimiento de los alumnos de la escuela San Francisco.

Variables. Concepto y tipos.

Variable. Una variable es cualquier característica que varía de una unidad de muestreo a otra en la población o en la muestra

Ejemplo 1: Supóngase que interesa conocer la salud de los alumnos, entonces la variable a observar en cada alumno será el estado de salud, el que podrá asumir dos valores: sano o enfermo.

Ejemplo 2: Si interesa saber el número de hermanos que posee cada alumno, se tendrá valores que van desde 0(ningún hermano), 1, 2...,n y se deberá contar cuantos hermanos posee cada alumno.

Page 6: 7. metodologia y estadistica aplicada a la educacion

6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Ejemplo 3: Si el objetivo de un estudio fuera la talla alcanzada por alumnos, se debe medir la variable altura la que, expresada en metros podrá tener valores mayores a 1 metro.

En los tres ejemplos anteriores, el nombre de la variable y la forma de obtener sus valores está resaltado en negrita. En el primer ejemplo, los valores que puede asumir la variable son calidades, por lo que se dice que la variable es cualitat iva. Las calidades o categorías pueden ser naturales como al definir la variable sexo, o arbitrarias como la clasificación de alturas en bajas, medianas y altas.

Por el contrario, en los otros dos ejemplos los valores que asumen las variables pueden expresarse mediante números, por lo que las dos últimas variables son cuantitativas. En el caso de número de hermanos, la variable toma sólo determinados valores en el intervalo que va de cero a n por lo que se la denomina variable cuantitat iva discreta o discontinua; cuando la variable toma los infinitos valores dentro del intervalo se dice que la variable es cuantitativa continua

Otra forma de clasificación de las variables es mediante el empleo de cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. Cuando se manejan datos reales el nivel de medición es importante ya que orienta sobre el procedimiento estadístico a utilizar.

Un nivel de medición es nominal cuando los valores de variables son nombres, etiquetas o categorías y no se puede establecer un orden entre ellos.

Ejemplo: colores de ojos, estado de salud, lugar de nacimiento de un alumno. Aunque las ciudades pueden ser ordenadas según su tamaño, densidad poblacional, grado de contaminación del aire, etc., en general, la variable “lugar de nacimiento” no tiene un orden establecido

Con estos datos no es posible realizar cálculos. A veces se asignan números a las diferentes categorías; a la variable salud que posee dos valores sano y enfermo, podemos codificarlas numéricamente de la siguiente manera 1= sano, 2= enfermo pero esto no es nada más que una codificación y tales números no tienen significado computacional.

Un nivel de medición es ordinal cuando se puede establecer un orden entre las categorías de la variable. Ejemplo: máximo nivel de instrucción alcanzado por los padres de los alumnos: analfabeto, primario, secundario, terciario, universitario.

Page 7: 7. metodologia y estadistica aplicada a la educacion

7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Lo único que podemos decir es que el nivel de instrucción secundario es mayor que el primario y que el universitario es mayor que el primario, secundario o terciario, pero no podemos decir cuanto mayor es una categoría de la variable respecto a la otra.

Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5.

Si bien se podría hacer la diferencia entre 2­1=1 y 4­3=1, este resultado 1 no significa que entre el primario y el analfabeto hay la misma cantidad de conocimiento que entre el universitario y el nivel terciario.

Otro nivel de medición es el de intervalo. En este nivel la diferencia entre dos valores de datos tiene un significado. En este nivel no hay un cero natural, donde nada de la cantidad esté presente. El valor del cero es convencional

Ejemplo: La variable Temperatura está medida en escala de intervalo. Un termómetro por ejemplo, mide la temperatura en grados que son del mismo tamaño en cualquier punto de la escala. Aquí no existe un punto de partida natural, el valor 0° es arbitrario y no representa la ausencia total de calor. La diferencia entre 20ºC y 21ºC es la misma que entre 12ºC y 13ºC Se pueden realizar operaciones de suma y resta pero no cociente entre valores.

Por último el nivel de medición de razón o cociente aunque se parece al nivel de medición de intervalo tiene un punto de partida o cero inherente (donde cero indica que nada de la cantidad está presente). Para los valores en este nivel tanto las diferencias como los cocientes tienen significado. En este nivel se pueden realizar todas las operaciones. Ejemplo: Los precios de los libros de texto (0$ representa ningún costo y un precio de $60 es dos veces más costoso que uno de $30).

Page 8: 7. metodologia y estadistica aplicada a la educacion

8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Series de datos. Series simples

El conjunto de valores de una variable constituye una serie de datos. Se presentan a continuación series de datos referidas a los tres ejemplos que se dieron para ilustrar tipos de variables:

Ejemplo 1: En el año 2004, se examinan 30 alumnos de un Curso de EGB1 de la escuela San Francisco y se anota su estado de salud (S=Sano, E=Enfermo).

Generalmente las variables se designan con las últimas letras del abecedario en mayúscula por ej. X y los valores que toma la variable con x minúscula; incluso se coloca x i donde el subíndice i indica el número de individuo observado; de éste modo las 30 observaciones son:

x i : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S, S, S, S, S.

El subíndice “ i “ varía de 1 a 30. Así, x1 = S; x7 = S; X14 = E; . . . x30 =S.

Ejemplo 2: Un maestro de la Escuela San Martín interroga a sus 30 alumnos de primer grado de EGB1 sobre el número de hermanos que poseen. Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0.

Variable Categórica o cualitativa

Variable numérica o cuantitativa

Escala nominal

Escala ordinal

Escala de intervalo minal

Escala de razón

Datos

Page 9: 7. metodologia y estadistica aplicada a la educacion

9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

El subíndice “i“ va desde 1 a 30 y entonces x1 = 4; x5 = 0; x12 = 5; . .; x30 =0.

Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de Sección Maternal de la Escuela San Francisco la que expresada en cm es la siguiente:

xi(cm): 70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,86,78, 74.

Ahora “i” va desde 1 a 25, entonces x1 = 70; x2 = 75; . . .; x25 =74.

Los datos en bruto, tal cual fueron obtenidos, sin agrupar const ituyen una serie simple.

Tablas y gráficos

Organización de datos categóricos o cualitativos.

Cuando la masa de datos obtenidos es muy grande y éstos están desordenados, no dan información alguna; conviene por lo tanto ordenarlos y tabularlos, haciendo uso de tablas estadísticas, que deben confeccionarse de tal modo que los datos resulten fáciles de ser leídos e interpretados. Con los datos del ejemplo 1 se puede construir una tabla de frecuencias.

Tabla de frecuencias. Una tabla de frecuencias para variable cualitativa, es una tabla que asocia cada categoría de la variable con el número de veces que se repite la categoría.

Tabla 1. Alumnos de un curso EGB1, de la Escuela San Francisco, según estado de salud. Año 2004.

i Categorías:xi (Estado de salud)

Frecuencias: fi (nº de alumnos)

1 Sano 24 2 Enfermo 6

Total 30 Fuente: Datos ficticios

Page 10: 7. metodologia y estadistica aplicada a la educacion

1 0

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Frecuencia absoluta: Es el nº de veces que se repite cada categoría de la variable. Se la simboliza con fi.

La suma de las frecuencias absolutas, es igual al nº total de observaciones,

en éste caso 30 ( ∑

=

2

1 i i f =30). Nótese que “ i “ ahora se refiere a las

categorías, x1 = Sano, f1 = 24; x2 = Enfermo, f2= 6.

La tabla de frecuencias, es la más sencilla de las tablas y es una tabla de simple entrada pues los individuos se clasifican según una única variable, estado de salud en el ejemplo .

Los datos organizados en tabla de simple entrada para variable cualitativa, pueden presentarse mediante gráficos, que tiene la finalidad de que la información entre por los ojos. El gráfico que puede usarse en éste caso es el gráfico de barras.

Gráfico 1a. Alumnos de un curso EGB1, de la Escuela San Francisco, según estado de salud. Año 2004.

0

5

10

15

20

25

30

Sanos Enfermos

Estado de salud

Nº de alumno

s

Fuente: Datos ficticios .

Para su construcción se utiliza el sistema de coordenadas ortogonales. Sobre el eje horizontal se colocan las distintas categorías de la variable en estudio (estado de salud) y sobre el eje vertical con una escala adecuada, se representan las frecuencias. Se dibujan barras de ancho

Page 11: 7. metodologia y estadistica aplicada a la educacion

1 1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

constante, una para cada valor de la variable, con una altura que representa el valor de la frecuencia que corresponde a cada categoría. Es conveniente que la separación entre las barras sea menor que el ancho de las mismas.

El ancho de las barras debe elegirse teniendo en cuenta el espacio disponible, el número de categorías de la variable a representar y la altura que les corresponde, con el objeto de obtener un gráfico proporcionado. Las barras pueden dibujarse en sentido vertical u horizontal.

Gráfico 1b. Alumnos de un curso EGB1, de la Escuela. San Francisco, según estado de salud. Año 2004

Fuente: Datos ficticios

En algunos trabajos es necesario calcular frecuencias relativas.

Frecuencia relativa de una categoría es la proporción de veces que ocurre dicha categoría.

Se obtiene dividiendo la frecuencia absoluta de cada categoría entre la suma de las frecuencias de todas las categorías. La suma en éste caso es

f1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo ∑ que se denomina sumatoria, así

30 6 24 2 1

2

1

= + = + = ∑ =

= f f fi

i

i

0 5 10 15 20 25 30

Sanos

Enfermos

Estad

o de

salud

Nº de alumnos

Page 12: 7. metodologia y estadistica aplicada a la educacion

1 2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

a la frecuencia relativa de la clase i­ésima se la simboliza con fri y se la calcula de la siguiente manera:

fr f f i i

i

= ∑

La suma de las frecuencias relativas es siempre igual a 1.

∑ =

= n

i i fr

1

1

Si se multiplica las frecuencias relativas por 100 se obtienen porcentajes. En éste ejemplo sería:

Tabla 2. Alumnos de un curso EGB1, de la Escuela. San Francisco, según estado de salud. Año 2004.

i x i

(Estado de salud) f i fri Porcentajes:

% 1 Sano 24 24/30=0,80 80

2 Enfermo 6 6/30=0,20 20

Total 30 1.00 100

Fuente: Datos ficticios

Se pueden representar los datos de la tabla 2 mediante un gráfico de barras, sólo que en el eje vertical van los porcentajes.

Gráfico 2. Alumnos de un curso EGB1, de la Escuela San Francisco, según estado de salud. Año 2004.

Fuente: Datos ficticios

0

20

40

60

80

100

sanos enfermos

Estado de salud

%

Page 13: 7. metodologia y estadistica aplicada a la educacion

1 3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Otro gráfico adecuado para representar series de frecuencias de variable cualitativa es el gráfico de sectores circulares, llamado gráfico de tortas o pie charts.

Tabla 3. Alumnos de un curso EGB1, de la Escuela San Francisco, según sexo. Año 2004

Sexo fi (nº de

alumnos)

fri 360ºxf ri

Varones 15 0,38 137º Mujeres 25 0,62 223º Total 40 1,00 360º

Fuente: Datos ficticios

Se elige un radio por ej 3cm (el valor del radio se elige según el espacio que se disponga para el gráfico) y se grafica un círculo. La superficie de dicho círculo representa el total de alumnos (40), en consecuencia, le corresponde un ángulo de 360°. Se puede discriminar mediante sectores circulares la porción que corresponde a las mujeres y a los varones. Los grados correspondientes a los sectores se obtienen multiplicando la frecuencia relativa por 360º.

Gráfico 3. Alumnos de un curso EGB1, de la Escuela. San Francisco, según sexo. Año 2004

Fuente: Datos ficticios

38%

62%

Varones Mujeres

Page 14: 7. metodologia y estadistica aplicada a la educacion

1 4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Variables cuantitativas. Ejemplo: Nº de hermanos que tienen los alumnos de primer grado de EGB1 de la escuela San Martín Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0

Para el caso de variables cuantitat ivas discretas, la tabla de frecuencias se construye de la siguiente manera: se ubica el valor mayor y el menor valor de la variable (en el ejemplo 2 del n° de hermanos por alumno, el menor valor es cero y el valor mayor 6), se colocan todos los valores correspondientes en la primera columna de la tabla, y luego se cuentan las veces que se presentan dichos valores. La tabla resultante es:

Tabla 5. Alumnos de primer grado de EGB1 de la escuela San Martín según Nº de hermanos

Xi fi Fi fr % 0 5 5 0,17 17 1 5 10 0,17 17 2 6 16 0,20 20 3 3 19 0,10 10 4 4 23 0,13 13 5 3 26 0,10 10 6 4 30 0,13 13

Total 30 1,0 100 Fuente: Datos ficticios

La diferencia que existe entre cada clase es constante e igual a 1.

Además de las frecuencias relativas (cuyo cálculo se explicó en párrafos anteriores) aquí se puede calcular también las frecuencias acumuladas Fi. La frecuencia acumulada de una clase se obtiene sumándole a la frecuencia de la clase, la frecuencia de las clases anteriores.

F (0)=5 F (1)=5+5=10 F (2)=5+5+6=16 = Fi (1)+6

La tabla de frecuencias para variables cuantitativas discretas se representa mediante un gráfico de bastones. En la abscisa se colocan los valores de la variable y se levanta para cada uno de ellos una línea de altura igual a su frecuencia.

Page 15: 7. metodologia y estadistica aplicada a la educacion

1 5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Gráfico 4. Alumnos de primer grado de EGB1 de la escuela San Martín según Nº de hermanos

0 1 2 3 4 5 6 Número de hermanos

0

1

2

3

4

5

6 frecuencia

Fuente: Datos ficticios

Interpretación: El número 6 en la columna de fi significa que 6 alumnos tienen 2 hermanos El número 19 en la columna Fi significa que 19 alumnos tienen 3 hermanos o menos El número 20 en la columna de porcentajes significa que el 20% de los alumnos tienen 2 hermanos

Para el caso de variables cuantitativas continuas como los datos del ejemplo 3 (altura en cm. de 25 alumnos de una sección maternal de la Escuela San Francisco) que fueron obtenidos por medición, se recomienda construir intervalos de clase, cuya amplitud depende de la cantidad de intervalos que se deseen construir y la cantidad de datos que posee la serie simple. Es recomendable que los intervalos de clases sean iguales, es decir que la amplitud de los mismos (a) sea constante. La técnica a emplear para el agrupamiento de una serie simple de variable cuantitativa continua es sencilla.

Page 16: 7. metodologia y estadistica aplicada a la educacion

1 6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

xi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79, 78, 95, 99, 97, 84, 86, 78, 74

1. ­Se ubica el valor mayor que toma la variable (99 cm) y el valor menor (70 cm).

2. ­ Se obtiene la diferencia, la que se denomina Rango o amplitud de variación y se designa con la letra R.

29 70 99 min max = − = − = x x R 3.– El número de intervalos aproximado se puede calcular con la siguiente fórmula:

log(2) 1) log(n intervalos de +

= ° n

dónde n: n° de valores de la serie o tamaño de la muestra log: logaritmo decimal

ervalos int 5 7004 . 4 ) 2 log( ) 1 25 log( . erv int de n ≈ =

+ = °

Cuando en la variable que se estudia existen intervalos predeterminados, el número de clases o intervalos dependerá de la amplitud que se usa habitualmente.

4. ­ El rango se divide entre el nº de clases o intervalos de clases, 5 para éste ejemplo, (se recomienda que el número de intervalos no sea menor que 5, ni mayor de 15, pues en el primer casos se reduce demasiado la información y en el segundo no se cumple con el objetivo del agrupamiento) obteniéndose una idea aproximada de la longitud o amplitud del intervalo de clase.

6 8 . 5 5 29

int º ≅ = = =

ervalos de n Rango a

Éste valor de amplitud es orientativo, por lo que se decide tomar una amplitud de intervalo 5 cm para facilitar el agrupamiento.

5.­ Se delimitan las clases buscando preferentemente valores enteros para sus límites. Se debe elegir el límite inferior del 1 er intervalo de tal manera que contenga al menor valor de la serie (70 cm). La elección recae en el 70. El límite superior del 1 er intervalo, se obtiene sumando al Li la amplitud.

Page 17: 7. metodologia y estadistica aplicada a la educacion

1 7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Li del 1 er intervalo = 70 Ls del 1 er intervalo = Li + a= 70 + 5 = 75

El límite inferior del 2 do intervalo debe coincidir con el límite superior del primer intervalo.

Li del 2 do intervalo = 75 Ls del 2 do intervalo Li + a= 75+ 5 = 80

El límite inferior del 3 er intervalo debe coincidir con el límite superior del 2 do intervalo, y así sucesivamente, hasta que el límite superior del último intervalo, contenga el valor observado más alto de la variable.

6.­ Una vez formadas las clases se procede al conteo, que consiste en determinar el nº de observaciones (frecuencias) de cada clase. Una manera sencilla de hacerlo es leyendo la serie simple y ubicando mediante marcas cada valor de la variable en su clase correspondiente. De ésta manera cuando se termine de pasar lista a la serie simple, el agrupamiento ha sido efectuado.

Tabla 6. Alumnos de Sección maternal de la escuela San Francisco según su altura.

Intervalo de clase (altura en cm)

xi

(marca de clase) fi fri

70 a 75 72.5 4 0.16 75 a 80 77.5 5 0.20 80 a 85 82.5 4 0.16 85 a 90 87.5 5 0.20 90 a 95 92.5 1 0.04 95 a 100 97.5 6 0.24

Total 25 1.00 Fuente: Datos ficticios

Un problema que se puede presentar es el siguiente: si un valor de la variable coincide con uno de los límites del intervalo, por ejemplo la altura 95 cm ¿dónde se lo ubica? ¿en el quinto o en el sexto intervalo de clase? La respuesta es: puede ubicarlo en cualquiera de los intervalos, pero si se elige un criterio se lo debe respetar hasta el final del agrupamiento. En éste ejemplo al nº 95 se lo ubica en el 6° intervalo, de la misma manera, cuando aparezca por ejemplo un valor 85, debe ser anotado como perteneciente al intervalo en el que el nº 85 se encuentra como límite inferior. El intervalo de clase es cerrado en el límite inferior y abierto en el

superior. Esto se indica de la siguiente forma [ ) 80 ; 75 los valores del intervalo van desde 75 a 79,9999.

Page 18: 7. metodologia y estadistica aplicada a la educacion

1 8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

7.­ Se agrega una tercera columna, titulada “marca de clase” o “punto medio de clase” que se designa con xi que contiene los valores correspondientes a los puntos medios de cada uno de los intervalos y se calcula así:

5 , 72 2 75 70

2 1 1

1 = +

= +

= Ls Li x

5 , 77 2 80 75

2 2 2

2 = +

= +

= Ls Li x

También se puede calcular de la siguiente manera

5 , 77 5 5 , 72 1 2 = + = + = a x x

Al efectuar el agrupamiento, se pierde detalle de la información ya que, por ejemplo, de los valores que resultaron ubicados en la primera clase, sólo se sabe ahora que se encuentran entre 70 y 75. Por eso, en caso de ser necesario asignar un valor a cada uno de ellos, como es en el cálculo de la media aritmética a partir de la tabla de frecuencias, se opta por pensar que todos tienen igual valor, que es el correspondiente al punto medio de clase.

Un gráfico adecuado para representar una serie de frecuencias de variable cuantitativa continua es el histograma (gráfico nº 5). Su construcción es fácil. Se utiliza el sistema de coordenadas cartesianas ortogonales. En el eje de las ordenadas (vertical) se marcan las frecuencias (fi) y en el de las abscisas (horizontal), la variable según la cual se efectuó la clasificación (altura). Consiste en rectángulos adyacentes (uno por cada clase) con bases materializadas por la amplitud de clases (5 cm). La altura está dada por la frecuencia correspondiente a la clase. Cuando las clases son iguales, el área del histograma es proporcional a la frecuencia total.

Page 19: 7. metodologia y estadistica aplicada a la educacion

1 9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Gráfico 5.Alumnos de Sección maternal de la escuela San Francisco según su altura

Fuente: Datos ficticios

Otro gráfico adecuado para representar la serie de frecuencias de variable cuantitativa continua es el polígono de frecuencias (gráfico 6). Se emplea para su realización el sistema de coordenadas cartesianas ortogonales. Se coloca la variable clasificadora en el eje horizontal y las frecuencias en el vertical.

La construcción es sencilla, se marcan tantos puntos como pares de valores (xi,fi) o sea marcas de clase, frecuencias haya en la tabla. En la tabla Nº 6 vemos que hay 6 pares de valores; el primer par tiene abscisa 72,5 y ordenada 4 y así sucesivamente hasta marcar el sexto par. Luego se unen los puntos mediante trazos rectos. Algunos autores, en su afán de mantener la proporcionalidad entre la superficie y la frecuencia aconsejan cerrar el polígono de frecuencias uniendo el primer punto con la marca de clase inmediata anterior y el último punto con la inmediata superior; en éstos dos casos la unión de los puntos se realiza con trazos cortados.

La principal ventaja de los polígonos de frecuencias consiste en que ellos permiten dibujar en el mismo sistema de eje dos o más polígonos correspondientes a series diferentes que tengan similar posición sobre el eje de las x, así se puede compararlos, lo cual resulta engorroso efectuar con los histogramas a causa de la superposición de las superficies de los rectángulos.

0 1 2

3 4

5 6

7

70 75 80 85 90 95 100

Altura (cm)

Nº a

lum.

Page 20: 7. metodologia y estadistica aplicada a la educacion

2 0

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

0

1

2

3

4

5

6

7

65 70 75 80 85 90 95 100 105

Altura(cm)

Nº de alumno

s

Gráfico 6.Alumnos de Sección maternal de la escuela San Francisco según su altura

Fuente: Datos ficticios

Como cada miembro de una población presenta diversas características, se puede necesitar clasificarlos de acuerdo a dos de ellas. Cuando el número de individuos medidos es pequeño, se enumeran todos los pares de observaciones, si alguno de ellos aparece dos veces, se lo repite y la presentación suele hacerse de modo que una de las dos variables esté ordenada.

Tabla 9. Alumnos de una escuela según su peso y altura. Peso (kg)

39 40 41 42 43 43 44 45 50 52

Alt (m) 1,27 1,30 1,30 1,31 1,34 1,35 1,37 1,39 1,45 1,49 Fuente: Datos ficticios

Para representar estos datos que corresponden a dos variables cuantitativas continuas se utilizan los gráf icos de dispersión o scatter plot, que se construye de la siguiente manera: se coloca una de las variables en las abscisas o eje horizontal, por ejemplo la altura y la otra variable, el peso, en el eje vertical, con sus escalas correspondientes, luego se marcan tantos puntos como pares de valores (xi, yi) se tengan.

Page 21: 7. metodologia y estadistica aplicada a la educacion

2 1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

1,25

1,3

1,35

1,4

1,45

1,5

1,55

35 40 45 50 55

Peso (kg)

Altu

ra (m

) Gráfico 7. Alumnos de una escuela según su peso y altura

Fuente: Datos ficticios

Éste gráfico sirve para mostrar la relación entre las dos variables y se usa cuando para el mismo valor de xi se tiene diferentes valores de yi. Si esto no ocurre puede utilizarse el gráfico lineal, que se construye de igual manera que el anterior, con la única diferencia que se unen los puntos. Éste gráfico, se suele emplear, especialmente, en los casos donde la variable que se representa en el eje horizontal es el tiempo. De éste modo se puede ver la evolución de la otra variable en el período considerado. Pueden representar simultáneamente en el mismo gráfico dos o más variables, como se observará al representar gráficamente los datos de la tabla Nº 10

Tabla 10. Inasistencias mensuales de alumnos de Segundo grado A de EGB1 de la Escuela San Martín según sexo

N° de inasist. Meses Mujeres Varones

Marzo 3 4 Abril 5 7 Mayo 2 4 Junio 6 5 Julio 8 8

Agosto 4 5 Sept. 3 4

Octubre 4 3 Noviem. 5 2 Diciem. 1 6

Fuente: Datos ficticios

Page 22: 7. metodologia y estadistica aplicada a la educacion

2 2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

0

1

2

3

4

5

6

7

8

9

M A M J J A S O N D Meses

Nº d

e inasistenc

ias

Mujeres

Varones

Gráfico 8. Inasistencias mensuales de alumnos de Segundo grado A de EGB1 de la Escuela San Martín según sexo

Fuente: Datos ficticios

Cuando los pares de valores son muy numerosos, las tablas se presentan según lo muestra la tabla 11; en éste caso se dice que las tablas son de doble entrada pues son dos las variables de clasificación.

Tabla 11. Alumnos de la escuela Nº 42 según ocupación de la madre y lugar de residencia.

Barrios Total Ocupación de la

Madre A B C A. de casa 400 500 200 1100 Profesional 200 200 50 450 Empleada 300 400 100 800

Total 900 1100 350 2350 Fuente: Datos ficticios

En este ejemplo cada alumno se caracteriza según la variable Ocupación de la madre (variable cualitativa nominal) y Barrio de residencia (variable cualitativa nominal).

Page 23: 7. metodologia y estadistica aplicada a la educacion

2 3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Los valores que se encuentran en la celda son frecuencias, es decir representan la cantidad de alumnos que comparten las dos características.

Las partes de una tabla son:

La matriz, formada por la primera fila, lleva los encabezamientos de las columnas y / o la primera columna que titula a las filas.

El cuerpo constituido por celdas.

La información proporcionada por los valores de las celdas se completa con la suministrada por los encabezamientos de las filas y columnas; en las celdas se encuentra la frecuencia, es decir la cantidad de elementos o individuos que poseen las dos características.

Por ejemplo el 100 de la última celda significa que en esa escuela hay 100 alumnos que viven en el Barrio C y cuyas madres son empleadas.

El gráfico que se utiliza para representar éste tipo de tablas es el gráf ico de barras compuestas (gráfico 9) y el gráfico de barras agrupadas (gráfico 10).

Gráfico de barras compuestas

La construcción del gráfico de barras compuestas es sencilla. Se comienza dibujando las barras como si fueran simples es decir con las alturas correspondientes a los totales y luego se yuxtaponen los valores parciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se procede de la siguiente manera: se marca una barra de altura 900, en ella se indica la subdivisión que corresponde a alumnos cuyas madres son amas de casa con el valor 400; para marcar el nº de alumnos que es 200, se marca 400+200=600 en el eje vertical lo que queda corresponde nº de alumnos cuyas madres son empleadas. De igual manera se procede con los barrios B y C.

Page 24: 7. metodologia y estadistica aplicada a la educacion

2 4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Gráfico 9. Alumnos de la escuela Nº 42 según ocupación de la madre y lugar de residencia

0

200

400

600

800

1000

1200

A B C

Lugar de residencia

Nº d

e alum

nos

Empleada

Profesional A. de casa

Fuente: Datos ficticios Gráfico de barras agrupadas

Sirven para representar fenómenos similares a los que originan barras compuestas. La diferencia con éstas estriba en que, para cada valor de la variable independiente “x” en éste ejemplo lugar de residencia, se dibujan grupo de barras . El número de barras en cada grupo es el del número de categorías de la segunda variable, en este ejemplo ocupación de las madres.

Gráfico 10. Alumnos de la escuela Nº 42 según ocupación de la madre y lugar de residencia

0

100

200

300

400

500

600

A B C

Lugar de residencia

Nº de

alumno

s

A. de casa

Profesional

Empleada

Fuente: Datos fict icios

Page 25: 7. metodologia y estadistica aplicada a la educacion

2 5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Otro tipo de gráficos son los gráficos de figuras o pictogramas. Son los más indicados para publicaciones de divulgación popular, por su fácil e inmediata interpretación. Consisten en dibujos esquemáticos y relacionados con el fenómeno a representar. Cada figura es equivalente a una cantidad determinada, preferentemente entera, de unidades de la variable dependiente y el número de unidades no su tamaño, es proporcional a la magnitud a representar.

Cartogramas: Se emplean cuando es importante señalar la distribución geográfica de un determinado acontecimiento, razón por la cual se construyen sobre planos o mapas.

Cartogramas de señalización (Gráfico 11): Sirven para indicar la distribución de una variable cualitativa sobre una base geográfica. Mediante figuras, colores o diferentes rayados se señala que hay en lugares determinados.

Gráfico 11. Qué es lo que caracteriza a cada provincia argentina.

Fuente: Pensando en Plural. División de educación tributaria. AFIP. Mayo 2005. ISBN Nº987­9101­26­X

Page 26: 7. metodologia y estadistica aplicada a la educacion

2 6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

En este mapa, se observa lo que caracteriza a cada provincia argentina. Por ejemplo en Santiago del Estero las aguas termales; en La Pampa la producción de trigo, etc...

Cartogramas de densidad: además de indicar que hay y dónde, de ellos se puede obtener la información de cuánto hay. Mediante diferente rayado o colores y también utilizando barras sobre la base geográfica, se puede expresar la cuantía del fenómeno como así también su ubicación. Suelen utilizarse pictogramas, gráficos de líneas, en general cualquiera de los descriptos, sobre el mapa o plano.

Resumiendo: los datos se ordenan, clasifican y presentan en formas de tablas. Las tablas pueden de ser de simple entrada(cuando los individuos se clasifican según una variable), de doble entrada(cuando los individuos se clasifican según dos características) y de triple o más entradas (cuando se clasifican los datos según tres o más variables).Las tablas se complican a medida que se agregan más variables, por lo tanto es preferible varias tablas sencillas a una complicada.

Toda tabla debe llevar título, el cuál debe responder a las preguntas ¿Según?, ¿Qué?, ¿Cuándo? y ¿Dónde?.

No se debe olvidar la fuente de datos que indica de donde proviene la información.

Se debe incluir los totales.

En caso de expresar los datos en porcentajes, deben indicarse los totales de los cuales provienen.

Con respecto a los gráficos, éstos constituyen una de las formas más útiles de presentación de datos estadísticos. Su importancia reside en las múltiples formas que pueden adoptar, lo que permite su aplicación a una amplia gama de finalidades: didácticas, de investigación, etc. Sirven para mostrar la relación entre una o más variables. La variedad de tipo de representaciones gráficas exige una cautelosa elección de acuerdo a su finalidad. La selección de la presentación gráfica debe, por lo tanto tener los siguientes aspectos:

Tipo de análisis estadístico, características y número de los fenómenos o variables a representar y público al que va dirigido.

Page 27: 7. metodologia y estadistica aplicada a la educacion

2 7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Recomendaciones para la construcción correcta de un gráfico.

Una vez elegido el tipo de gráfico adecuado, es conveniente no descuidar las siguientes consideraciones:

• Decidir cuál de las variables es la independiente “x” y cuál la dependiente “y”.

• La representación gráfica debe ser sencilla, simple y explicarse por sí misma.

• Título se coloca encabezando el gráfico y debe responder a las preguntas; qué, según, cuándo, dónde?.

• Fuente de datos. Se coloca al pie del gráfico.

• Escalas se elige de tal modo que no alteren la objetividad de la representación, hecho éste muy utilizado para fines publicitarios donde es común ver escalas construidas con el propósito de alterar el fenómeno exagerando ventajas y enmascarando la realidad, o lo que es peor aún eliminando la graduación de los ejes, evitando de ésta forma todo patrón de comparación. Las escalas deben construirse buscando obtener como resultado un dibujo armónico y proporcionado.

• Debe nominarse los ejes de modo tal que no quede duda alguna acerca de las variables que en ellos se representan.

• No olvidar el corte de ejes en caso de ser necesario. Éste debe efectuarse entre el 0 y el valor mínimo a representar.

• Aclaración de las unidades de representación.

• Las referencias serán colocadas al pie o al costado del gráfico.

• En caso de usarse abreviaturas, éstas serán aclaradas con la debida extensión, en el renglón siguiente al correspondiente a las fuentes.

• En lo posible acompañar los gráficos con las tablas estadísticas que lo originen.

• Si el trabajo lo requiere y es necesario expresar algunos valores en %, deben consignarse las cifras de las cuales provienen éstos porcentajes.

Page 28: 7. metodologia y estadistica aplicada a la educacion

2 8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

ÍNDICES

El Índice es un indicador útil tanto para fijar situaciones como para hacer un diagnóstico. Cuando interesa comparar los valores de una característica de la educación (matrícula, asistencia de alumnos, número de profesores, etc...) en el tiempo o en el espacio, ya sea comparando dos valores entre sí o todos con uno de ellos se puede realizar un cociente cuyo resultado se denomina Índice simple.

Ejemplo: Se desea comparar la matrícula escolar de una escuela en el año 2004 con la matrícula en el año 1994. Si la primera es de 4000 alumnos y la de 1994 es de 2000, el Indice será:

I2004/1994=

Lo que indica que la matrícula en el año 2004 es el doble que la matrícula de 10 años atrás, en esa escuela.

El valor que va en el denominador se llama base.

El Indice del año base es 1:

I1994/1994=

Con frecuencia se multiplica por 100 los índices con lo que entonces los índices son los porcentajes correspondientes siendo 100 el porcentaje del índice base.

Los Índices más comunes utilizados en educación son:

• Razón de alumnos matriculados en las escuelas con respecto a la población en edad escolar.

I=

2 2000 4000

=

1 2000 2000

=

escolar edad en Población os matriculad alumnos N°

Page 29: 7. metodologia y estadistica aplicada a la educacion

2 9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Ejemplo: En el año 2001, en la localidad de La Banda según el INDEC, la población en edad escolar fue de 88735 y los alumnos matriculados fue de 32613. La razón de alumnos matriculados es entonces en ese año de:

I=

Es decir que solo el 37% del total de la población en edad escolar asiste a la escuela.

• Alumnos por maestro en las escuelas primarias.

I=

Ejemplo: Si el total de alumnos de una escuela es de 1000 y el plantel docente informa que hay 40 maestros( Datos ficticios), la razón alumnos por maestro es:

I=

Es decir que en esa escuela hay 25 alumnos por cada maestro.

• Porcentaje de población analfabeta de 15 años y más.

I=

Ejemplo: En la provincia de Santiago del Estero según el INDEC, en el año 2001 el total de población de 15 años y más fue de 571546 personas. De ellas, 31625 no tenían ninguna instrucción.

El Porcentaje de población analfabeta para la provincia es entonces,

I=

37 . 0 88735 32613

=

maestros N alumnos N

° °

25 40 1000

=

100 * 15 15 .

más y años de Población más y años de s analfabeto N°

% 53 . 5 100 * 571546 31625

=

Page 30: 7. metodologia y estadistica aplicada a la educacion

3 0

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

• Tasa de ausentismo de docentes Es el porcentaje de ausentismo de docentes en un período de tiempo determinado.

Ta=

Ejemplo: Si en una escuela hay una planta docente de 115 personas y el total de inasistencias de los docentes(por diversas causas) en el año es de 3101días, la Tasa de ausentismo se calcula como sigue(considere que los días de clase en el año son 180):

Ta=

• Tasa de desgranamiento Es la proporción de alumnos ingresados al primer grado (o curso) que no lograron culminar todos los grados (o cursos) correspondientes al nivel, en el período establecido.

100 * º

min º período del inicio al os matriculad alumnos de N

o establecid período el en estudios sus aron cul no que alumnos de N Td =

Ejemplo: Si en el estudio de la cohorte 1974­1980 el número de alumnos matriculados en la Argentina en la escuela primaria al inicio del período es de 729048 y los que no culminaron sus estudios es de 337292 (Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­Bs.As.­ 1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura: Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE. Año 1999)

la Tasa de desgranamiento es: Td=

Es decir que en ese período hay un desgranamiento del 46%. El 46% de los alumnos matriculados al inicio del período no culminaron sus estudios al final del mismo.

100 * º º

período ese en docentes los todos de clase de días de N período un en docentes los todos de ausencia de días de N

% 98 . 14 100 * 180 * 115

3101 =

46 . 0 729048 337292

=

Page 31: 7. metodologia y estadistica aplicada a la educacion

3 1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

• Tasa de retención de la cohorte Es la proporción de alumnos ingresados al primer grado (o curso) que lograron culminar todos los grados (o cursos) correspondientes al nivel, en el período establecido.

100 * º

º período del inicio al os matriculad alumnos de N

o establecid período el en estudios sus aron min cul que alumnos de N Tr =

Ejemplo: Si en el mismo período considerado en el ejercicio anterior terminan el 7ª grado 391756 alumnos de los 729048 matriculados, la Tasa de retención será:

Tr= 5374 . 0

729048 391756

=

Es decir que la Tasa de retención es aproximadamente del 54%. El 54% de los alumnos matriculados al inicio del período culminaron

sus estudios al final del mismo.

• Tasa de escolarización Proporción de la población en edad escolar que está efectivamente escolarizada

100 * º escolar edad en Población

os matriculad alumnos de N Ez =

Ejemplo: La población de 5 años y más para Sgo. del Estero en el 2001 según el INDEC es de 706794 habitantes. De ellos asisten a la escuela 237708.

La Tasa de escolarización es:

I=

Es decir que el 33.63% de la población en edad escolar asiste a la escuela.

% 63 . 33 100 * 706794 237708

=

Page 32: 7. metodologia y estadistica aplicada a la educacion

3 2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

GUÍA DE EJERCITACIÓN

Actividad 1 Clasifique en base al siguiente listado las variables socio educativas, en cualitativas nominales u ordinales y cuantitativas discretas o continuas

Variable Tipo 1­ Religión

2­ Nº de alumnos promocionados por curso

3­ Barrios

4­ Nivel de educación alcanzado por el tutor

5­ Edad de los alumnos

6­ Sexo

7­ Nº de inasistencias mensuales

8­ Altura de los alumnos

9­ Lugar de nacimiento

10­ Peso de los alumnos

11­ Horas de estudio diario

12­ Nº de materias que cursan

13­ Nº de hermanos que tiene cada alumno

14­ Grado de satisfacción por la asignatura

15 Superficie construída por escuela

16 Nº de escuelas por Departamento

17 Categorías de escuela

Page 33: 7. metodologia y estadistica aplicada a la educacion

3 3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Actividad 2

Los siguientes datos corresponden a Nº de inasistencias de los alumnos de un curso correspondientes al primer cuatrimestre

xi:

a) ¿Que indica el subíndice i? b) ¿Cuál es la variable que se estudia?. Clasifíquela. c) Ud. debe presentar un cuadro de inasistencias de los alumnos.

¿Cómo construye el mismo? d) Incluya en la tabla: frecuencias acumuladas, frecuencias relativas,

porcentaje y porcentaje acumulado correspondiente a cada valor de la variable.

e) Presente los resultados con el gráfico apropiado.

Actividad 3 En un curso de 50 alumnos de un establecimiento de la Capital del a

Pcia. De Sgo. Del Estero, se empleó la técnica de profundización de temas por grupo en el desarrollo de contenidos teóricos. Se distribuyó un cuestionario con la finalidad de determinar la actitud de los mismos ante esta modalidad de estudio. Una de las preguntas estaba referida al grado de conformidad sobre el desarrollo de los contenidos teóricos.

Los resultados obtenidos fueron los siguientes: xi:

Donde: MC: muy conforme C: conforme I: indiferente D: disconforme MD: Muy disconforme

8 5 3 4 2 5 4 4 10 6 6 7 5 5 3 9 7 2 6 4 9 4 5 0 8 6 5 1 1 4 5 7 2 7 6 4 9 4 5 3

MC MD C I C MC D D MC MC I MC I MC D MC MD C D C

MC D MC D MC D MD I C C C MD MC I C MC MC D C MC C MC D MD MC I D MC I MC

Page 34: 7. metodologia y estadistica aplicada a la educacion

3 4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

a) Indique el tamaño de la muestra b) Ud. debe representar al establecimiento en una reunión de

profesores en la que participan distintos Colegios de la Capital. ¿Como presentaría la opinión del alumnado?

c) Que título colocaría a la presentación? d) Incluya en la misma frecuencias relativas y porcentajes

correspondiente a cada valor de la variable. e) Presente esos mismos resultados con un gráfico de barras simples. f) Indique si corresponde calcular frecuencia acumulada. En el caso de

respuesta afirmativa obtenga dicha frecuencia. g) Analice los resultados obtenidos

Actividad 4 En un estudio realizado en el Instituto Santo Tomás de Aquino para determinar la zona de influencia del mismo según el lugar de residencia de los alumnos, los resultados obtenidos fueron los siguientes:

Alumnos del Instituto Santo Tomás de Aquino según el barrio en el que residen.

Barrios Número de alumnos Barrio Belgrano 300 Barrio Cabildo 150 Barrio Contreras 30 Barrio Ejército Argentino 20 Total 500 Fuente: Datos ficticios

a) ¿Que representa el número 500? b) ¿Cuál es la variable de clasificación? Indique de que tipo de variable

se trata. c) Obtenga frecuencias relativas y los porcentajes correspondientes. d) Determine si corresponde calcular frecuencias acumulada. e) Realice gráfico de tortas. f) ¿Qué otro gráfico puede emplear para representar estos datos?

Page 35: 7. metodologia y estadistica aplicada a la educacion

3 5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Actividad 5 Los siguientes datos corresponden a la edad de los tutores de alumnos que concurren al EGB de un establecimiento escolar

xi: 44 30 45 48 31 45 33 35 54 44 45 47 38 56 29 43 43 62 60 30 52 36 45 31 31 32 34 32 54 55 55 46 61 39 43 38 47 45 38 37 63 49 34 48 34 64 44 47 36 60 50 52 37 41 29 37 49 37 39 56 39 46 46 31 60 29 53 40 41 58

Presentar los datos : a) En una tabla con un número aproximado de intervalos de clase. b) En una tabla con 5 intervalos c) ¿Que gráficos utilizaría para representar los datos contenidos en

estas tablas? d) Con la tabla presentada en el item b, realice un histograma. e) Con la tabla presentada en el item a, realice un polígono de

frecuencias.

Actividad 6 Los siguientes datos corresponden a alumnos analfabetos por Departamento en la Pcia. de Santiago del Estero, discriminados por sexo. Año 2001

FUENTE: INDEC. Censo Nacional de Población, Hogares y Viviendas. 2001.

En base a los datos proporcionados en la tabla anterior realice: a) Gráfico de barras simples que muestre el número total de alumnos

analfabetos por Departamento. ¿Que otro tipo de gráfico podría utilizar en la representación?

b) Gráfico de tortas que muestre el número de alumnos analfabetos discriminados por sexo para el Departamento Robles.

c) Realice un gráfico de barras agrupadas por Departamento

Sexo Departamento Total Varones Mujeres

Capital 4587 2299 2288 Banda 4752 2461 2291

Río Hondo 3473 1960 1513 Robles 2116 1166 950

Page 36: 7. metodologia y estadistica aplicada a la educacion

3 6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

d) Realice un gráfico de barras porcentuales por Departamento discriminando dentro de cada una de ellas los porcentajes de varones y mujeres analfabetos.

Actividad 7

Utilice un gráfico lineal para mostrar la evolución de egresados del Polimodal Año Nº de

egresados 1980 233 1985 278 1990 321 1995 375 2000 391 FUENTE: Datos ficticios

Actividad 8 En base a los datos de la siguiente tabla:

Población en edad escolar, Nº de alumnos matriculados y Nº de maestros correspondiente a cuatro lugares de la República Argentina.

Lugar Población en edad escolar

Nº de alumnos

matriculados

Nº de alumnos no

matriculados

Nº de maestros

A 300000 248.000 7.000 B 150000 106.000 4.000 C 25000 24.000 1.200 D 160000 142.000 4.750

Fuente: Datos Ficticios

Calcular para cada lugar: a) Proporción de alumnos matriculados b) Nº de alumnos por maestro c) Tasa de escolarización d) Número de alumnos No matriculados e) Porcentaje de alumnos No matriculados

Page 37: 7. metodologia y estadistica aplicada a la educacion

3 7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Actividad 9 Dada la siguiente tabla, calcule la retención y el desgranamiento de cada cohorte y en base a los resultados realice el análisis correspondiente

Retención y Desgranamiento de la Escuela Primaria. Su evolución en 3 ciclos escolares del período 1964­1980

Alumnos matriculados Ciclo Escolar 1er Grado 7º Grado

1964 ­ 1970 723.264 321.940 1969 ­ 1975 751.049 375.723 1974 ­ 1980 729.048 391.756

Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­ Bs.As.­1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura: Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE. Año

a) Calcule la tasa de desgranamiento b) Calcule la tasa de retención c) Interprete los resultados obtenidos

Actividad 10 La siguiente tabla fue extraída del Censo Nacional de Población, Hogares y Vivienda . 2001.

Población de 10 años y más de departamentos de Santiago del Estero, por condición de alfabetismo y sexo. Año 2001.

Condición de alfabetismo Alfabetos Analfabetos

Provincia Población de 10 años

y más Total Varones Mujeres Total Varones Mujeres Total 607.782 571.067 284.309 286.758 36.715 19.030 17.685

Capital 191.311 186.724 87.894 98.830 4.587 2.299 2.288 Banda 97.689 92.937 45.066 47.871 4.752 2.461 2.291

Río Hondo

38.435 34.962 17.361 17.601 3.473 1.960 1.513

Copo 19.241 17.264 9.156 8.108 1.977 948 1.029

a) Calcular la tasa de analfabetismo de los distintos Departamentos que se muestran en la Tabla. b) ¿Cuál es el porcentaje de población de más de 10 años sabiendo que la población total de Santiago del Estero, según el Censo del año 2001 es de 804.457 ?

Page 38: 7. metodologia y estadistica aplicada a la educacion

3 8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

c) ¿Cuál es la tasa de analfabetismo de las mujeres en los distintos departamentos? d) Calcule la tasa de analfabetismo correspondiente a los varones de los distintos departamentos.

Page 39: 7. metodologia y estadistica aplicada a la educacion

3 9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

UNIDAD I I I

MEDIDAS DE POSICIÓN Y DISPERSIÓN

INTRODUCCIÓN

En todo trabajo estadístico luego de recolectar los datos, ordenarlos, agruparlos en tablas y presentarlos gráficamente, es preciso extraer alguna información que caracterice a la población de la cual se los extrajo.

Por ello, el objetivo de éste capítulo es interiorizarlos acerca de las medidas de posición y variación más utilizadas para caracterizar a la población en estudio, y en que caso se emplea cada una de ellas, interpretando los resultados a través del pensamiento crítico.

Los métodos de éste capítulo suelen denominarse métodos de estadística descriptiva, porque su objetivo es resumir o describir las características importantes de un conjunto de datos. Éstas características se refieren al centro, variación, distribución, datos distantes y cambios a través del tiempo.

1. Medidas de posición

Supongamos que una directora está preocupada por las notas obtenidas en las pruebas de Matemáticas. Lo primero que se le ocurrirá es tener una idea de si las notas de una muestra de alumnos se ubican cerca de la calificación cinco o cerca de la calificación nueve. Necesita resumir los datos y calcular alguna medida que sirva para que, con un único valor sencillo y representativo pueda establecer si los alumnos se posicionan cerca de una calificación de 5 puntos o si por el contrario se posicionan cerca de la calificación de nueve puntos; a estas medidas se las denominan Medidas de Posición, y si además indican el centro de ése conjunto de valores, se denominan Medidas de posición y tendencia central.

Se conocen varias formas de determinar el centro de un conjunto de datos. A continuación, se indicarán tres que son las más comúnmente utilizadas: media, mediana y modo.

Page 40: 7. metodologia y estadistica aplicada a la educacion

4 0

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

1.1. Media aritmét ica

La media (aritmética) es la medida de posición y tendencia central más empleada para describir los datos; constituye lo que la mayoría de la gente denomina promedio. Es quizás la más conocida y usada.

La media aritmética en una serie simple de datos, se la obtiene al dividir la suma de todos los valores de la variable entre la cantidad de valores

sumados. A la media aritmética se la representa con x :

a)Cálculo de las media aritmética en series simples

Ø Ejemplo 1 Se registró los días de inasistencias en un año, de una muestra de cinco alumnos del primer ciclo del EGB y se desea averiguar cuál es el promedio de inasistencias de esa muestra. La variable en estudios es:

X = nº de inasistencias de los alumnos Los valores de la variable son: xi : 0; 16; 12; 5; 7

5 5 5 7 5 12 16 0

5

1 5 4 3 2 1 ∑

= = + + + +

= + + + +

= i i x x x x x x x ,

y su fórmula de cálculo es la siguiente

n

x x

n

i i ∑

= = 1

2.1

En la fórmula se utiliza la letra griega ∑ (sigma mayúscula) que indica que los valores de la variable deben sumarse. El símbolo n denota el tamaño de la muestra, que es el número de alumnos observados.

Cuando los datos provienen de una muestra el símbolo de la media

aritmética es x (se denomina “x barra”); si se calcula la media aritmética con los datos de toda la población se simboliza con

N

x N

i i ∑

= = 1 µ 2.2

Page 41: 7. metodologia y estadistica aplicada a la educacion

4 1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

∑ denota la sumatoria del conjunto de valores. x i expresan los diferentes valores que toma la variable. n tamaño de la muestra, cantidad de valores observados N tamaño de la población

Como nuestros datos constituyen una muestra para calcular la media utilizamos la fórmula 2.1

8 5 40

5 7 5 12 16 0

5

5

1 = = + + + +

= = ∑

= i i x

x

Interpretación: Los alumnos tienen en promedio 8 inasistencias por año.

Algunas propiedades de la media aritmética

1­La media aritmética es reproductora del total.

2­ Si llamamos desvío a la diferencia entre un valor y la media aritmética

( ) ( ) 0 = − = ∑ ∑ x x d i i

xi x x d i i − = 0 0 – 8 =­8 5 5 ­ 8 =­3 7 7 ­ 8 =­1

12 12 – 8 = 4 16 16 – 8 = 8

Total 0

Una desventaja de la media es su sensibilidad a valores extremos, de modo que un valor excepcional puede afectarla de una manera drástica, en este caso no representa en forma adecuada al centro de dicho conjunto y tiende a dirigirse a ese valor extremo.

Si por equivocación al pasar los datos en el ejemplo de las inasistencias de los 5 alumnos colocamos 66 en vez de 16:

Ø Ejemplo 2 X = inasistencias de alumnos xi : 0; 66; 12; 5; 7

Page 42: 7. metodologia y estadistica aplicada a la educacion

4 2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

La inasistencia promedio toma el valor 18, alejándose el promedio hacia al valor extremo 66.

18 5 90

5 7 5 12 66 0

5

5

1 = = + + + +

= == ∑

= i i x

x

La media aritmética no representa el centro del conjunto de datos. Este problema o desventaja se resuelve utilizando otra medida de resumen de datos que se denomina: mediana.

La media aritmética se puede calcular cuando los valores de las variables son cuantitativos tanto continuos como discretos.

1. 2 Mediana.

La mediana (de un conjunto de datos):es una medida de tendencia central que divide a la serie ordenada de datos en dos partes iguales, de tal forma que el 50% de los datos son menores o iguales a la mediana y el otro 50% mayores o iguales a ella. La mediana se designa con Me.

a) Cálculo de la mediana en series simples

Ø Ejemplo 3 Ø Se van a considerar dos casos: cuando el tamaño de la

muestra es impar y cuando n es par Ø

Se desea determinar el valor mediano de las inasistencias de los alumnos del ejemplo 2, El tamaño de la muestra, “n” es impar.

X: inasistencias de alumnos xi : 0; 66; 12; 5; 7

Para su cálculo debemos ordenar primero los datos en forma ascendente o descendente.

Si el número de observaciones es impar, la mediana es el valor de la variable que se localiza exactamente en la mitad de la lista.

En caso de que el número de observaciones fuera par, el valor de la

Page 43: 7. metodologia y estadistica aplicada a la educacion

4 3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

mediana se obtiene promediando los dos valores centrales.

Esos valores centrales se posicionan en el lugar

2 1 + n

Solución. Primero se ordenan los datos

0; 5; 7; 12; 66.

La muestra posee tamaño impar n = 5 y el valor mediano está posicionado en el lugar

3 2 6

2 1 5

= = +

, o sea que el valor de la mediana es el valor de la variable ubicado en el 3º lugar.

0; 5; 7; 12; 66.

Me = 7 inasistencias

Interpretación: el 50% de los alumnos tiene inasistencia menores o iguales a 7.

Ø Ejemplo 4 En el caso de que n sea par Supongamos que contamos las inasistencias de 6 alumnos. X = inasistencias de alumnos xi : 0; 66; 12; 5; 7;10

Solución. Primero se ordenan los datos 0; 5; 7; 10; 12; 66.

Las muestra posee tamaño par n = 6,

Posición de los valores centrales 5 , 3

2 7

2 1 6

= = +

Los valores centrales ocupan el tercer y cuarto lugar, la mediana se obtiene como el promedio de los dos valores centrales:

Page 44: 7. metodologia y estadistica aplicada a la educacion

4 4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

0; 5; 7; 10; 12; 66

8 5 , 8 2 10 7

≈ = +

= Me

Interpretación: el 50% de los alumnos tienen inasistencias menores o iguales a 8.

Deben quedar claro dos conceptos:

Primero: La mediana no se ve influenciada por los valores extremos, ya que en su cálculo interviene el orden y no la magnitud de los valores.

Segundo: la media aritmética es sensible a valores extremos.

La mediana se puede determinar para variables cuantitativas continuas discretas y para variables cualitativas que se miden en escala ordinal.

1. 3. Modo.

El Modo es el valor de la variable que ocurre con mayor frecuencia. Se designa frecuentemente como Mo.

Se debe hacer notar aquí que el Mo es un valor de variable y la frecuencia de este valor sugiere su importancia estadística.

Cuando dos valores ocurren con la misma frecuencia y ésta es la más alta, ambos valores son modas, por lo que el conjunto de datos es bimodal.

Cuando más de dos valores ocurren con la misma frecuencia y ésta es la más alta, todos los valores son modas, por lo que el conjunto de datos es multimodal.

Cuando ningún valor se repite, se dice que no hay moda.

Ø Ejemplo 5. Calcule las modas para los siguientes conjuntos de datos:

Serie A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6 Serie B: 4; 5; 3; 4; 6; 8; 5 Serie C: 27; 27; 27; 55; 55; 55; 88; 88; 99 Serie D: 1; 2; 3; 6; 7; 8; 9; 10

Page 45: 7. metodologia y estadistica aplicada a la educacion

4 5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Solución: En la serie A. El número 4,5 es la moda pues es el valor que ocurre con mayor frecuencia(2 veces). En la serie B. Los números 4 y 5 son modas, ya que ambos ocurren con la frecuencia más alta (2 veces). En la serie C. Los números 27 y 55 son modas, ya que ambos ocurren con la frecuencia más alta (3 veces). En la serie D. No hay moda, ya que ningún valor se repite.

En realidad, la moda no se utiliza mucho con datos numéricos. Sin embargo, entre las distintas medidas de tendencia central que consideramos, la moda es la única que puede usarse cuando se trata de variables cualitativas nominales.

Ø Ejemplo 6. Una encuesta efectuada a estudiantes mostró que el 84 tiene

aparato de televisión; 76 videocasetera; 39 videojuegos y el 35 reproductor de DVD. En tanto que el televisor es el aparato más frecuente, es posible afirmar que la moda es el televisor.

No podemos calcular una media o mediana para datos como éstos, cualitativos a nivel nominal.

3.­ Cálculo de las medidas de posición en series de frecuencias

Veremos como se calculan la medidas de posición y tendencia central cuando los datos están agrupados en una serie de frecuencias.

3.1. Variables agrupadas en serie de frecuencias simple

3.1.a. Media aritmética. Como en una serie de frecuencias, fi nos indica las veces que se repite el valor de la variable, debemos considerarlas en el cálculo de la media aritmética.

Page 46: 7. metodologia y estadistica aplicada a la educacion

4 6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Ø Ejemplo 7 Una maestra esta interesada en conocer el número promedio de hermanos de su alumnos. Para ello tomó de una muestra de 25 alumnos.

Tabla 1. Alumnos de tercer año de polimodal de la Escuela Sarmiento clasificados según el número de hermanos

Nº de hermanos (xi)

Nº de alumnos (fi)

0 1 1 9 2 7 3 5 4 3

Total 25 Fuente: Datos ficticios

Si aplicamos la fórmula 2.1, deberíamos sumar 1 vez cero, nueve veces 1 y así sucesivamente hasta sumar 3 veces 4 y dividir esa suma entre 25 que es el tamaño de la muestra.

xi: nº de hermanos fi : número de alumnos que poseen xi hermanos

2 25 50

25 4 ... 4 ... 3 ... 2 1 ... 1 0

25

25

1 = = + + + + + +

= == ∑

= i i x

x

Pero, este cálculo se podría realizar en forma más simple y es obtener esa misma suma reemplazándola por la multiplicación. Utilizando la frecuencia fi que indica las veces que se repite el valor de la variable xi.

5 2 1

5 5 2 2 1

... ...

f f f f x f x f x x i

+ + + + + +

=

ahora expresando literalmente la fórmula de la media aritmética tenemos

∑ =

= n

i i i f x

n x

1

1

Este promedio se conoce como media aritmética ponderada. Para poder calcular la media aritmética ponderada correspondiente al ejemplo planteado, agregamos a la tabla de frecuencias anterior una columna

Page 47: 7. metodologia y estadistica aplicada a la educacion

4 7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

auxiliar que facilitará el cálculo de la media.

Tabla 2. Alumnos de tercer año de polimodal de la Escuela Sarmiento clasificados según el número de hermanos

Nº de hermanos (xi)

Nº de alumnos (fi)

xi*fi

0 1 0 1 9 9 2 7 14 3 5 15 4 3 12

Total 25 50 Fuente: Datos ficticios

∑ =

= n

i i i f x

n x

1

1

Podemos concluir diciendo que los alumnos de tercer año de polimodal de la Escuela Sarmiento en promedio poseen 2 hermanos.

3.1.b. Mediana

Una maestra esta interesada en conocer la mediana del número de hermanos de una muestra de 44 alumnos que concurren a una escuela rural.

Tabla 3. Alumnos de una Escuela rural clasificados según el número de hermanos

Nº de hermanos (xi)

Nº de alumnos (frecuencia, fi)

2 5 3 5 4 30 5 4

Total 44 Fuente: Datos ficticios

En esta serie de frecuencias de variable cuantitativa discreta, los datos ya están ordenados, por lo que solo resta encontrar el valor central, cuya posición se encuentra en el lugar

5 , 22 2 45

2 1 44

2 1

= = +

= + n

= 1 25 . 50 = 2

Page 48: 7. metodologia y estadistica aplicada a la educacion

4 8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

O sea el valor mediano será el promedio de los valores de la variable ubicados en el lugar 22 y 23. Para ello se deben seguir los siguientes pasos:

1.­Calcular las frecuencias acumuladas correspondientes a cada valor de la variable.

2.­Calcular el orden de localización de la mediana efectuando el cociente

5 , 22 2 45

2 1 44

2 1

= = +

= + n

donde n = tamaño de la muestra

Tabla 4. Alumnos de una Escuela rural clasificados según el número de hermanos

Nº de hermanos (xi)

Nº de alumnos (frecuencia, fi)

Frecuencias acumulada (Fi)

2 5 5 3 5 10 4 30 40 5 4 44

Total 44 Fuente: Datos ficticios

Como el valor de la mediana se encuentra entre la posición 22 y la posición 23, se busca en la columna de frecuencias acumuladas, el menor valor que contiene a 22 (es 40), al que corresponde el valor de variable 4 y el menor valor que contiene a 23 (es 40), al que corresponde el valor de variable 4.

Por lo que el valor mediano es el promedio de los dos valores centrales.

4 2 4 4

= +

= Me

Interpretación: el 50 % de los alumnos de escuelas rurales, tienen 4 hermanos o menos.

Page 49: 7. metodologia y estadistica aplicada a la educacion

4 9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

3.1.c. Moda

Ejemplo: Calcular el valor más frecuente del número de hermanos de los alumnos de tercer año de polimodal de la Escuela Sarmiento (Tabla 2).

Solución: La variable que se estudia es una variable cuantitativa discreta. Se busca en la columna fi el valor más alto, en este ejemplo es 9. El valor de la moda es el valor de la variable que tiene frecuencia 9, es decir

Mo = 1

Interpretación: La mayoría de los alumnos de tercer año de polimodal de la Escuela Sarmiento. poseen un hermano .

3.2. Variable agrupada en serie de frecuencias con intervalos de clase, para variable aleatoria cont inua

3.2.a. Media aritmética.

Ø Ejemplo

Para realizar un estudio sobre la nutrición de la población infantil que concurre a la escuela en una localidad rural, se consultaron los pesos, en kilogramos, de los 50 alumnos de la escuela, los que se muestran en la Tabla 4. Los datos se agruparon en intervalos de amplitud 2 kg. y con límite superior abierto. Determine el valor promedio del peso de los alumnos.

Solución

1.­ Se calcula las marcas de clase

Al organizar de esta forma los datos, se pierde información, pues la tabla indica, por ejemplo que hay 12 alumnos que pesan entre 38 kg y 40 kg, pero no cuanto pesan cada uno. Ahora debemos encontrar un único valor que represente o resuma a todos los valores del intervalo: ese valor es el promedio o media aritmética de los límites del intervalo y se denomina punto medio de la clase o marca de clase. Este valor representará el valor xi de la fórmula de la media.

Page 50: 7. metodologia y estadistica aplicada a la educacion

5 0

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

39 2 40 38

1 = +

= x

41 2 39 41 2 42 40

2 = + = + = = +

= a x x i

Se introduce una nueva columna en la tabla que la denominaremos xi

Tabla 4. Peso de los alumnos de una escuela rural

Intervalo (kg)

Nº de alumnos fi

Marca de clase xi

xi * fi

38 a 40 12 39 468 40 a 42 19 41 779 42 a 44 7 43 301 44 a 46 6 45 270 46 a 48 6 47 282 Total 50 2100

Fuente: Datos ficticios

La fórmula para encontrar la media en serie de frecuencias es

∑ =

= n

i i i f x

n x

1

1

Pero en este caso xi representa a la marca de clase

n=tamaño de la muestra= ∑ i f

Ahora ya estamos en condiciones de aplicar la fórmula para el cálculo de la media aritmética, por ello agregamos una columna que es el producto de cada marca de clase por su frecuencia (xi*fi).

kg f x n

x n

i i i 42 2100 *

50 1 1

1

= = = ∑ =

Interpretación: Los alumnos pesan en promedio 42 kg.

Page 51: 7. metodologia y estadistica aplicada a la educacion

5 1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

3.2.b. Mediana

Ø Ejemplo Se desea conocer el peso mediano de los 50 alumnos de una escuela

rural (Tabla 4). El cálculo de la mediana en serie de frecuencias para variable cuantitativa continua se efectúa utilizando la siguiente fórmula

a f

F f

L Me Me

Me ant i

* 2 inf −

+ =

inf L : límite inferior de la clase mediana

2 ∑ i f

: Suma de la frecuencia entre 2 Me ant F : frecuencia acumulada anterior a la clase mediana

Me f : frecuencia absoluta de la clase mediana a: amplitud del intervalo a = Lsup­ Linf

Peso de los alumnos de una escuela rural Intervalo

(kg) Nº de alumnos

fi

38 a 40 12 40 a 42 19 42 a 44 7 44 a 46 6 46 a 48 6 Total 50

Fuente: Datos ficticios Solución 1­En la tabla se agrega una columna para valores de frecuencias acumuladas.

Peso de los alumnos de una escuela rural Intervalo (kg) Nº de alumnos fi Fi

38 a 40 12 12 40 a 42 19 31 42 a 44 7 38 44 a 46 6 44 46 a 48 6 50 Total 50

Page 52: 7. metodologia y estadistica aplicada a la educacion

5 2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Fuente: Datos ficticios 2­ Se calcula

2 ∑ i f

El tamaño de la muestra se divide entre 2 porque la Mediana es el valor de la variable que divide la serie ordenada de datos en 2 partes iguales.

25 2 50

2 = = ∑ i f

3­ Se busca en la columna Fi el menor valor que contiene a 25. En este ejemplo el valor que corresponde es 31. Se señala la clase mediana y se aplica la fórmula.

a f

F f

L Me Me

Me ant i

* 2 inf −

+ =

37 , 41 37 , 1 40 19

2 * 13 40 2 * 19 12 25 40 2 *

19

12 2 50

40 = + = + = −

+ = −

+ = Me

Interpretación: El 50% de los alumnos pesan 41,37 kg o menos.

3.2.c. Moda Ø Ejemplo

Se desea conocer el peso más frecuente de los 50 alumnos. El cálculo del modo en serie de frecuencias para variable cuantitativa continua se realiza utilizando la siguiente fórmula

a D D

D L Mo Mo * 2 1

1 inf +

+ =

Donde: Modal clase la a anterior Mo f f D − = 1

Modal clase la a posterior Mo f f D − = 2 a: amplitud del intervalo

Page 53: 7. metodologia y estadistica aplicada a la educacion

5 3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Solución En la columna fi se busca el valor más alto, en nuestro ejemplo 19,

se señala la fila, ella constituye la clase modal. Se calcula:

7 12 19 1 = − = D

12 7 19 2 = − = D

a = 42­ 40 = 2

Se aplica la fórmula

kg Mo 74 , 40 19 14 40 2 *

19 7 40 2 *

7 12 7 40 = + = + = +

+ =

Interpretación: el peso más frecuente del grupo de alumnos es de 40,74 kg

Relación entre media, mediana y modo

Cuando la media, la mediana y el modo coinciden, la serie de datos presenta una distribución simétrica unimodal.

Cuando esa coincidencia no existe, se dice que la distribución unimodal es asimétrica.

La asimetría es positiva cuando la media es mayor que la mediana y la mediana mayor que el modo, en éste caso vemos que la media aritmética se dirige hacia el o los valores extremadamente grandes

µ= Me=Mo

Page 54: 7. metodologia y estadistica aplicada a la educacion

5 4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

La distribución presenta asimetría negativa cuando la media es menor que la mediana y la mediana menor que el modo; en éste caso vemos que la media aritmética se dirige hacia el o los valores extremadamente pequeños.

La distancia entre la media aritmética y el modo podría usarse como una medida de asimetría (Ya­Lun Chou, 1990).

Asimetría = media – modo

Cuánto mayor es esta distancia, negativa o positiva, tanto más asimétrica es la distribución

4­ Medidas de localización

Son Medidas de Posición que dividen los valores ordenados de una serie en cuatro, diez o cien partes iguales y se denominan cuartiles, deciles y percentiles.

4.1 Cuartiles

Los cuartiles son tres valores Q1, Q2, Q3, que dividen a la serie ordenada en cuatro partes iguales. Por debajo del primero quedan el 25% de los datos; por debajo del segundo el 50% de los mismos y por debajo del tercero el 75%. El segundo cuartil coincide con la Mediana.

Mo < Me <µ

µ< Me< Mo

Page 55: 7. metodologia y estadistica aplicada a la educacion

5 5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

4.2 Deciles Los Deciles son nueve valores de la variable y dividen a la serie ordenada de datos en 10 partes iguales, el decil 5 coincide con la Mediana, es decir el 50% de los valores son menores o iguales al D5.

4.3 Percentiles Los percentiles son 99 valores de la variable, que dividen al conjunto de datos (ordenados de menor a mayor) en cien partes iguales el percentil 50 coincide con la mediana. Los percentiles se designan con la letra Pi, el subíndice i, varía de 1 a 99, indicando el valor del percentil, que se desea calcular.

ü Cálculo de percent iles:

Forma analítica

Para calcular los percentiles de una distribución de frecuencias se procede del mismo modo que en el caso de la mediana, salvo que ahora dividiremos

al tamaño de la muestra ∑ = i f n en cien partes iguales, en vez de dos.

Ø Ejemplo Se desea conocer P20 de licencia en las escuelas del centro de la ciudad de Santiago del Estero en el año 2004.

Tabla 5. Días de inasistencia de los docentes de escuelas de la capital de Santiago del Estero en el período escolar 2004.

Intervalo de clase (días de licencia)

Nº de docentes (fi)

Fi

0 a 10 30 30 10 a 20 60 90 20 a 30 60 150 30 a 40 70 220 40 a 50 90 310 50 a 60 100 410 60 a 70 60 470 70 a 80 40 510 80 a 90 10 520 90 a 100 10 530

Total 530 Fuente: Datos ficticios

Page 56: 7. metodologia y estadistica aplicada a la educacion

5 6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

El cálculo de percentiles para variables agrupadas en serie de frecuencias con intervalos de clase, se efectúa utilizando la siguiente fórmula:

a f

F f i

L P i

i

P

P ant i

i * 100 inf −

+ =

L inf : Límite inferior de la clase donde se encuentra el percentil

i = valor del percentil que se busca

Fant Pi: frecuencia acumulada anterior a la clase donde se encuentra el Percentil i

fPi :frecuencia absoluta de la clase donde se encuentra el Pi

a : amplitud del intervalo a =Lsup­ Linf

Solución Cálculo del percentil 20

Pasos 1.­ Se agrega una columna de frecuencias acumuladas (Fi)

2.­ Se calcula

106 100 530 * 20

100 = = ∑ i f i

3.­ Se ubica en la columna Fi el menor valor que contiene a 106, en nuestro ejemplo 150. La clase que tiene una Fi= 150 es la clase que contiene al Percentil buscado

4.­ Se calcula a: Lsup –Linf = 30­20=10 5.­ Se aplica la fórmula

días P 23 67 , 22 60 10 * 16 20 10 *

60 90 106 20 20 ≈ = + =

− + =

Page 57: 7. metodologia y estadistica aplicada a la educacion

5 7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Interpretación P20 = 23 días

El 20 % de los docentes toman 23 días de licencia o menos

ü Rango percentil

Forma analítica

Se puede presentar, el problema inverso, es decir, conocer cuántos docentes toman 52 días de licencia o menos, es decir nos dan como dato un valor de la variable y nos preguntan que percentil le corresponde; a este procedimiento se lo denomina calcular el Rango percentil.

Es decir el rango percentil de un valor dado es el porcentaje de valores comprendidos debajo del valor solicitado.

Ø Ejemplo: Calcular el rango percentil que le corresponde a 52 días de licencia de los docentes de las escuelas de la ciudad de Santiago del Estero

Repetimos la tabla 5 para visualizar mejor el cálculo

Días de inasistencia de los docentes de escuelas de la capital de Santiago del Estero en el período escolar 2004.

Intervalo de clase (días de licencia)

Nº de docentes (fi)

Fi

0 a 10 30 30 10 a 20 60 90 20 a 30 60 150 30 a 40 70 220 40 a 50 90 310 50 a 60 100 410 60 a 70 60 470 70 a 80 40 510 80 a 90 10 520 90 a 100 10 530

Total 530 Fuente: Datos ficticios

Solución 1.­ Ubicamos en la tabla el intervalo de clase donde se encuentra el valor 52 es el intervalo que va de 50 a 60.

2.­ Se calcula la Frecuencia acumulada que le correspondería al valor 52

Page 58: 7. metodologia y estadistica aplicada a la educacion

5 8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

con la siguiente fórmula

anterior Clase erv i

i F f a L x x F +

− = int

inf * ) ( ) (

Donde: F(xi)= frecuencia acumulada correspondiente al valor que se busca Linf Límite inferior del intervalo de clase donde se encuentra xi

finterv Frecuencia absoluta del intervalo donde se encuentra xi

a amplitud del intervalo

F clase ant. Frecuencia acumulada de la clase anterior al intervalo donde se encuentra xi

330 310 10 100 * 2 310 100 *

10 ) 50 52 ( ) 52 ( = + = +

− = F

3.­ Se calcula ahora el rango percentil con la siguiente fórmula

100 * ) (

∑ =

i

i p f

x F R

% 62 % 26 . 62 100 * 530 330

≈ = = p R

Interpretación: Xi= 52 días Pi= 52

El 62% de los docentes toman 52 días de licencia o menos.

(Cálculo gráfico de percentiles y rango percentil

Ejemplo Calcular gráficamente el percentil 20

Solución Se debe construir un gráfico de líneas; los pares de valores a graficar corresponden al límite superior del intervalo con el porcentaje acumulado correspondiente a dicha clase. 1.­ Calcular porcentaje acumulados. Para ello se necesita calcular: a) frecuencia relativa para cada intervalo

Page 59: 7. metodologia y estadistica aplicada a la educacion

5 9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

b) porcentaje c) porcentaje acumulado 2.­ Se grafica un polígono (Lsup; %acum.). El gráfico que se obtiene se denomina ojiva.

Días de inasistencia de los docentes de escuelas de la capital de Santiago del Estero en el período escolar 2004.

Intervalo de clase (días de licencia)

Nº de docentes (fi)

fri Porcentaje fri*100

Porcentaje acumulado

0 a 10 30 0,0566 5,67= 6 6 10 a 20 60 0,1132 11,32 = 11 17 20 a 30 60 0,1132 11,32 = 11 28 30 a 40 70 0,1321 13,21 = 13 41 40 a 50 90 0,1698 16,98 = 17 58 50 a 60 100 0,1887 18,87 = 19 77 60 a 70 60 0,1132 11,32 = 11 88 70 a 80 40 0,0755 7,55 = 8 96 80 a 90 10 0,0189 1,89 = 2 98 90 a 100 10 0,0189 1,89 = 2 100

Total 530 100

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

Días

%

5.­Si deseamos calcular el valor que corresponde al percentil 20. Se ubica el valor 20 en el eje vertical y se traza una paralela al eje horizontal hasta la curva y luego se traza una vertical hasta encontrar el valor de días correspondiente, el que aproximadamente es 23.

Interpretación: El 20 % los docentes incurren en 23 días de licencia o menos

Page 60: 7. metodologia y estadistica aplicada a la educacion

6 0

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

6.­Si deseamos conocer cual es el rango percent il que corresponde a 52 días, ubicamos ese valor en el eje horizontal y trazamos una paralela al eje vertical hasta la curva y desde allí una paralela al eje horizontal, leemos en el eje vertical el valor correspondiente al rango percentil (aproximadamente 60).

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

Días

%

Los valores correctos se obtienen utilizando las fórmulas presentadas anteriormente.

MEDIDAS DE VARIABILIDAD O DISPERSIÓN

Las Medidas de Posición no son suficientes por si solas para describir el conjunto de datos es necesario tener además una idea de como se distribuyen los datos alrededor del centro de la distribución. Para eso surgen las Medidas de Dispersión o variabilidad.

Page 61: 7. metodologia y estadistica aplicada a la educacion

6 1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

1.­Medidas de variabilidad en series simple. Su cálculo

1.1. RANGO Es llamado también amplitud total de variación de la variable. Se lo obtiene como la diferencia entre el valor máximo y mínimo de la variable.

Distribución A: 1 5 5 5 5 5 5 5 5 9

Distribución B: 1 1 2 4 5 6 7 7 8 9

RA=9­1=8 RB=9­1=8

En este caso el valor del rango es el mismo, a pesar de que notamos que la variabilidad de las dos distribuciones es diferente.

La desventaja de esta medida es que solo considera los valores extremos sin tener en cuenta el comportamiento del resto de las observaciones. Por lo que observamos que a pesar de tener variabilidades diferentes las dos distribuciones, el rango no la capta.

Para solucionar este problema surgen otras medidas de variabilidad como el desvío medio.

¿Cómo se puede medir la variabilidad de un conjunto de datos? Si por variabilidad se entiende el grado en que los valores de la distribución difieren de la media y entre si, entonces la desviación promedio de los valores a partir de la media puede resultar una medida razonable de variabilidad:

( ) n

x x i ∑ −

Se denomina desvío a la diferencia entre cada valor de la variabley su medio.

Cuando el valor de la variable es mayor que el valor medio el desvio es positivo; cuando el valor de la variable es menor que el valor promedio los desvíos son negativos.

Pero por propiedades de la media sabemos que la suma de los desvíos de los valores respecto a la media es siempre es cero, pues las desviaciones positivas respecto a la media, anulan siempre a las

Page 62: 7. metodologia y estadistica aplicada a la educacion

6 2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

desviaciones negativas, con lo que resulta siempre una suma igual a cero y por ende el valor promedio.

Como esta medida de variabilidad parece razonable, debemos redefinir nuestra medida para evitar los valores negativos. Una manera de hacerlo es considerar el valor absoluto de los desvíos; la medida que se obtiene se denomina:

1.2.DESVIO MEDIO: Se define como el promedio del valor absoluto de los desvíos; se designa con DM.

n

x x

n d

DM i i ∑ ∑ −

= =

Tabla 6: Distribución de puntajes de un grupo de alumnos xi

di= x x i − i d 1 ­4 4 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 9 4 4

∑ = 50 i x ( ) 0 = ∑ i d 8 = ∑ i d

5 = x 8 , 0 10 8

= = DM

Fuente: Datos ficticios

Pero generalmente no se puede operar fácilmente cuando se trabaja con valor absoluto, por eso se considera una segunda forma de modificar esos signos negativos y consiste en elevar los desvíos al cuadrado, lo que dará desvíos al cuadrado positivos. Esta nueva medida de variabilidad se denomina varianza.

1.3. Varianza es el promedio de los desvíos al cuadrado y se designa con S 2 cuando se trata de una muestra y es un mejor estimador de la varianza poblacional(

2 σ ) cuando la suma de los desvíos al cuadrado se divide entre el tamaño de la muestra menos 1; por ello para una muestra la fórmula es:

Page 63: 7. metodologia y estadistica aplicada a la educacion

6 3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Variancia de una muestra, para series simples

Variancia poblacional

( ) 1

1

2

2

− =

∑ =

n

x x S

n

i i

( ) N

x n

i i ∑

=

− = 1

2

2 µ

σ

Cuántos más tiendan los valores a diferir de la media, mayor será la varianza. El valor numérico de la varianza de una distribución depende de la unidad de medida que se utilice. Por consiguiente, cuando se compara la varianza de dos o más distribuciones, hay que estar seguro que la unidad de medida empleada es igual en todas las distribuciones. En el ejemplo de la Tabla 7:

Distribución de puntajes de un grupo de alumnos

xi di= x x i − ( ) 2 2

1 x x d i − = 1 ­4 16 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 9 4 16

∑ = 50 i x ( ) 0 = ∑ i d ( ) 32 2

= − ∑ x x i 5 = x 56 , 3

9 32 2 = = S

Fuente: Datos ficticios

( ) 56 , 3

9 32

1 1

2

2 = = −

− =

∑ =

n

x x S

n

i i

Page 64: 7. metodologia y estadistica aplicada a la educacion

6 4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Otra desventaja es que la varianza se expresa, en unidades al cuadrado y no en término de las unidades originales de medición, lo que hace difícil la tarea de relacionar en forma significativa el valor de la varianza con el conjunto original de datos.

Por eso es conveniente, considerar una medida de variabilidad que se exprese en unidades originales. Esta nueva medida denominada desviación estándar se obtiene al extraer a la varianza la raíz cuadrada.

1.4.Desviación estándar muestral

( ) 1

1

2

− =

∑ =

n

x x S

n

i i

( ) 89 , 1 56 , 3

9 32

1 1

2

= = = −

− =

∑ =

n

x x S

n

i i

Desviación estándar poblacional

( ) N

x n

i i ∑

=

− = 1

2 µ σ

Nos debe quedar claro que la desviación estándar mide la variación entre los valores. Los valores cercanos producirán una desviación estándar pequeña, mientras que los valores dispersos producirán una desviación estándar más grande.

2.­Medidas de variabilidad en series de frecuencia simple. Su cálculo

Ejemplo: Calcular la variabilidad de las inasistencias de 32 alumnos

Page 65: 7. metodologia y estadistica aplicada a la educacion

6 5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Tabla N° 7. Inasistencias de 32 alumnos

Nº de inasistencias (xi)

Nº de alumnos (fi)

11 12 12 9 14 5 15 4 23 2

Total 32

FUENTE: Datos ficticios

Cuando se trata de variables cuantitativas discretas el Rango se calcula:

2.1 Rango= Valor máximo ­Valor mínimo + 1

Rango=R = 23 ­ 11+1=13 inasistencia

2.2 Desvío medio en serie de frecuencia simple

∑ ∑

∑ ∑ −

= i

i i

i

i i

f f x x

f f d

DM * *

Cálculo: 1) Se calcula la media aritmética 2) Se calcula los desvíos 3) Se obtiene el valor absoluto y se lo multiplica por su frecuencia 4) Se aplica la fórmula

Inasistencias de 32 alumnos Nº de inasistencias

(xi) Nº de alumnos

(fi) xi*fi x x d i i − = 1 d i i f d *

11 12 132 ­2 2 24 12 9 108 ­1 1 9 14 5 70 1 1 5 15 4 60 2 2 8 23 2 46 10 10 20

32 416 66

13 32 416 *

= = = ∑

∑ i

i i

f f x

x

Page 66: 7. metodologia y estadistica aplicada a la educacion

6 6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

06 , 2 32 66 *

= = = ∑

∑ i

i i

f f d

DM

2.3. Varianza en serie de frecuencia simple

( ) ( ) 1 1

1

2

1

2

2

− =

− =

∑ ∑ ∑

= =

i

n

i i i

n

i i i

f

f x x

n

f x x S

1) Se calcula la media aritmética 2) Se calcula los desvíos 3) Se elevan los desvíos al cuadrado 4) Se multiplica cada desvío al cuadrado por su frecuencia 5) Se aplica la fórmula

Inasistencias de 32 alumnos Nº de inasistencias

(xi) Nº de alumnos

(fi) xi*fi x x d i i − = 2

i d i i f d * 2

11 12 132 ­2 4 48 12 9 108 ­1 1 9 14 5 70 1 1 5 15 4 60 2 4 16 23 2 46 10 100 200

32 416 278 FUENTE: Datos ficticios

( ) 2 1

2

2 97 , 8 31 278

1 32 278

1 días

n

f x x S

n

i i i

= = −

= −

− =

∑ =

2.4 Desviación estándar en serie de frecuencia simple

( ) ( ) 1

*

1

* 1

2

1

2

− =

− =

∑ ∑ ∑

= =

i

n

i i i

n

i i i

f

f x x

n

f x x S

( ) 99 , 2 97 , 8

31 278

1 32 278

1

* 1

2

= = = −

= −

− =

∑ =

n

f x x S

n

i i i

Page 67: 7. metodologia y estadistica aplicada a la educacion

6 7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

3.­ Medida de variabilidad en serie de frecuencias con intervalos de clase

Los siguientes datos corresponden a edades de los alumnos de los 2 ciclos de EGB.

Tabla N°9. Edades de los alumnos de segundo ciclo del EGB

Clases de edad en año

Marca de clase (xi)

fi xi*fi ) ( x x d i i − = 1 d 1 d *fi

6 a 8 7 4 28 ­4 4 16 8 a 10 9 8 72 ­2 2 16 10 a 12 11 11 121 0 0 0 12 a 14 13 12 156 2 2 24 14 a 16 15 2 30 4 4 8 Total 37 407 64

Fuente: Datos ficticios

3.1.Rango L.superior de la última clase – L.inferior de la primera clase. Como los límites superiores de las clases son abiertos, es decir no toma el valor 16, debemos colocar el valor 15,99

R = 15,99 – 6 = 9,99 años

1) Se calculan las marcas de clase y luego la media aritmética 2) Se calcula los desvíos 3) Se elevan los desvíos al cuadrado 4) Se multiplica cada desvío al cuadrado por su frecuencia 5) Se aplica la fórmula

3.2. Desvío medio en serie de frecuencia de intervalos

73 . 1 37 64 *

= = = ∑

∑ i

i i

f f d

DM

1) Se calculan las marcas de clase y luego la media aritmética

Page 68: 7. metodologia y estadistica aplicada a la educacion

6 8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

11 37 407 *

= = = ∑

∑ i

i i

f f x

x

2) Se calcula los desvíos 3) Se obtiene el valor absoluto de los desvíos 4) Se multiplica cada desvío absoluto por su frecuencia, se suma 5) Se aplica la fórmula

3.3. Variancia serie de frecuencia con intervalos de clase

1) Se calculan las marcas de clase y luego la media aritmética 2) Se calculan los desvíos 3) Se elevan los desvíos al cuadrado 4) Se multiplica cada desvío al cuadrado por su frecuencia 5) Se aplica la fórmula

Edades de los alumnos de segundo ciclo del EGB

Clases de edad en año

Marca de clase (xi)

fi xi*fi ) ( x x d i i − = 2 i d

2 i d *fi

6 a 8 7 4 28 ­4 16 64 8 a 10 9 8 72 ­2 4 32 10 a 12 11 11 121 0 0 0 12 a 14 13 12 156 2 4 48 14 a 16 15 2 30 4 16 32 Total 37 407 176

Fuente: Datos ficticios

Varianza en serie de frecuencias con intervalos de clase, la única diferencia con las fórmulas para serie de frecuencias simples es que xi, representa el punto medio de la clase o marca de clase

( ) 2 1

2

2 89 , 4 36 176

1 37 176

1 años

n

f x x S

n

i i i

= = −

= −

− =

∑ =

Page 69: 7. metodologia y estadistica aplicada a la educacion

6 9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

100 . . x S V C =

3.4 Desviación estándar en serie de frecuencias con intervalos de clase.

( ) años

n

f x x S

n

i i i

21 , 2 89 , 4 36 176

1 37 176

1

* 1

2

= = = −

= −

− =

∑ =

COEFICIENTE DE VARIACIÓN

Las cuatro medidas de variabilidad enunciadas precedentemente son medidas de variabilidad absoluta. El coeficiente de variación es una medida de variabilidad relativa.

Expresa la desviación estándar como un porcentaje de la media. Es una medida adimensional, se expresa en % y sirve para comparar la variabilidad entre dos o más distribuciones que provengan de diferentes unidades de medidas o teniendo igual unidad de medida los valores de diferente magnitud.

Coeficiente de variación muestral

Ejemplo Decir cual de las siguientes distribuciones es más variable:

xi: peso de los alumnos de nivel inicial (kg) 34; 29; 28; 31; 40

yi: altura de los alumnos de nivel inicial (m) 1,24 1,54 1,38 1,37 1,56

x =32,4 kg Sx=4,83kg y =1,42 m Sy=0,13m

No podemos decir que la variabilidad en peso es mayor que la variabilidad en altura, ya que las variables están medidas en distintas unidades, para poder compararlas la debemos expresar como porcentaje de sus medias

Page 70: 7. metodologia y estadistica aplicada a la educacion

7 0

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

CVx=(4,83/32,4)*100=14,91%

CVy=(0,13/1,42)*100=9,15%

Conclusión: los alumnos tienen menor variabilidad en altura que en peso.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Uso de la ca lculadora científica para el cálculo de Medidas de Posición y Dispersión Calculadoras Casio modelo fx­82W. Seguir las siguientes instrucciones:

Debe procurar que la calculadora se encuentre en disposición para efectuar cálculos estadísticos. Para ello apriete mode 2. En la parte superior de la pantalla aparece la notación SD.

Debe cerciorarse de que no hay nada acumulado en la memoria. Para ello pulse SHIFT AC = y en su pantalla aparece el número cero. Se está ahora en condiciones de introducir los datos.

Por ejemplo para serie simple: xi: 1 2 3 4 5

Marque el nº 1 y luego la tecla M+

Marque el nº 2 y luego la tecla M+

Marque el nº 3 y luego la tecla M+

Así sucesivamente hasta haber cargado todos los datos.

Para cerciorarse de la cantidad de datos introducidos

Pulse ALPHA y la tecla 3 en el cursor aparece la letra n, apriete ahora = y aparecerá el 5, pues Ud. introdujo los 5 valores. Para obtener la media aritmética pulse SHIFT y la tecla 1, en la pantalla

aparece x apriete = y en su pantalla aparece el valor 3 que es el valor de la media.

Para obtener la desviación estándar marque SHIFT y la tecla 3, aparece en

su pantalla 1 − n σ presione = y en su pantalla aparecerá el valor 1,58

Si aprieta ahora la tecla x 2 obtendrá 2,50 que es el valor de la

Page 71: 7. metodologia y estadistica aplicada a la educacion

7 1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

varianza muestral S 2

Si desea obtener la suma de los valores de x presione Alpha y la tecla 2.

Para el caso de que la serie sea de frecuencia simple

Se coloca la máquina en modo estadística Mode 2

Presione SHIFT AC =; ya tiene la memoria limpia.

Se introduce el valor xi, luego SHIFT, la tecla que tiene la coma. Aparece en la pantalla x i; ahora introduzca el valor de fi y una vez que tenga en la pantalla x i; f i recién apriete M+ ; continúe así hasta introducir todos los valores de su serie, para el cálculo de la media, desviación estándar y varianza se procede luego apretando las teclas indicadas anteriormente.

Cuando se trabaja con todos los datos de una población para el cálculo de la desviación estándar se aprieta SHIFT y la tecla 2

GUÍA DE EJERCITACIÓN

Actividad 1

a) Los siguientes son pesos individuales de 10 alumnos de primer año de EGB:

30, 32, 30.5, 31, 33, 31, 32.9, 34, 34.6, 35

b) En la etapa de diagnóstico destinada a implementar un Plan de Salud Bucal en alumnos de EGB, en una escuela el odontólogo determinó el número de caries que presentaba cada alumno. Los siguientes son número de caries que presentaban 9 de dichos alumnos:

Page 72: 7. metodologia y estadistica aplicada a la educacion

7 2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

2, 4, 0, 2, 3, 5, 1, 2, 2

c) En un curso se tomó ocho alumnos al azar y se les preguntó cuál era el salario que percibía mensualmente su padre. Ellos son los siguientes: 3000, 1000, 570, 400, 600, 1500, 500, 570

1.­ En cada caso determine y clasifique el tipo de variable que se considera.

2.­ ¿Cómo se denomina en cada caso el conjunto de datos obtenidos para la variable que se estudia?

3.­ Determine en cada uno de los incisos a, b y c, la Media Aritmética, Mediana y Modo.

4.­ En cuál de los casos arriba detallados ¿la media no es una Medida de Posición adecuada?

Actividad 2

a) En cada una de las series de datos de la Actividad 1, calcule Rango, Desviación Media, Desviación estándar y Coeficiente de Variación. b) Si Ud. quiere comparar la variabilidad de los datos de cada una de las series presentadas en la Actividad 1, cuál medida de dispersión emplearía?

Page 73: 7. metodologia y estadistica aplicada a la educacion

7 3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Actividad 3

Para realizar una evaluación del Número de puntos obtenidos en una Prueba de Matemáticas realizada a los 30 alumnos de 6° de EGB, se ordenó dicha variable en la siguiente serie de frecuencias:

N° de puntos xi

0 1 2 3 4 5 6 7 8 9 10

N° de alumnos fi

0 1 0 4 3 8 6 4 1 2 1

a) Calcule Media, Mediana y Modo.

b) Determine Desviación Estándar, Varianza y Coeficiente de Variación.

c) Indique si la distribución que se analiza es simétrica o no. En caso de ser asimétrica, indique que tipo de asimetría presenta.

d) A los fines de la evaluación, cuál de las tres Medidas de Posición sería más correcta utilizar?

Actividad 4

Los siguientes datos corresponden a Tipo de Deportes que prefieren los alumnos de una escuela.

Tipo de deportes N° de alumnos fi

Basquet 220 Fútbol 500

Pelota al cesto 180 Hockey 100 Total 1000

a) Indique qué tipo de variable es. b) Determine la Medida de Posición que corresponda a este caso.

Page 74: 7. metodologia y estadistica aplicada a la educacion

7 4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Actividad 5

Las alturas de alumnos de un curso de Polimodal en una escuela se muestran en la siguiente Tabla:

altura (m)

fi

1.10­1.15 3 1.15­1.20 4 1.20­1.25 6 1.25­1.30 5 1.30­1.35 9 1.35­1.40 9 1.40­1.45 6 1.45­1.50 2 1.50­1.55 1 1.55­1.60 1 1.60­1.65 1

a) Qué tipo de variable se considera?

b) Encuentre frecuencias acumuladas, porcentajes y porcentajes acumulados.

c) Encuentre Media Aritmética, Mediana y Modo.

d) Calcule Desviación estándar y Coeficiente de variación.

e) Realice el gráfico de la distribución porcentual acumulada.

f) Determine gráfica y analíticamente el rango percentil para las siguientes alturas: 1.18, 1.47, 1.56, 1.62.

g) Determine gráfica y analíticamente las alturas correspondientes a los percentiles: 10, 25, 50, 75

Page 75: 7. metodologia y estadistica aplicada a la educacion

7 5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

UNIDAD IV

PROBABILIDADES Y DISTRIBUCIONES DE PROBABILIDADES – INFERENCIA ESTADÍSTICA

1.­ INTRODUCCIÓN

La teoría de probabilidad tiene sus orígenes en la teoría de la casualidad. Históricamente, la teoría de la Probabilidad comenzó con el estudio de los juegos de azar, tales como la ruleta y las cartas.

La teoría de la Probabilidad no es tan extraña como pudiera pensarse. Sin duda alguna, en la vida diaria con mucha frecuencia emitimos juicios probabilísticos, aunque a menudo no lo reconocemos como tales.

Por ejemplo, supongamos que, por razones diferentes, usted no está preparado para la clase de hoy. Seriamente usted considera faltar a clase. ¿Qué factores influirán en su decisión? Obviamente una consideración será la probabilidad de que el profesor descubra su falta de preparación. Si el riesgo es alto, usted decide no ir a clase. Veamos, hay dos alternativas posibles:

1. Su falta de preparación será descubierta. 2. Su falta de preparación no será descubierta.

Hay incertidumbre en esta situación porque hay más de una alternativa posible. Su decisión de asistir a clase, dependerá del grado de certeza asociado con cada una de estas alternativas. Así, si usted está bastante seguro de que prevalezca la primera alternativa, usted decidirá no ir a clase.

Supóngase que su profesor con frecuencia pide a los estudiantes que participen en clase activamente. De hecho, usted ha notado que la mayoría de los estudiantes son interrogados en cada sesión de clase. Este es un ejemplo en el cual hay un alto grado de certeza asociada con la primera alternativa. Dicho de esta manera, la probabilidad del primero es mayor que la del segundo. Por consiguiente usted decide no ir a clase. Usted ha tomado una decisión con base en un empleo intuitivo, de la probabilidad.

Antes de estudiar la teoría de la probabilidad, es conveniente comprender bien uno de los conceptos más importantes de la Inferencia Estadística: el concepto de azar

Page 76: 7. metodologia y estadistica aplicada a la educacion

7 6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

2.­ EL CONCEPTO DE AZAR

Definimos una población como el conjunto completo de individuos, objetos o medidas que tienen alguna característica común observable. Muy rara vez se puede estudiar una población. Seleccionamos muestras de una población con la esperanza de que los estadísticos de la muestra nos permitan calcular los parámetros de la población. Para obtener una correspondencia entre un estadístico y un parámetro, la muestra debe representar una selección aleatoria de la población. Una forma de obtener una muestra aleatoria, es mediante el Muestreo al Azar Simple, de tal manera que cada individuo , objeto o medida tenga igual probabilidad de ser seleccionado. Una característica sobre los sucesos aleatorios, es que ningún suceso tiene efecto predecible sobre el siguiente. Podremos comprender más clara y fácilmente el concepto de azar en relación con los “juegos de azar, si suponemos que se juegan limpiamente. Conocer el resultado del lanzamiento de una moneda al aire, del lanzamiento de un dado, del resultado de un juego de ruleta, no nos ayudará en absoluto en la predicción de los resultados por venir. Esta característica de los sucesos al azar se conoce como independencia. Si la independencia existe, podemos hablar de sucesos realmente al azar.

La segunda característica importante del azar es que cuando la muestra se extrae de una población, cada elemento debe tener una probabilidad igual de selección. Así, si nuestra selección o modo de selección favorece ciertos sucesos o ciertas colecciones de sucesos, no podemos afirmar que los resultados son al azar.

3.­ PROBABILIDAD Y ESTADÍSTICA

La Estadística Descriptiva, hace referencia a los datos que se tienen en la mano. Cuando se quiere ir más allá de los datos disponibles, es necesario inferir o sea utilizar la Estadística Inferencial. Como ella infiere el todo (población) a partir de la información que da una parte de ese todo (muestra), el conocimiento que adquiere es incompleto y por lo tanto no “totalmente cierto” es decir, se debe trabajar con probabilidades. Por ello, antes de estudiar las aplicaciones de la Estadística Inferencial es necesario estudiar probabilidades.

Page 77: 7. metodologia y estadistica aplicada a la educacion

7 7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

4.­ TEORÍAS DE PROBABILIDAD

Se puede considerar la probabilidad como la teoría que tiene que ver con los posibles resultados de los experimentos. Estos deben ser potencialmente repetitivos, es decir, debemos ser capaces de reproducirlos bajo condiciones similares. Debe ser posible enumerar cada resultado que pueda ocurrir, y debemos ser capaces de establecer las frecuencias relativas de estos resultados.

Se distingue el enfoque clásico , frecuencial y axiomático de la teoría de probabilidad.

4.1.­EXPERIMENTOS ALEATORIOS. ESPACIO MUESTRAL. EVENTOS.

El lanzamiento de un dado, o de una moneda, la extracción de un naipe de la baraja, de las bolillas de la lotería son experiencias aleatorias, pues sus resultados dependen del azar. También son aleatorios: el tiempo de espera de una persona en la parada del autobús, sexo de los hijos en un matrimonio, el número de hijos que tendrá un matrimonio, etc.

Los primeros (lanzamiento, extracciones) son fáciles de seguir, pues se pueden repetir tantas veces como se quiera de forma rápida. A partir de ellos se obtienen leyes que rigen los fenómenos aleatorios y se aplican al estudio de situaciones aleatorias.

Conceptos necesarios para definir probabilidades

Experimentos aleatorios: son aquellos que, repetidos bajo idénticas condiciones, no arrojan un único resultado sino un conjunto de ellos.

ü Ejemplos: Arrojar un dado ü Arrojar una moneda

Espacio muestral. Es el conjunto de los resultados posibles de un experimento aleatorio y se denota con M.

Ejemplos. ü Para el caso de arrojar un dado, el espacio muestral resultante

es:

Page 78: 7. metodologia y estadistica aplicada a la educacion

7 8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

M= 12 3 4 5 6 , , , , ,

ü Para el caso de arrojar una moneda, el espacio muestral resultante es:

M=C, S

Para el caso de arrojar una moneda y un dado simultáneamente ,el espacio muestral resultante es:

M = (cara, 1) , ( cara , 2 ) .....,(cara , 6) , (sello , 1),...(sello, 6)

Evento simple .Es cada uno de los resultados de un experimento aleatorio que no puede desglosarse en componentes más simples. Se designan con la letra minúscula.

Ejemplos ü Para el caso de arrojar un dado. Obtener el número 1, es un

evento simple, lo mismo ocurre con los números restantes e=1 e=2 ü Para el experimento aleatorio arrojar una moneda al aire, los

evento simples son e=c e=s

Evento compuesto. Es un subconjunto del Espacio Muestral. Es el resultado de la unión de eventos simples. Se lo representa con letra mayúscula. ü Para el caso de arrojar un dado. El espacio muestral es

M= 12 3 4 5 6 , , , , ,

• Obtener número par, es el resultado de la unión de los eventos simples 2, 4, 6, y constituyen un subconjunto del espacio muestral. P=2, 4, 6

• Obtener número impar I=3, 5, 7

• Obtener un número menor que 4 A=1, 2,3

Suceso seguro: es el conjunto total M(espacio muestral).

Page 79: 7. metodologia y estadistica aplicada a la educacion

7 9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Suceso imposible: es el conjunto vacío.

Operaciones con sucesos

En las aplicaciones de la teoría de probabilidades trataremos muchas veces con eventos relacionados entre sí, más que con un solo evento. Por esta razón consideraremos ahora un experimento aleatorio arbitrario, con su espacio muestral correspondiente M, y cualesquiera dos eventos A y B en el experimento. Entonces:

*Union de Eventos A ∪ B ( A unión B , A o B ) representa el evento que ocurre si, y solo si ocurre A u ocurre B o ambos ( Una notación más antigua que representa a A ∪ B es A + B, y el nombre correspondiente es suma de dos eventos)

*Intersección de Eventos. A ∩ B ( A intersección B ó A y B ) representa el evento que ocurre si, y solo si, ocurren A y B simultáneamente, esto es, si ocurren en la misma ejecución del experimento en consideración.

Eventos mutuamente exclusivos. Son los eventos que no ocurren simultáneamente. Este caso se representa solamente cuando

A ∩ B = Ø, el evento vacío, de tal manera que A y B no tienen puntos en común.

*. El evento A es el complemento del evento A con respecto al espacio muestral M y contiene a todos los resultados de M que no se encuentran en A.Ø Ejemplo Para el caso del arrojar una dado, el espacio muestral es

M= 12 3 4 5 6 , , , , ,

ü Evento A obtener un nº par

A=2, 4, 6

A =1, 3, 5

Ø Ejemplo:

Un experimento consiste en tirar un dado y observar el número de puntos que aparece en la cara superior. El espacio muestral se puede

Page 80: 7. metodologia y estadistica aplicada a la educacion

8 0

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

describir fácilmente, ya que es finito. Las posibilidades para el dado son seis: 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles resultados son:

M = 1, 2, 3,4, 5, 6

b) Describir los siguientes eventos: A A: : S Sa al le e u un n n nu um me er ro o p pa ar r. . B B: : S Sa al le e u un n n nú úm me er ro o i im mp pa ar r. . C C: : S Sa al le e u un n n nú úm me er ro o m me en no or r q qu ue e 4 4 D D: : S Sa al le e u un n n nú úm me er ro o m ma ay yo or r q qu ue e 3 3. . E E: : S Sa al le e u un n n nú úm me er ro o i im mp pa ar r o o m ma ay yo or r q qu ue e 3 3. . F F. . S Sa al le e u un n n nú úm me er ro o p pa ar r y y m me en no or r q qu ue e 4 4. . G G: : S Sa al le e u un n n nú úm me er ro o p pa ar r y y u un n i im mp pa ar r. .

S So ol lu uc ci ió ón n

v El evento:”Sale un número par” , está representado por la letra A, su descripción puede realizarse mediante el siguiente conjunto :

A = 2 4 6 , , ,

v El evento “ Sale un número impar ”, está representado por la letra B, su descripción puede realizarse mediante el siguiente conjunto :

B = 1 , 3 , 5 .

v El evento “ Sale un número menor que 4” ”, está representado por la letra C, su descripción puede realizarse mediante el siguiente conjunto :

C= 1 , 2 , 3

v El evento “Sale un número mayor que 3”, está representado por la letra D, su descripción puede realizarse mediante el siguiente conjunto :

D= 4 , 5 , 6

v El evento “ Sale un número impar o mayor que 3”, se representa por la letra E, está formado por todos los resultado de B o de D o de ambos. Este evento recibe el nombre de unión de B y D, se denota por B ∪ D y su

Page 81: 7. metodologia y estadistica aplicada a la educacion

8 1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

descripción puede realizarse mediante el siguiente conjunto:

B ∪ D = E =1 , 3 , 4 , 5 , 6

v El evento “ Sale un número par y menor que 4”, se representa por la letra F, está formado por los resultados comunes tanto a A como a C. Este evento recibe el nombre de intersección de A y C, se denota por A ∩ C y su descripción puede realizarse mediante el siguiente conjunto :

A ∩ C = F = 2

v El evento “ Sale Un número par y un número impar”, se representa mediante la letra G, está formado por la intersección de los eventos A y B, estos eventos no tienen nada en común, por lo tanto la intersección de ellos es vacía. A y B son mutuamente excluyentes o disjuntos..

A ∩ B = G = = ∅

4.2. DEFINICIÓN CLÁSICA DE PROBABILIDAD (PROBABILIDAD A PRIORI)

Supóngase que queremos conocer la probabilidad de que una moneda caiga con la cara hacia arriba. Como hay solo dos posibles resultados (cara o seca) adoptamos una situación ideal en la cual esperamos que cada resultado tenga igual probabilidad de ocurrir. Así, la

probabilidad de que se presente una cara, P ( C) = 2 1

Definición :La probabilidad de un evento A en un experimento aleatorio está dado por: el cociente entre el número de casos favorables y el número de casos igualmente posibles

posibles igualmente casos de total N A a favorables casos de N A P

º º

) ( =

Por ejemplo, la probabilidad de extraer el as de espada de una baraja ordinaria de 52 cartas es 1/52.

Page 82: 7. metodologia y estadistica aplicada a la educacion

8 2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

ü Pero la probabilidad de sacar un as de espada rojo es cero (puesto que no hay figuras de espadas rojas en la baraja) no hay sucesos posibles que favorezcan este resultado.

ü Si los eventos son mutuamente excluyentes (esto es, si los dos eventos no pueden ocurrir simultáneamente), pues A ∩ B = Ø , la P (Ø ) = 0

4.3. DEFINICIÓN DE PROBABILIDAD FRECUENCIAL (PROBABILIDAD A POSTERIORI)

Las probabilidades se aproximan después de realizar la experiencia. Por ejemplo, para saber cuál es la probabilidad de obtener el as con un dado determinado, se arroja el dado 600 veces en las cuales se obtienen 113 veces un as.

La probabilidad de obtener un as con ese dado es estimada por la frecuencia relativa = 113/600 = 0.1883.

Realice ( u observe) un procedimiento un gran número de veces y cuente las ocasiones que el suceso A ocurre en realidad. Con base en estos resultados reales, P(As) se estima de la siguiente forma :

P(As) f

f f (As) r(As) ≈ =

4.4. AXIOMAS DE PROBABILIDAD

1.­ Si E es un evento cualquiera en un espacio muestral M , entonces

0≤ P ( E ) ≤ 1 La probabilidad de un suceso varía entre 0 y 1.

2.­ Al espacio muestral M completo le corresponde

P ( M ) = 1

3.­ Si A y B son eventos mutuamente exclusivos, entonces se cumple

P ( A ∪ B ) = P ( A ) + P ( B )

Page 83: 7. metodologia y estadistica aplicada a la educacion

8 3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Si el espacio muestral es infinito, debemos reemplazar el axioma 3 por

3* .­ Si E1 , E 2 , . . . . son eventos mutuamente exclusivos, entonces tenemos que

P (E1 ∪ E 2 ∪ . . . ) = P ( E1 ) + P ( E 2 ) + ........

4.5. PROPIEDADES:

1.­ Si Ø es el conjunto vacio, entonces P (Ø ) = 0 . Imposibilidad

Por ejemplo, la probabilidad de extraer el as de espada de una baraja ordinaria de 52 cartas es 1/52. Pero la probabilidad de sacar un as de espada rojo es cero (puesto que no hay figuras de espadas rojas en la baraja).no hay sucesos posibles que favorezcan este resultado.

2.­ Si E c es el complemento de un evento E , entonces

P (E c ) = 1 – P( E )

3.­ Si A ⊂ B , entonces P ( A ) menor o igual a P ( B ).

v La probabilidad de que ocurra el evento A , es decir que al lanzar un dado salga un número par , se calcula como

P(A) =3/6 = 1/2 donde: • el número de resultados favorables es 6, ya que A = 2, 4, 6 ,

tiene 3 elementos. • el número total de resultados es 6, ya que M= 1 , 2 , 3 , 4 ,5, 6

tiene 6 elementos.

v La probabilidad de que ocurra el evento B, es decir que al lanzar un dado salga un número impar , se calcula como

P(B) =3/6 = 1/2 donde: • el número de resultados favorables es 6, ya que B = 1,3,5 ,

tiene 3 elementos. • el número total de resultados es 6, ya que M = 1 ,2 ,3, 4, 5 , 6

tiene 6 elementos.

Page 84: 7. metodologia y estadistica aplicada a la educacion

8 4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

v La probabilidad de que ocurra el evento C, es decir que al lanzar un dado salga un número menor que 4 , se calcula como

P(C) =3/6 = 1/2 donde: • el número de resultados favorables es 6, ya que C= 1 ,2, 3 ,

tiene 3 elementos. • el número total de resultados es 6, ya que M = 1 , 2, 3, 4, 5 , 6

tiene 6 elementos.

v La probabilidad de que ocurra el evento D, es decir que al lanzar un dado salga un número mayor que 3 , se calcula como

P(D) =3/6 = 1/2 donde: • el número de resultados favorables es 6, ya que D= 4, 5, 6 ,

tiene 3 elementos. • el número total de resultados es 6, ya que M = 1 , 2,3 , 4, 5 , 6

tiene 6 elementos.

v La probabilidad de que ocurra el evento E, es decir que al lanzar un dado salga un número impar o mayor que 3 , se calcula como

P(E) =5 / 6 donde: • el número de resultados favorables es 5,ya que E=1,3,4,5,6 ,

tiene 5 elementos. • el número total de resultados es 6, ya que M = 1 , 2, 3 , 4 ,5, 6

tiene 6 elementos.

v La probabilidad de que ocurra el evento F, es decir que al tirar un dado salga un número par y menor que 4 , se calcula como

P(F) =1 / 6 donde: • el número de resultados favorables es 1, ya que F = 2 , tiene 1

elemento. • el número total de resultados es 6, ya que M = 1,2 , 3 , 4, 5, 6

tiene 6 elementos.

v La probabilidad de que ocurra el evento G, esta formado por la intersección de los eventos A y B que son

Page 85: 7. metodologia y estadistica aplicada a la educacion

8 5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

mutuamente excluyentes, decir que al lanzar un dado ,” un número impar y par “ , es cero, ya que es imposible de que ocurra dicho evento. La probabilidad del evento nulo o vacio siempre es 0.se calcula como

P(G) = P (Ø ) = 0 donde: • el número de resultados favorables es vacio, ya que G = . • el número total de resultados es 6, ya que M = 1, 2, 3, 4 , 5 , 6

tiene 6 elementos.

4.5.TEOREMA DE LA SUMA DE PROBABILIDADES

Sean A y B dos eventos del espacio muestral M generado por un experimento aleatorio. El teorema de la suma de probabilidades dice que la probabilidad de la unión de A y B es la suma de las probabilidades menos la probabilidad de la intersección. En símbolos:

Sean A y B ⊂ M entonces P ( A ∪ B ) = P ( A ) + P ( B ) ­ P ( A ∩ B )

Si los eventos son mutuamente excluyentes, el último término desaparece, pues A ∩ B = Ø y P (Ø ) = 0

P ( A ∪ B ) = P ( A ) + P ( B )

ü En el ejemplo, calcule la probabilidad del evento “ sale cara o sale un número par” correspondiente al experimento de lanzar simultáneamente un dado y una moneda, utilizando el teorema de la suma de probabilidades.

El espacio muestral M= (1,c); (1,s); (2,c); (2,s) ; (3,c); (3,s) ; (4,c); (4,s) ; (5,c); (5,s) ; (6,c); (6,s)

c: salga cara P: salga número par

P ( C ∪ P ) = P ( C ) + P ( P ) ­ P ( C ∩ P )

P (C ∪ P )= 75 , 0

4 3

12 9

12 3

12 6

12 6

= = = − +

Page 86: 7. metodologia y estadistica aplicada a la educacion

8 6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

4.6. PROBABILIDAD CONDICIONAL

Muchas veces necesitamos encontrar la probabilidad de un evento B si se sabe que ha ocurrido un evento A. Esta probabilidad se llama probabilidad condicional de B dado A, y se representa como P ( B / A ) . En este caso A sirve como un espacio muestral nuevo ( reducido ) , y la probabilidad es la fracción de P( A) que corresponde a A ∩B. Así que

P(B/A) =

( ) ( ) A P

B A P ∩

Del mismo modo, la probabilidad condicional de A dado B es

( ) B A P / =

( ) ( ) B P

B A P ∩

. Volviendo al ejemplo del dado:

a) halle la probabilidad de que aparezca un número menor que 4 dado que apareció un número mayor que 3

b) halle la probabilidad de que aparezca un número impar dado que apareció un número mayor que 3

Solución :

a) P ( C / D ) se denomina probabilidad condicional de C dado que ha ocurrido el evento D , se define como

P ( C / D ) = P ( C ∩ D ) / P( D )

En este caso M = 1 , 2 , 3 , 4 , 5 , 6

C = 1 , 2 , 3 , D = 4 , 5 , 6 , P( D ) = 3 / 6 = 1 /2 , P( C ∩ ) = 0

P ( C / D ) = 0 / ½ = 0

b) P ( B / D) es la probabilidad condicional de que aparezca un número impar dado que apareció un número mayor que 3.

P( D )= 3 / 6 = 1 / 2 P ( B ∩ D ) = 1/6

P ( B / D = P( B ∩ D ) / P( D ) = 1/6 / 12 = 1/3

Page 87: 7. metodologia y estadistica aplicada a la educacion

8 7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

4.7..TEOREMA DEL PRODUCTO DE PROBABILIDADES

En ocasiones, nos encontramos con la necesidad de determinar la probabilidad de ocurrencia simultánea de dos o mas eventos. Para obtener este resultado, deberemos aplicar la regla de multiplicación

Regla de la Multiplicación : Si A y B son eventos contenidos en un espacio muestral M , y P ( A ) > 0 y P ( B ) > 0, entonces se cumple que

P ( A y B ) = P(A∩B) = P(A) • P(B /A) = P ( B ) • P ( A / B )

Cuando los eventos son independientes: En el caso especial en el que la ocurrencia de A no está en absoluto relacionada con la ocurrencia de B y viceversa , se dice que los sucesos son independientes. La independencia se representa simbólicamente por

P ( B/ A ) = P(B) y P (A /B)=P(A).

Cuando los eventos son independientes la regla de la multiplicación se simplifica a : Si A y B son eventos contenidos en un espacio muestral M y P(A)> 0 y P(B)> 0, entonces “La probabilidad de la intersección es el producto de las probabilidades” :

P ( A y B ) = P(A∩B) = P(A) • P(B)

En el ejemplo del dado : son A y C independientes? Si la probabilidad del resultado A no depende de la ocurrencia de un

segundo evento C ( o viceversa) se dice que A y C son eventos independientes. En términos de probabilidad se expresa que A y C son eventos independientes si

P ( A / C ) = P ( A ) ó bien P ( C / A ) = P ( C ) En este caso A y C no son eventos independientes ( se denominan

dependientes), debido a que

Page 88: 7. metodologia y estadistica aplicada a la educacion

8 8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

3 6

3 6

1 6

3 6

1 6 1

3

1 2

3 6

Si al lanzar un dado

M:1,2,3,4,5,6

A: número par B: numero impar

P (A)=

P (C)=

P (A ∩ C)=

P (A/C):

P(A)=

P ( A / C ) = 1 / 3 que no es igual a P ( A ) = 1 / 2 , Y

P ( C / A ) = 1/3 que no es igual a P ( C ) = 1/2

Debemos notar que los sucesos mutuamente exclusivos no son nunca in dependientes, puesto que la ocurrencia de uno niega la posibilidad de ocurrencia del segundo. Entonces :

P( A/ B ) = P( B/ A) = 0

Muestreo con y sin reemplazo

Hay dos maneras de extraer objetos para obtener una muestra de un conjunto dado de objetos, conocido como muestreo de una población; estas son las siguientes.

Page 89: 7. metodologia y estadistica aplicada a la educacion

8 9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

1.­ Muestreo con reemplazo significa que el objeto que se extrajo al azar se coloca de nuevo en el conjunto dado, se mezcla completamente y se precede a extraer al azar el siguiente objeto.

2. Muestreo sin reemplazo significa que el objeto que se extrajo se deja aparte y no se lo introduce nuevamente.

Ø Ejemplo

Una caja contiene 10 cuadernos, de los cuales 3 están con fallas. Dos cuadernos se extraen al azar sin reemplazo. Encontrar la probabilidad del evento tal que ninguno de los 2 cuadernos tenga fallas.

Solución: Consideremos los eventos

A : El primer cuaderno extraído no tiene fallas. B: El segundo cuaderno extraído no tiene fallas.

Es claro que P ( A ) = 7/10, ya que 7 de los 10 cuadernos no son defectuosos y estamos muestreando aleatoriamente, por lo cual cada cuaderno tiene la misma probabilidad ( 1/10 ) de ser escogido.

Si A ocurre, entonces quedan 9 cuadernos en la caja, 3 de los cuales tienen fallas, por lo que

P ( B / A )= = 6 / 9 = 2 / 3

Y por el teorema de la multiplicación, la respuesta es

P ( A ∩ B ) = 7 /10 . 2 / 3 = 0,47

Ø Ejemplo

Si se seleccionan dos cartas de un paquete de naipes bien barajado, ¿ cuál es la probabilidad de que ambas sean reinas?.

Solución Hay dos maneras de seleccionar las cartas: 1) Se puede seleccionar una carta, reponerla en la baraja , barajar y extraer una segunda carta. (Muestreo con reemplazo). 2) Se pueden seleccionar las dos cartas consecutivamente sin reemplazar la primera en la baraja (Muestreo sin reemplazo)

Page 90: 7. metodologia y estadistica aplicada a la educacion

9 0

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

1º. Sea A el suceso de una reina en la primera extracción, y B el suceso de una reina en la segunda extracción. Cuando el muestreo es con reemplazo, la probabilidad de extraer una reina permanece igual en las dos extracciones. Así, puesto que

P ( A / B ) = P ( A ) y P ( B / A ) = P ( B ) , as dos extracciones son independientes, por lo tanto

P ( A ∩ B ) = P ( A ) . P ( B ) = 1/13 . 1/13 = 1 / 69

2º. Cuando se emplea el muestreo sin reemplazo la probabilidad de obtener una reina en la segunda extracción se reduce siempre que la primera carta seleccionada haya sido una reina. En otras palabras , cuando P ( B / A ) ≠ P ( B ) o P ( A / B ) ≠ P ( A ) , los sucesos no son independientes.. La probabilidad de extraer una reina en el segundo intento es 3 / 51. Empleando la fórmula correspondiente, encontramos que la probabilidad de seleccionar dos reinas en extracciones consecutivas procedentes de una baraja sin reemplazo , es :

P ( A ∩ B ) = P ( A ) . P ( B / A ) = 1 / 13 . 3 / 51 = 1 / 221

Se debe notar que la diferencia entre ambos muestreos es despreciable cuando la población es grande en relación con el tamaño de la muestra.

Ø Ejemplo: Para un estudio, se obtiene una muestra de alumnos de una escuela y se los clasifica según lugar de residencia y el medio de transporte que utilizan para llegar a la misma, obteniéndose los siguientes resultados:

Medio para llegar a la escuela Lugar de residencia Caminado Bicicleta Ómnibus

Total

Barrio A 100 20 50 170 Barrio B 50 20 30 100 Barrio C 30 10 5 45 Total 180 50 85 315

Suponga que se selecciona un alumno al azar de este grupo. Obtenga las probabilidades siguientes

ü Que el alumno resida en el barrio A

Page 91: 7. metodologia y estadistica aplicada a la educacion

9 1

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

= = 315 170 ) (A P

0.5397 ü Que el alumno resida en el barrio A o en el B

P(A∪B)=P(A)+P(B)= 8571 . 0

315 270

315 100

315 170

= = +

ü Que el alumno no sea del Barrio A

315 170 315 ) ( −

= A P =

4603 . 0 315 145

=

ü Que el alumno sea del Barrio A y vaya caminando a la escuela

P(A∩C)= 315 100

=0.3175 ü Probabilidad que el alumno vaya en ómnibus a la escuela dado que

vive en el barrio B

P(B/O)=

3 , 0 100 30

315 100 315 30

) ( ) (

= = = B P O B P I

ü Probabilidad que el alumno vaya en ómnibus a la escuela o viva en el barrio B

P(O∪B)=P(O)+P(B)­ P(O∩B)= 315 155

315 30

315 100

315 85

= − + =0.4921

Page 92: 7. metodologia y estadistica aplicada a la educacion

9 2

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

5.­ DISTRIBUCIÓN DE PROBABILIDAD

Una distribución de probabilidad no es más que, como su nombre lo indica, la asignación a cada evento posible, de un experimento, de la probabilidad que le corresponde.

Definición. Cualquier regla o mecanismo que sirva para determinar

P( X = x) , probabilidad de que la variable aleatoria X tome cada uno de los valores posibles x , se denomina una Distribución de Probabilidad

Existen dos tipos de distribuciones que son importantes en las aplicaciones prácticas, a saber: las distribuciones discretas y las continuas. Una distribución discreta surge al contar ( por ejemplo, obtener un 6 y un 4 al lanzar dos dados , o bien sacar un rey al extraer una carta de la baraja española). Una distribución continua aparecerá si se mide ( por ejemplo altura de los alumnos y alumnas de la clase).

Entre todas las distribuciones discretas, la Distribución Binomial es la más sencilla. Entre las distribuciones continuas veremos la Distribución Normal.

5.1. VARIABLE ALEATORIA

Una variable aleatoria X es una función cuyos valores son números reales y dependen del “azar” .

5.2.DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE ALEATORIA DISCRETA

La siguiente es la distribución de la variable aleatoria Xi = nº de puntos obtenidos al arrojar un dado perfecto , o sea que todas sus caras son igualmente posibles:

xi 1 2 3 4 5 6 Total P(xi) 1/6 1/6 1/6 1/6 1/6 1/6 1

Obsérvese que se cumplen dos condiciones que son necesarias para que un conjunto de pares ordenados (x,y) sea considerada una distribución de probabilidades:

Page 93: 7. metodologia y estadistica aplicada a la educacion

9 3

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

1) Para cada valor de x le corresponde un único valor de y que es un valor de probabilidad (no negativo y menor o igual a 1),

2) ( ) ∑

M i x P

=1 3) Esta distribución recibe el nombre de uniforme, es una distribución

de variable aleatoria discontinua y sus parámetros son los valores mínimo (a) y máximo (b) que puede tomar x. Esto se indica como X ~ U (a, b).

5.2.1. DISTRIBUCIÓN BINOMIAL.

La variable X toma los valores 0, 1, 2, 3, ... , n. (donde n es finito y bien determinado). Se puede considerar que la Distribución Binomial es la repetición de n pruebas independientes (por ejemplo tomar 4 pruebas en un año). La función de probabilidades es:

x n x x n q p C x P − = ) ( ,

donde x n C son las combinaciones de n elementos tomadas de a x,

p= probabilidad de éxito en una sola prueba, q = 1­ p = probabilidad de fracaso.

La combinaciones se calculan como sigue: x n C = (n.(n­1). (n­2)...(n­

x+1))/x!

Los parámetros que definen a la distribución Binomial son n y p

Las dos características necesarias de una distribución de probabilidad consisten en que cada valor de P ( X = xn , p ) tiene que ser mayor o igual a 0 y que la suma de todos los valores de P ( X = x n , p ) debe ser igual a 1.

Ø Ejemplo :Cuando se recibe un envío de lápices en la escuela, se seleccionan de manera aleatoria, 15 unidades con el propósito de verificar el porcentaje de unidades defectuosas en el envío. Con base en información pasada, la probabilidad de tener una unidad defectuosa es de 0.05. La directora ha decidido no recibir el envío cada vez que una muestra de 15 unidades tenga dos o más defectuosas. ¿Cuál es la probabilidad de que, se rechace el envío?

Page 94: 7. metodologia y estadistica aplicada a la educacion

9 4

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Solución El modelo de distribución apropiado para esta situación es la distribución binomial, se puede suponer que las 15 unidades que se seleccionan al día, constituyen un conjunto de ensayos independientes de manera tal que la probabilidad de tener una unidad defectuosa es de 0.05 entre ensayos. Definimos a la variable aleatoria X : “número de unidades defectuosas” que se encuentran entre las 15 unidades seleccionadas. El evento se definirá como A : unidad defectuosa.

La probabilidad de A es P(A) = 0,05 El número de ensayos n = 15 La probabilidad de que el envío no se reciba, es igual a la probabilidad de que X sea igual o mayor que dos:

P(X ≥ 2) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)]

P(0 15, 0,05) =

0 15 0 ) 05 , 0 1 ( ) 05 , 0 ( − − 0)! ­ (15 0!

15!

= 1(0,95) 15 = 0.4631

P(1 15, 0,05) = 1 15 1 ) 05 , 0 1 ( ) 05 , 0 ( − −

1)! ­ (15 1! 15!

= = 15(0,05)(0,95) 14 = 0,3658

P(X ≥ 2 15, 0,05) = 1 – P(X < 2) = =1 – (0,4631 + 0,3658) = 1 – 0,8289 = 0,1711

Por lo tanto la probabilidad de que, el envío sea rechazado es de 0,1711.

La distribución binomial es realmente una familia de distribuciones, puesto que para cada valor diferente de n y p , que se denominan parámetros de la distribución binomial, se puede definir una distribución diferente. Sin tener en cuenta el valor de n , la distribución es simétrica cuando p = 0,5. Cuando p es mayor que 0,5, la distribución es asimétrica y su máximo se encuentra a la derecha del centro. Cuando p es menor que 0,5, la distribución es asimétrica y su máximo se encuentra a la izquierda del centro.

Page 95: 7. metodologia y estadistica aplicada a la educacion

9 5

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Tablas de la Distribución Binomial El cálculo de las probabilidades binomiales mediante la ecuación anterior puede resultar laborioso cuando n es grande .Afortunadamente hay tablas de probabilidades binomiales y entonces no es necesario el uso directo de la ecuación. Solamente necesitamos utilizar una tabla con los valores dados de n , p y x para obtener la probabilidad deseada

Para explicar el uso de la Tabla consideremos nuevamente el ejemplo en el cuál deseábamos conocer: La probabilidad de que la dirección rechace el envío es igual a la probabilidad de que X sea igual o mayor que dos : para hallar esta probabilidad en la tabla ,localizamos primero n = 15 ,luego la columna de p = 0,05 y finalmente para x ,las filas marcadas con un 0 y un 1

P(X ≥ 2 15 , 005) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)] = 1 – [0.463 + 0.366] = 0.171

p n x 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 0,99 x 13 0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0

1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+ 0+ 0+ 1 2 7 111 245 268 139 045 010 001 0+ 0+ 0+ 0+ 0+ 2 3 0+ 21 100 246 218 111 035 006 001 0+ 0+ 0+ 0+ 3 4 0+ 3 28 154 234 184 087 024 003 0+ 0+ 0+ 0+ 4 5 0+ 0+ 006 069 180 221 157 066 014 001 0+ 0+ 0+ 5 6 0+ 0+ 001 023 103 197 209 131 044 006 0+ 0+ 0+ 6 7 0+ 0+ 0+ 006 044 131 209 197 103 023 001 0+ 0+ 7 8 0+ 0+ 0+ 001 014 066 157 221 180 069 006 0+ 0+ 8 9 0+ 0+ 0+ 0+ 003 024 087 184 234 154 028 003 0+ 9 10 0+ 0+ 0+ 0+ 001 006 035 111 218 246 100 021 0+ 10 11 0+ 0+ 0+ 0+ 0+ 001 010 045 139 268 245 111 0+ 11 12 0+ 0+ 0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12 13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 13

14 0 869 488 229 044 007 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 1 123 359 356 154 041 007 001 0+ 0+ 0+ 0+ 0+ 0+ 1 2 008 123 257 250 113 032 006 001 0+ 0+ 0+ 0+ 0+ 2 3 0+ 026 14 250 194 085 022 003 0+ 0+ 0+ 0+ 0+ 3 4 0+ 004 035 172 229 155 061 014 001 0+ 0+ 0+ 0+ 4 5 0+ 0+ 008 086 196 207 122 041 007 0+ 0+ 0+ 0+ 5 6 0+ 0+ 001 032 126 207 183 092 023 002 0+ 0+ 0+ 6 7 0+ 0+ 0+ 009 062 157 209 157 062 009 0+ 0+ 0+ 7 8 0+ 0+ 0+ 002 023 092 183 207 126 032 001 0+ 0+ 8 9 0+ 0+ 0+ 0+ 007 041 122 207 196 086 008 0+ 0+ 9 10 0+ 0+ 0+ 0+ 001 014 061 155 229 172 035 004 0+ 10

Page 96: 7. metodologia y estadistica aplicada a la educacion

9 6

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

11 0+ 0+ 0+ 0+ 0+ 003 022 085 194 250 114 026 0+ 11 12 0+ 0+ 0+ 0+ 0+ 001 006 032 113 250 257 123 008 12 13 0+ 0+ 0+ 0+ 0+ 0+ 001 007 041 154 356 359 123 13 14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 007 044 229 488 869 14

15 0 860 463 206 035 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 1 130 366 343 132 031 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1 2 0+ 135 267 231 092 022 003 0+ 0+ 0+ 0+ 0+ 0+ 2 3 0+ 031 129 250 170 063 014 002 0+ 0+ 0+ 0+ 0+ 3 4 0+ 005 043 188 219 127 042 007 0+ 0+ 0+ 0+ 0+ 4 5 0+ 001 010 103 206 186 092 024 003 0+ 0+ 0+ 0+ 5 6 0+ 0+ 002 043 147 207 153 061 012 001 0+ 0+ 0+ 6 7 0+ 0+ 0+ 014 081 177 196 118 035 003 0+ 0+ 0+ 7 8 0+ 0+ 0+ 003 035 118 196 177 081 014 0+ 0+ 0+ 8 9 0+ 0+ 0+ 001 012 061 153 207 147 043 0+ 0+ 0+ 9 10 0+ 0+ 0+ 0+ 003 024 092 186 206 103 010 001 0+ 10 11 0+ 0+ 0+ 0+ 001 007 042 122 219 188 043 005 0+ 11 12 0+ 0+ 0+ 0+ 0+ 002 014 063 170 250 129 031 0+ 12 13 0+ 0+ 0+ 0+ 0+ 0+ 003 022 092 231 267 135 009 13 14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 031 132 343 366 130 14 15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 035 206 463 860 15

5.3. DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE ALEATORIA CONTINUA

En estas distribuciones no es posible calcular la probabilidad en puntos sino que hay que hacerlo en intervalos. Recuérdese que en las variables discontinuas las probabilidades de intervalos se obtenían sumando las probabilidades que corresponden a cada punto o valor de la variable. En variables continuas, los valores que puede tomar la variable son infinitos por lo que es necesario hacer una suma infinita es decir una integral. En las variables continuas, la probabilidad de un intervalo se obtiene integrando la función de densidad.

ü Ejemplo: la distribución rectangular X ~ R (0,2). Esta es una distribución rectangular (todos sus puntos tienen igual

densidad de probabilidad) que se extiende desde 0 a 2. El gráfico de su función de densidad es el siguiente:

Page 97: 7. metodologia y estadistica aplicada a la educacion

9 7

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

en el que se puede observar que la función de densidad f(x) = 1/2 La probabilidad de encontrar valores de variables entre 1 y 2 se encuentra integrando la función de densidad entre esos límites. La integral entre esos límites corresponde al área bajo de la curva entre los mismos.

5.3.1.LA DISTRIBUCIÓN NORMAL

Si una variable es continua, varía desde −∞ hasta + ∞ y su función de densidad es:

f (x) = 1 2 σ π

µ σ e x

− −

1 2

2

, se dice que x tiene distribución normal con parámetros µ σ y (media aritmética y desviación estándar). Esto se simboliza como sigue :

X ~ N ( µ σ , )

Page 98: 7. metodologia y estadistica aplicada a la educacion

9 8

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Su gráfica es la siguiente:

La distribución normal presenta las siguientes características:

1) Presenta un máximo en x = µ , por lo tanto Mo = µ

2) Es simétrica y su eje de simetría es f ( ) µ , por lo que se deduce que Md = µ = Mo.

3) Tiene dos puntos de inflexión ubicados en x = µ σ ±

4) Toda transformación lineal de x da otra distribución normal.

5) Algunos sectores usados de la función son:

x = µ σ ± corresponde aproximadamente al 68 % central x = 2 µ σ ± corresponde aproximadamente al 95 % central x = 3 µ σ ± corresponde aproximadamente al 99 % central

6) f(x) se acerca asintóticamente al eje x o sea que f(x) > 0.

1) Por ser función de densidad, el área bajo de la curva es f x dx ( ) = 1

−∞

+∞

Para calcular la probabilidad de un intervalo en la distribución normal, por tratarse de una variable continua, debe hacerse mediante la

4 6 8 10 12 14 x

0,00

0,10

0,20

0,30

0,40

f (x)

Page 99: 7. metodologia y estadistica aplicada a la educacion

9 9

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

integración de la función de densidad, lo cual equivale a calcular el área bajo de la curva. Considérese por ejemplo que la altura de los alumnos de la escuela tiene distribución normal con media µ = 1,6 m y desviación estándar σ = 0,1 m. La probabilidad de que al seleccionar un alumno al azar, posea altura comprendida entre 1,5 y 1,65 (P(1,5<x<1,65)) se obtiene integrando la función de densidad f(x), (en la cual se debe reemplazar los valores correspondientes de µ y σ por 1,6 y 0,1 respectivamente) entre los límites 1,5 y 1,65.

La distribución normal estándar Usando la propiedad que dice que la transformación lineal

z = x ­ µ σ conduce a una distribución también normal, cuyos

parámetros son µ σ z = O y = 1 z , se obtiene una nueva distribución que se conoce con el nombre de distribución normal estándar o normal 0,1 y se la describe como

Z ~ N(0,1) cuya representación gráfica es la siguiente:

­5 ­3 0 3 5 z

Page 100: 7. metodologia y estadistica aplicada a la educacion

1 00

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Tablas de la distribución normal

El cálculo de probabilidades en la normal involucra el cálculo de integrales que son muy engorrosas de resolver manualmente. Por ello, las integrales están tabuladas para una distribución normal que es la estándar.

Vamos a aprender el uso de tablas de una cola

Tabla de “ 1 cola”

En ella, los valores de probabilidad se encuentran en el cuerpo de la tabla y los valores de z se forman utilizando la primera columna y la primera fila (es decir en lo que se conoce como matriz de la tabla). En esta tabla es importante considerar el signo de z.

Como su nombre lo indica, para el valor de z considerado, da el valor del área bajo de la curva desde menos infinito hasta z. Por ejemplo si z = ­2.1 la tabla da P(z < ­2.1) = 0.0179.

Ø Ejemplo : Una población de pesos de alumnos en gr tiene distribución normal con media y desviación estándar ( µ σ y ) de 50 y 5 Kg. respectivamente. ¿Cuál es la probabilidad de

ü que los alumnos pesen menos de 55 kg En símbolos, la probabilidad buscada es P(x ≤ 55)

Para solucionar esto es necesario pasar de la normal que nos interesa a la normal estándar. Esto se consigue mediante el siguiente cambio de variable:

z = x ­ µ

σ en este caso x = 55 , 5 = y 50 = σ µ por lo que

z = (55 ­ 50)/5 = 1.

P(x ≤ 55) = P(z ≤ 1) = 0,8413

Cuando se busca una valor por menor, la probabilidad se obtiene directamente en la tabla.

ü que los alumnos pesen más de 57,75 kg En símbolos, la probabilidad buscada es P(x ≥ 57,75)

Page 101: 7. metodologia y estadistica aplicada a la educacion

1 01

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Para solucionar esto es necesario pasar de la normal que nos interesa a la normal estándar. Esto se consigue mediante el siguiente cambio de variable:

z = x ­ µ

σ en este caso x = 57.75 , 5 = y 50 = σ µ por lo que

z = (57,75 ­ 50)/5 = 7,7/5 = 1,54.

P(x ≥ 57,75)= P(z ≥ 1,54) = 1­ P(z ≤ 1,54)=1­0,9382=0,0618

z .00 .01 .02 .03 .04 1.0 0.841

3 0.843 8

0.846 1

0.8485 0.850 8

1.1 0.864 3

0.866 5

0.868 6

0.8708 0.872 9

1.2 0.884 9

0.886 9

0.888 8

0.8907 0.892 5

1.3 0.903 2

0.904 9

0.906 6

0.9082 0.909 9

1.4 0.919 2

0.920 7

0.922 2

0.9236 0.925 1

1.5 0.933 2

0.934 5

0.935 7

0.9370 0.938 2

1.6 0.945 2

0.946 3

0.947 4

0.9484 0.949 5

1.7 0.955 4

0.956 4

0.957 3

0.9582 0.959 1

1.8 0.964 1

0.964 9

0.965 6

0.9664 0.967 1

1.9 0.971 3

0.971 9

0.972 6

0.9732 0.973 8

2.0 0.977 2

0.977 8

0.978 3

0.9788 0.979 3

2.1 0.982 1

0.982 6

0.983 0

0.9834 0.983 8

2.2 0.986 1

0.986 4

0.986 8

0.9871 0.987 5

Page 102: 7. metodologia y estadistica aplicada a la educacion

1 02

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

ü que los alumnos pesen entre de 52,75 kg y 60 kg En símbolos, la probabilidad buscada es P(52,75 ≤ x ≤ 60) Para solucionar esto es necesario pasar de la normal que nos interesa a la normal estándar. Esto se consigue mediante el

siguiente cambio de variable σ µ ­ x = z

, se buscan dos valores de z, primero para el valor mayor de x, luego para el menor

2 5 10

5 5

= = 0 ­ 60 = z 2 55 , 0 5 75 , 2

5 5

= = 0 ­ 52,75 = z 1

Se buscan los valores en la tabla para z=2; P(z ≤ 2)=0,9861 Se buscan los valores en la tabla para z=0,55; P(z ≤ 0,55)=0,7088

Luego se restan los valores P(52,75 ≤ x ≤ 60)= P(0,55 ≤ z ≤ 2)=0,9861­0,7088=0,2773

Los valores de zα más usados y que determinan intervalos centrales (1­α) son:

• 64 , 1 10 , 0 ± = z para el 90 % central

• 96 , 1 05 , 0 ± = z para el 95% central

• 58 , 2 01 , 0 ± = z para el 99% central

Ejemplo

En la población de pesos X ~ N(50 ; 5) ¿cuál es el intervalo que corresponde al 95 % central de la población?

En la distribución de z, el 95 % central de la población corresponde al intervalo que va desde ­1.96 a +1.96, o sea ± 1.96. Es muy simple, si se desea que en el centro esté el 95 % o, en tanto por uno, 0.95, entonces en

las colas debe quedar el 0.05. el valor que corresponde 96 , 1 05 , 0 ± = z .

Ya se determinó el intervalo en z, ¿cómo se pasa a la normal con media 50 y desviación estándar 5? Se debe hacer el cambio inverso de variable:

z = x ­

entonces x = z µ

σ µ σ ±

.

Page 103: 7. metodologia y estadistica aplicada a la educacion

1 03

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Para indicar que el intervalo corresponde a un porcentaje central determinado se acostumbra a llamar α a lo que queda en las colas.

x = z µ σ α ±

Volviendo entonces al ejemplo, por ser z α = 1.96, el intervalo que corresponde al 95 % central de la población de pesos de los alumnos es:

x = 50 ± 1.96 5 = 50 ± 9,80 .

El intervalo del 95 % central entonces va desde 40,20 kg a 59,80 kg.

Page 104: 7. metodologia y estadistica aplicada a la educacion

1 04

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

GUÍA DE EJERCITACIÓN

Actividad 1

El Director de una escuela debe establecer turnos para que el establecimiento siempre tenga dos administrativos durante el mes de enero. Para ello de los cinco empleados que dispone (A, B, C, D, E) debe formar grupos de dos seleccionados al azar, sin reemplazo. Describa el espacio muestral de este experimento aleatorio.

Actividad 2

a) ¿Cómo sería el espacio muestral en la actividad anterior si el muestreo fuera con reemplazo?

b) ¿Cuál es la forma correcta de efectuar este experimento, para que el Director del establecimiento siempre tenga dos administrativos en el mes de enero?

Actividad 3

Dé dos ejemplos de sucesos seguros y dos de sucesos imposibles.

Actividad 4 En el experimento aleatorio de la Actividad N°1, a) ¿Cuántos grupos de dos personas se formaron? b) ¿En cuántos está A? c) ¿En cuántos está B? d) ¿En cuántos están A y B? e) ¿En cuántos no ha sido seleccionado C? f) ¿En cuántos han sido seleccionados A ó B ó C? g) Calcule la probabilidad de cada uno de estos sucesos.

Actividad 5

Una oficina donde asignan becas para estudio a alumnos de EGB, realiza la selección de los mismos para dos Becas de distinto origen de fondos; los resultados posibles son Seleccionado (S) o No Seleccionado (NS). El experimento consiste en tomar al azar un alumno y observar el resultado en las dos selecciones. a) Describa el espacio muestral de este experimento (suponga que todos

los alumnos han estado inscriptos en las dos Becas) b) ¿Cuál es la probabilidad de que el alumno haya sido seleccionado en

las dos Becas?

Page 105: 7. metodologia y estadistica aplicada a la educacion

1 05

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

c) ¿Cuál es la probabilidad que el alumno no haya sido seleccionado ninguna de las dos Becas?

d) ¿Cuál es la probabilidad que el alumno haya sido seleccionado en una Beca por lo menos?

e) ¿Cuál es la probabilidad que el alumno haya sido seleccionado a lo sumo en una Beca?

Actividad 6

Cada uno de los items siguientes representan las probabilidades de cada uno de tres eventos simples. Marque el item correcto, justificando al mismo tiempo su respuesta.

a) P(E1) = 0.8 P(E2) = 0.3 P(E3) = 0.1

b) P(E1) = 0.3 P(E2) = 0.2 P(E3) = 0.5

c) P(E1) = ­0.6 P(E2) = 0.2 P(E3) = 0.2

d) P(E1) = 1/3 P(E2) = 1/2 P(E3) = 1/6

Actividad 7

En una encuesta realizada a 90 alumnos que egresan del Polimodal en un establecimiento educativo, se les preguntaba sobre el nivel de instrucción alcanzado por los padres y si seguirían estudiando o no una carrera superior. El resultado de la encuesta figura en la tabla siguiente:

¿Seguirán estudiando?

Nivel de educación de los padres

Si No

Total

Superior 20 10 30 Secundario 30 10 40

Primario 15 5 20 Total 65 25 90

Si se selecciona un alumno al azar, cuál es la probabilidad de: a) ¿Qué el alumno tenga padres con educación superior? b) ¿Qué el alumno siga estudiando? c) ¿Qué el alumno siga estudiando y tenga padres con educación

primaria? d) ¿Qué el alumno tenga padres con educación superior o secundaria? e) ¿Qué el alumno tenga padres que no posean educación superior?

Page 106: 7. metodologia y estadistica aplicada a la educacion

1 06

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

f) ¿Qué el alumno siga estudiando dado que posee padres con educación primaria?

g) ¿Qué el alumno no siga estudiando dado que posee padres con educación secundaria?

h) El evento que siga estudiando es independiente del nivel de educación Superior alcanzado por los padres?

Actividad 8

En un examen de 10 bolillas un alumno no sabe dos de ellas. ¿Cuál es la probabilidad que le toquen justamente las dos bolillas que no sabe?

Actividad 9

Una prueba tiene 2 preguntas con dos opciones: Verdadero (V) o Falso(F). a) ¿Cuál es la probabilidad de que acierte en las dos? b) ¿Cuál es la probabilidad de que acierte por lo menos en una? c) ¿Cuál es la probabilidad de que a las dos las conteste incorrectamente?

Actividad 10

En una escuela hay tres Profesores de Educación Física. La probabilidad de que no asistan a clase cada uno de ellos es de 0.05. ¿ Cuál es la probabilidad de que un día cualquiera falten los tres juntos?

Actividad 11

En un análisis realizado por el Director de un establecimiento educativo, se determinó que de los alumnos ingresantes en EGB en una cohorte, solo el 70% (en promedio) completó el polimodal. De ellos solo el 15% lo hizo en el mismo establecimiento. ¿Cuál es la probabilidad de que un nuevo alumno ingresante en EGB termine el Polimodal en la misma escuela?

Actividad 12

La probabilidad de que a un alumno le interese Matemáticas en un curso es de 0.1. Si se toman 3 alumnos de dicho curso al azar: ¿Cuál es la probabilidad de que: a) No le agrade a ninguno Matemáticas? b) Le agrade por lo menos a un alumno esta materia? c) Le agrade como máximo a 2 alumnos?

Page 107: 7. metodologia y estadistica aplicada a la educacion

1 07

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Actividad 13

La probabilidad de que un alumno apruebe una Prueba Integradora de conocimientos de Matemática en el último año del Polimodal es de 0.25. Si se seleccionan al azar 10 alumnos de un curso: a) ¿Cuál es la probabilidad de que 5 alumnos aprueben? b) ¿Cuál es la probabilidad de que no apruebe ningún alumno? c) ¿Cuál es la probabilidad de que todos aprueben? d) ¿Cuál es la probabilidad de que aprueben como mínimo 5 alumnos? e) ¿Cuál es la probabilidad de que como máximo aprueben 5 alumnos?

Actividad 14

La probabilidad de que la última semana de clase los alumnos que egresan cometan un acto de indisciplina serio es de 0.004. De 300 alumnos que terminan este año: ¿Cuál es la probabilidad de que: a) 8 alumnos terminen sus estudios con una sanción por este acto de

indisciplina? b) De qué más de 5 alumnos terminen sus estudios con una sanción por

este acto de indisciplina? c) De que menos de 4 terminen sus estudios con una sanción por este

acto de indisciplina? d) De qué ningún alumno cometa un acto de indisciplina serio?

Actividad 15

Los pesos de los alumnos de un curso de EGB se distribuyen normalmente con µ = 48 kg y σ = 2 kg. a) Obtenga los pesos estándar correspondientes a: 43 kg ; 44.5 kg ; 46 kg ; 49.5 kg ; 50 kg b) ¿Cuál es la probabilidad de que un alumno tenga un peso menor a 44.5

kg? c) ¿Cuál es la probabilidad de que un alumno tenga un peso mayor a 46

kg? d) ¿Cuál es la probabilidad de que un alumno tenga un peso entre 44.5

kg y 49.5 kg? e) ¿Cuál es la probabilidad de que un alumno tenga un peso de por lo

menos 46 kg? f) Obtenga el Rango Percentil correspondiente a los pesos del item a).

Interprete que significa cada uno de ellos. g) Si el número de alumnos a los que se ha medido el peso en ese curso

fuera de 200, ¿ cuántos alumnos tendrán un peso inferior a la media?. ¿Cuántos alumnos tendrán un peso superior a 52 kg?

Page 108: 7. metodologia y estadistica aplicada a la educacion

1 08

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

h) ¿Qué porcentaje de alumnos tienen un peso comprendido entre 45 kg y 47 kg?

Actividad 16

Los puntajes promedio con su correspondiente desviación estándar, obtenidos por los alumnos del último curso de Polimodal en una escuela en los exámenes finales de una asignatura son los siguientes:

CURSO µ σ A 5.9 1.5 B 6.75 1

Se supone que los puntajes se distribuyen normalmente: a) Si un alumno del Curso A ha obtenido 7 puntos y otro del Curso B

igual puntaje, quiere decir que el nivel de aprendizaje es el mismo en los dos cursos?. Justifique su respuesta.

b) ¿Qué porcentaje de alumnos obtuvieron más de 5 puntos en cada curso? Analice en base a esto el rendimiento de cada curso.

c) ¿Qué porcentaje de alumnos obtuvieron más de 7 puntos en cada curso?

d) ¿Qué porcentaje de alumnos obtuvieron menos de 4 puntos en cada curso?

e) ¿En base a estos resultados qué conclusión puede enunciar?

Page 109: 7. metodologia y estadistica aplicada a la educacion

1 09

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

UNIDAD V

INFERENCIA ESTADÍSTICA

1. INTRODUCCIÓN

En capítulos anteriores se vió:

Estadística Descriptiva : Su objetivo es la recolección y reducción de datos . Se estudian técnicas para presentar los datos de una forma mas comprensible y así poder visualizar propiedades de los mismos.

Cálculo de Probabilidades :La razón de su estudio es que la Estadística incluye la toma de decisiones en presencia de incertidumbre. Estas decisiones tomadas se basan en probabilidades. Aquí conocemos ( o suponemos conocido) por completo el modelo probabilístico que usamos, es decir, la población a estudiar la podemos representar por una variable aleatoria X

Recordemos que una población está constituida por todos los elementos que poseen unos caracteres por cuyo estudio estamos interesados. Una muestra, en cambio, es una parte de los elementos de la población; pero esta parte ha de ser representativa del total.

Cuando el estadístico puede observar todos los elementos de la población ( observación exhaustiva) , entonces su tarea se reduce a describir las características y regularidades de la población. Pero si la observación no puede ser exhaustiva, entonces aquellas características hay que estudiarlas a través de una muestra representativa.

Hay que distinguir entre poblaciones finitas y poblaciones infinitas. Se dice que una población es finita si tiene un número limitado de sucesos o unidades elementales. Ejemplo de población finita son, en un año dado los salarios recibidos por todos los docentes de un Colegio, los títulos recibidos por todos los estudiantes de un país. Mientras el número total de observaciones posibles sea limitado, se trata de una población finita.

Page 110: 7. metodologia y estadistica aplicada a la educacion

1 10

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

En cambio, una población infinita es la que, consiste en un número infinitamente grande de observaciones. Por lo menos es teoría , no hay límite alguno al número de unidades que puede abarcar. Por ejemplo, los resultados obtenidos al jugar dos dados constituyen una población infinita , lo mismo que los pesos al nacer de todos los seres humanos.. Una población infinita puede ser siempre generada a partir de un conjunto finito de valores o unidades si el muestreo se hace con reemplazo.

2. INFERENCIA ESTADÍSTICA

Definición: La Inferencia Estadística es el procedimiento por medio del cual se llega a inferencias acerca de una población mediante los resultados que se obtienen a part ir de una muestra extraída de esa población.

El objetivo principal de la Estadística Inferencial es la estimación , esto es que mediante el estudio de una muestra aleatoria seleccionada de una población se quiere generalizar las conclusiones al total de la misma.

Definición de muestra aleatoria

Todo conjunto de n unidades de observación elementales tomadas de una población dada, se puede considerar como una muestra de tamaño n. Pero el tipo de muestra que aquí interesa es el de muestra aleatoria Una muestra aleatoria se puede tomar con o sin reemplazo. Si la muestra se toma con reemplazo, de una población , finita o infinita , la unidad tomada se vuelve a dejar en la población y el número de unidades disponibles para seguir la operación no se afecta. Esto tambien es cierto cuando la muestra se toma de una población infinita sin reemplazo, es decir, cuando la unidad escogida no se vuelve a la población. Cuando se toma un elemento, sin reemplazar, de una población finita, el número de unidades que quedan tras cada unidad que se saca se reduce en una unidad, y en consecuencia la probabilidad de sacar cualquier unidad restante en operaciones sucesivas se aumenta.

Es necesario formular nuestro concepto en forma precisa. Por definición, una muestra debe tener ciertas propiedades como sigue:

Se supone que las muestras dan información acerca de la población a que corresponde, ya que por lo general es demasiado costoso, requiere

Page 111: 7. metodologia y estadistica aplicada a la educacion

1 11

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

demasiado tiempo, o es imposible observar o medir todos los objetos pertenecientes a la población.. La muestra debe ser una selección aleatoria . Es decir, cada elemento de la población debe tener una probabilidad conocida de ser extraído, esto es, de ser tomado en la muestra; el caso mas sencillo y más común es en donde la probabilidad es la misma para todos los elementos de la población , y solo si se satisface este requisito ( al menos aproximadamente) , los métodos estadísticos darán resultados razonables y útiles.

Además, es necesario que las n ejecuciones del experimento aleatorio con el que obtenemos n valores de la muestra sean independientes, esto es, el resultado de una ejecución no debe influir en las otras ejecuciones. Esto equivales a decir que la probabilidad de que cualquier miembro de la población aparezca en una muestra, no depende de la aparición o no aparición de los otros miembros de la población en la muestra.

Hay que tener presente que el conocimiento de las características de una población, salvo algunas excepciones, no puede conseguirse con toda exactitud mediante una muestra. Si se tiene una población humana y suponemos que no existen errores de observación, la única manera de obtener exactamente la estatura media, el porcentaje de analfabetos, , etc. , en dicha población es observando todos los elementos de ella. Pero si esta observación exhaustiva no es posible y se utiliza como medio supletorio una muestra, entonces lo único que puede obtenerse, salvo en algunos casos particulares, son estimaciones de aquellas características.

El problema de la Inferencia Estadística se acostumbra a enfocar de dos maneras distintas. Partiendo del hecho cierto de que una muestra, en ge­ neral, no da una información exacta de las características de la población que deseamos estudiar, puede procederse asi:

1º Utilizar la muestra para estimar dichas características. Este enfoque origina la Teoría de la Estimación , mediante la cual se da solución a los problemas específicos que se plantean.

2º Emitir hipótesis sobre aquellas características tomando como base la experiencia, otras informaciones o incluso el presentimiento o la corazonada. Una hipótesis así formulada tiene, evidentemente, poco valor científico. Este valor se adquiere tomando una muestra de la población y utilizándola para verificar o contrastar

Page 112: 7. metodologia y estadistica aplicada a la educacion

1 12

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

la hipótesis., Este enfoque da lugar a la Teoría de la Verificación o Contrastación de hipótesis.

Para distinguir claramente entre ambas , considérense los siguientes ejemplos . Un candidato para un puesto público desea estimar la proporción real de votantes que lo apoyan mediante la obtención de las opiniones de una muestra aleatoria de 100 votantes. La fracción de ellos que lo apoye puede utilizarse como una estimación de la proporción real de la población total de votantes. Este problema pertenece al área de estimación.

Ahora considérese el caso en el cual una Profesora se interesa en determinar si el sistema nuevo de evaluación( A ) implementado por el Colegio es mejor que el sistema anterior de evaluación ( B ). Esta Profesora podría suponer que el sistema A es mejor al sistema B y , después de realizar las pruebas apropiadas , aceptar o rechazar esta hipótesis .En este ejemplo se intenta tomar una decisión correcta respecto a la hipótesis preestablecida.( La prueba de hipótesis no se verá en el desarrollo de esta Asignatura ).

3. DISEÑOS DE MUESTREO

La operación de tomar una muestra de una población se denomina muestreo y los métodos de muestreo que se utilicen deben garantizar aquella representatividad para que pueda hablarse correctamente de una muestra estadística.

Si se desea conocer, por ejemplo, el consumo medio de proteínas por alumno y dia en una ciudad y tomamos para ello un grupo de familias integrado por la de mas alto nivel de vida, se concluirá que ese grupo no es representativo del total de familias de la ciudad.. Por tanto, el consumo medio que se obtenga del citado grupo no es una buena estimación porque entraña un error de un tipo distinto del que cabe esperar en una muestra representativa.

Conviene distinguir entre dos clases de error. De una parte existen los errores muestrales, que son aquellos que están latentes en toda muestra representativa, pues aun siéndolo no proporciona , salvo raras excepciones, una medida exacta de las características de la población; por ello hay que contar siempre con los errores muestrales o errores de muestreo.

Page 113: 7. metodologia y estadistica aplicada a la educacion

1 13

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Y por otra parte están los sesgos, bajo cuya denominación se incluyen algunos errores específicos de las muestras como los debidos a su falta de representatividad, y otros que son comunes a toda investigación estadística, tanto si es exhaustiva como si no lo es. A este último grupo pertenecen los errores de observación , los originados por definiciones defectuoasas de los elementos de la población, de los caracteres a investigar , los debidos a respuestas o medidas mal efectuadas , a fórmulas inadecuadas, a cálculos equivocados, etc.

Ejemplo :Supongamos que deseamos tomar una muestra de 100 estudiantes de un Colegio para conocer la opinión del alumnado respecto a la adecuación de las evaluaciones. Un posible método es situarse a las nueve de la mañana en una entrada del Colegio y preguntar a los 100 primeros alumnos que aparezcan. Con este procedimiento los alumnos que solo tienen clase por la tarde no estarán representaos en la muestra. Además, estarán muy poco o nada representados los estudiantes que no tengan clase a primera hora o los que teniéndola no acudan habitualmente.

Cuando algunos miembros de la población tienen una probabilidad más alta que los otros de estar representados en una muestra se dice que existe un sesgo de selección y la muestra puede no ser representativa de la población. Por ejemplo, si existen diferencias marcadas de opinión entre los alumnos nuevos y los veteranos, y la muestra sólo incluye a los veteranos, tendrá un sesgo de selección.Una forma de evitar este sesgo es tomar la muestra mediante un procedimiento de selección objetivo que garantice a todos los elementos de la población la misma oportunidad de aparecer en la muestra.

El método anterior presenta además el riesgo de un sesgo adicional: el sesgo por no respuesta. Si los estudiantes que no responden son los más disconformes con las evaluaciones, la muestra contendrá una proporción menor de estudiantes de estas categorías y, de nuevo, puede no ser representativa de la población que tratamos de investigar. El sesgo de no respuesta no puede evitarse con certeza pero deben tomarse precauciones para prevenir que ocurra.

3.1. MUESTREO AL AZAR SIMPLE

El muestreo aleatorio simple está fundamentado en el puro azar. Se puede decir que es un muestreo en el que si se saca al azar una muestra de n unidades, toda posible muestra de n unidades tiene la misma probabilidad de ser seleccionada, Una muestra obtenida por este procedimiento se dice muestra aleatoria simple.

Page 114: 7. metodologia y estadistica aplicada a la educacion

1 14

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Uno de los métodos comúnmente utilizados para lograr que la muestra sea aleatoria es numerar todos los elementos de una población, escribir los números en tarjetas o fichas o bolillas o cualesquiera cosas físicamente homogéneas; poner luego en una bolsa estos objetos numerados y mezclarlos completamente. Se define el tamaño n de la muestra y se sacan los objetos al azar uno por uno, hasta que se obtenga el número deseado de partidas para anotar. El procedimiento se puede simplificar utilizando una tabla de números aleatorios.

3.2. MUESTREO ALEATORIO SISTEMÁTICO

Cuando los elementos de la población están ordenados en listas, una alternativa más fácil de ejecutar que el muestreo aleatorio simple es el muestreo sistemático. Muy a menudo, si se desea un muestreo aleatorio simple se sigue un procedimiento sistemático en vez de un método al azar. Según el procedimiento sistemático, se obtiene una muestra tomando cada k­ésima unidad de la población tras numerar las unidades de la población o haberlas ordenado de alguna manera. La letra k representa un número entero, que es aproximadamente la razón de muestreo entre el tamaño de la población y el tamaño de la muestra. Así, si la población consiste en 10.000 unidades de muestreo y se desea una muestra de 500 unidades, entonces

K = 10.000 / 500 = 20

Y la muestra se obtiene tomando una unidad cada veinte de la población.

Para que toda unidad de la población tenga igual probabilidad de salir, el procedimiento debe empezar al azar. Con una razón de muestreo de 20, se puede utilizar el procedimiento de la bolsa o del bolillero poniendo 20 bolillas o 20 papelitos numerados de 1 a 20 en el bolillero o bolsa. Tras revolver y mezclar completamente, se saca una bolilla al azar. Si se saca la bolilla 11, se empieza con este número y se incluye enla muestra cada vigésima bolilla a partir de esta, es decir, la treinta y una, la cincuenta y una , y así sucesivamente.

Page 115: 7. metodologia y estadistica aplicada a la educacion

1 15

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

3.3. MUESTREO POR ESTRATOS

El muestreo aleatorio simple debe utilizarse cundo los elementos de la población son homogéneos respecto a la característica a estudiar, es decir, a priori la predicción que haríamos del valor de la variable sería el mismo para todos los elementos. Un muestreo que sería mas efectivo que este, es el muestreo aleatorio por estratos, procedimiento que exige tener conocimiento previo de la población. El proceso de estratificación contempla dividir la población en grupos o clases llamados estratos . Dentro de cada uno de tales estratos, están los elementos situados de manera más homogénea con respecto a las características que estén en estudio. Para cada estrato se toma una submuestra mediante el procedimiento aleatorio simple, y la muestra global se obtiene combinando las submuestras de todos los estratos.

El muestreo por estratos es el más efectivo cuando se trata de poblaciones heterogéneas tales como datos de desempleo ( que varían de ocupación a ocupación ), ventas al por menor ( que difieren entre las distintas regiones geográficas) , y las actitudes de los consumidores respecto de malos nuevos modelos de automóviles ( en las que influyen factores teles como el sexo, la edad, y la categoría de ingreso). Al hacerse la estratificación, las clases se establecen de modo que las unidades de muestreo tienden a ser uniformes dentro de cada clase, y las clases tienden a ser diferentes entre sí. Así se puede controlar la proporción de cada estrato en la muestra global y no dejarla al azar y queda asegurado el carácter representativo de la muestra.

El muestreo por estrato es por consiguiente una combinación de submuestras de los estratos, que son muestras aleatorias simples o sistemáticas. En cuanto tales, todo elemento disponible de cada estrato tiene igual probabilidad de ser seleccionado, y esta será la situación aun en el caso en que la muestra no sea proporcionada, en el cual las probabilidades de ser seleccionado cada elemento individual de la población no son iguales.

3.4.MUESTREO POR CONGLOMERADO

Diametralmente opuesto al muestreo por estratos está el muestreo por conglomerados, que consiste en seleccionar primero al azar grupos, llamados conglomerados , de elementos individuales de la población, y en tomar luego todos los elementos o una submuestra de ellos dentro de cada conglomerado para constituir así la muestra global. Para lograr los mejores

Page 116: 7. metodologia y estadistica aplicada a la educacion

1 16

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

resultados ern el plan del muestreo por conglomerado, se hacen tan pequeñas como sea posible las diferencias entre conglomerados, en tanto que las diferencias entre los elementos individuales dentro de cada conglomerado se hacen tan grandes como sea posible.

Por ejemplo, si queremos extraer una muestra aleatoria simple de los estudiantes universitarios de un país sería necesario disponer de una lista de todos ellos y de sus direcciones y teléfonos. Esta información puede no estar disponible o ser muy cara de conseguir. Sin embargo, en este caso, los estudiantes aparecen clasificados en universidades, facultades y cursos. Podemos seleccionar en una primera etapa algunas universidades, después algunas facultades al azar de cada universidad, dentro de las facultades algunas clases y, dentro de las clases, estudiantes mediante muestreo aleatorio.

Para la primera etapa solo necesitamos una lista de universidades. Para las universidades seleccionadas es necesario luego conocer las facultades que incluyen. En las facultades elegidas necesitamos una lista de las clases, y de las clases que se tomen, una relación de los estudiantes. Esta información estará disponible por lo que este tipo de muestreo será factible.

Llamaremos conglomerados a estas unidades amplias donde se clasifican los elementos de la población. En cada etapa de muestreo , en lugar de seleccionar elementos al azar , seleccionamos conglomerados. Los conglomerados se refieren a formas de agrupación física de las unidades en el espacio o en el tiempo.

Idealmente los conglomerados tienen que ser lo más parecido posible a muestras aleatorias de la población , de manera que cada conglomerado sea tan heterogéneo como la población a investigar.

El muestreo por conglomerado tiene la ventaja de simplificar enormemente la recogida de la información muestral. El inconveniente obvio es que si los conglomerados son heterogéneos entre sí, como sólo se analizan algunos de ellos, la muestra final puede no ser representativa de la población.

Page 117: 7. metodologia y estadistica aplicada a la educacion

1 17

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

3.5. MUESTREO POR CUOTAS

A veces la estratificación no es posible, o es muy cara, y se recurre en su lugar al muestreo por cuotas. Por ejemplo, se desea tomar una muestra de una población para estudiar la proporción de personas que están de acuerdo con el uso de remedios especiales. Si suponemos que la edad y el sexo pueden influir en la opinión, deberíamos tomar una muestra donde estas características sean las mismas que en la población base, lo que implica una muestra estratificada. Sin embargo, esto requiere una lista de las personas de la población que incluya su sexo y edad, lo que puede no estar disponible. Sin embargo, si conocemos la proporción de cada sexo y la distribución de la edad en la población, una solución frecuente es exigir que estas características aparezcan en la muestra en la misma proporción que en la población. Esto conduce a fijar cuotas de hombres y mujeres por grupos de edad. El entrevistador debe conseguir los elementos de la muestra respetando esta restricción de cuotas.

4. ESTIMACIÓN DE PARÁMETROS

Algunas cantidades que aparecen en las funciones de distribución, como p de la distribución binomial , µ y σ en la distrIbución normal, se llaman parámetros. Generalmente estamos interesados en conocer los parámetros de la población, es decir , aquellas características que sirven para determinarla. Ahora veremos como obtener estimaciones de parámetros a partir de una muestra dada.

Dada una población, se trata de estimar, esto es, de valorar, alguno o algunos parámetros característicos de la misma, como, por ejemplo, a la media aritmética. Recurriremos a la inferencia estadística, y mediante el análisis de una muestra obtendremos una estimación de los valores correspondientes a la población completa.

Esta estimación puede ser por punto o por intervalo, según se trate de determinar un valor único del parámetro en cuestión o bien un intervalo dentro del cual quede comprendido, con una cierta probabilidad, el valor correspondiente al parámetro de toda la población .El intervalo en cuestión recibe el nombre de intervalo de confianza y la probabilidad, el de nivel de significación.

Page 118: 7. metodologia y estadistica aplicada a la educacion

1 18

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

4.1. ESTIMACIÓN PUNTUAL

La Inferencia Estadística está casi siempre concentrada en obtener algún tipo de conclusión acerca de uno o más parámetros (características poblacionales). Para hacerlo, se requiere que se obtenga datos muestrales de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades muestrales.

Una estimación puntual ó estimación por punto es un solo valor numérico utilizado para estimar el parámetro correspondiente de la población. La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular su valor a partir de datos de la muestra dada.

Sirve como una aproximación del valor exacto desconocido del parámetro

El estadístico que se utiliza para obtener una estimación puntual recibe el nombre de estimador puntual del parámetro .

Es conveniente notar que se ha dado el nombre de estimación a un solo valor calculado. La regla para calcular este valor o estimación se conoce como estimador. Los estimadores generalmente se presentan como fórmulas. Por ejemplo la media x de una muestra es un estimador de la media µ de la población correspondiente. El valor numérico individual que resulta de la evaluación de la fórmula de la media se conoce como estimación del parámetro µ. De esta manera se tiene la estimación µ ≅ x para µ

De forma similar , la variancia muestral, S 2 , se puede utilizar para inferir algo acerca de σ 2 .

Ejemplo: Una muestra aleatoria de 3 baterías para calculadora podría

presentar duraciones observadas en horas de x1 = 5.0 , x2 = 6.4 y x3 = 5.9 . El valor calculado de la duración media muestral es x = 5.77 , y es razonable considerar 5.77 como el valor adecuado de µ .

El enunciado : la estimación puntual de µ es 5.77 “ se puede escribir en forma abreviada µ = 5.77.

Page 119: 7. metodologia y estadistica aplicada a la educacion

1 19

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

4.2. ESTIMACIÓN POR INTERVALO EN EL MUESTREO AL ZAR SIMPLE

Supóngase que un grupo de investigadores quiere estimar la media de una población que sigue una distribución normal y que, para ello, extraen una muestra aleatoria de tamaño n de la población y calculan el valor de x, el cual utilizan como una estimación puntual de µ . Aunque este estimador de µ posee todas las cualidades de un buen estimador, se sabe que, debido a los caprichos del muestreo, no se puede esperar que x sea igual a µ.

Un estimador puntual por ser un solo número, no proporciona por sí mismo información alguna sobre la precisión y confiabilidad de la estimación. El estimador puntual nada dice sobre lo cercano que está de µ x .

Si se quiere llegar a asignar determinadas garantías o “confianza” a los resultados de un proceso inferencial de estimación, cabe la posibilidad de ampliar la óptica de la Estimación Puntual analizada en el tema anterior, pasando a la estimación mediante Intervalos de Confianza .

En términos estadísticos las “garantías” asignables consisten en afirmaciones de tipo probabilístico.

La estimación de una magnitud desconocida mediante Intervalo de Confianza consiste en derivar unos límites aleatorios que contendrán al parámetro desconocido con una probabilidad fijada de antemano.

Los extremos de un intervalo de conf ianza son aleatorios, por lo que podrán o no contener al verdadero parámetro y será posible evaluar la probabilidad de que así ocurra. A la probabilidad de que un Intervalo de Confianza contenga al parámetro poblacional objeto de análisis se le denomina Nivel de Confianza y la denotaremos por γ ( 1 ­ α )

Por ejemplo, si escogemos γ = 1 ­ α = 95 % , implica que 95 % de todas las muestras daría lugar a un intervalo que incluye µ o cualquier otro parámetro que se esté estimando , y sólo 5 % de las muestras producirá un intervalo erróneo. Cuánto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se estima está dentro del intervalo.

Al estimar un parámetro θ , el problema correspondiente debería ser la determinación de dos cantidades numéricas que dependen de los

Page 120: 7. metodologia y estadistica aplicada a la educacion

1 20

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

valores de la muestra, y en cuyo intervalo se incluya el valor desconocido del parámetro con certeza. Sin embargo, sabemos que a partir de una muestra no podemos obtener conclusiones acerca de la población correspondiente que sean 100 % verdaderas. Así, tenemos que ser más modestos y modificar nuestro problema, de la siguiente manera.

Escogemos una probabilidad γ cercana a 1 , ( por ejemplo, γ = 95 % , 99 % o alguna semejante) . Luego, determinamos dos cantidades θ1 y θ2

tales que la probabilidad de que incluyan el valor exacto desconocido del parámetro θ sea igual a γ .

Los n valores de la muestra se pueden considerar como valores observados de n variables aleatorias X1 , X2 , ......., Xn . Entonces θ1 y θ2

son funciones de estas variables aleatorias y , por lo tanto, también son variables aleatorias. . Nuestro requisito anterior se puede escribir como

P(θ1 ≤ ≤ θ θ2 ) = γ

Si conocemos θ1 y θ2 y se dá una muestra, podemos calcular un valor numérico θ1 de θ1 , y un valor numérico θ2 de θ2 . El intervalo con puntos extremos θ1 y θ2 se llaman intervalos de confianza o estimación por intervalo para el parámetro desconocido θ , y se representa

CONF θ1 ≤ θ ≤ θ2

Los valores θ1 y θ2 se llaman límites de confianza inferior y superior para θ. El número γ se llama nivel de confianza. Se elige γ = 95 % , 99% o algunas veces 99,9 %.

Es evidente que si se intenta obtener una muestra y determinar un intervalo de confianza correspondiente, entonces γ es la probabilidad de disponer de un intervalo que incluya el valor exacto desconocido del parámetro.

Page 121: 7. metodologia y estadistica aplicada a la educacion

1 21

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

4.2.1. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIÓN NORMAL CUYA VARIANCIA ES CONOCIDA

Sea x1 , • • • • , xn una muestra extraída de una población distribuida normalmente o , a falta de esto, si n es lo bastante grande,y cuya variancia σ 2 es conocida. Suponemos que la media µ es desconocida , y que deseamos ­determinar un intervalo de confianza para µ . Los pasos necesarios para determinar un intervalo de confianza bajo las suposiciones anteriores son .

1 ª paso .Elegir un nivel de confianza γ ( 95 % , 99 % ,o uno semejante ).

2 ª paso . Determinar el valor de z correspondiente mediante la tabla de distribución normal estandarizada. Por ejemplo:

γ 0,90 0,95 0,99 0,999 Z 1,645 1,960 2,576 3,291

3ª paso . Calcular la media x de la muestra

4ª paso . Calcular

k = n

z σ ( 1 )

Por lo tanto :

Si x es la media de una muestra aleatoria de tamaño n de una población con variancia conocida el intervalo de confianza de ( γ ) 100 % para la media poblacional es.

CONF x ­ k ≤ µ ≤ x + k

Z ≤ S n

X + Z S n

X ≤ µ

Ejemplo: Se calcula que la media de los promedios de los puntos de calidad de

una muestra aleatoria de 36 alumnos de los últimos años del nivel medio es 2,6. Encuentre los intervalos de confianza del 95 % y del 99 % para la

Page 122: 7. metodologia y estadistica aplicada a la educacion

1 22

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

media total de alumnos del último año. Asuma que la desviación estándar de la población es 0,3.

Solución:

La estimación puntual de µ es 2,6. El valor de z para el 95 % es z = 1,96. De aquí que el intervalo de confianza es :

( 2,6 – 1,96 36 3 , 0

• ≤ µ ≤ 2,6 + 1,96 36 3 , 0

• )

e l cual se r e duce a , ( 2 ,50 , 2 ,70 )

Para encontrar un interva lo de l 99 % , se encue ntra e l va lor de z , donde z = 2 ,576

( 2 ,6 – 2 ,576 36 3 , 0

• ≤ µ ≤ 2,6 + 2 , 576 36 3 , 0

• )

o s imp leme nte : ( 2 ,47 , 2 ,73 )

Ahora se obse rva que se r equie re un int erva lo más grande para e st imar µ con mayor prec is ión.

S i no se conoce la var iab i l idad de la poblac ión y so lo se d ispone de la in formación proporc ionada por la muestra , e s dec ir se conoce X y s , s i empre que se t rabaje con un tamaño de muest ra g rande :

Z ≤ S n

X + Z S n

X ≤ µ

Page 123: 7. metodologia y estadistica aplicada a la educacion

1 23

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

GUÍA DE EJERCICIOS

ACTIVIDAD 1

El Departamento de Biología de una escuela desea estimar la cantidad promedio de agua que consume diariamente cierta especie animal en condiciones experimentales, para completar un estudio que se está realizando.Esta investigación supone que la población de valores de consumo diario de agua está normalmente distribuida y, con base en experiencias pasadas, que la variancia de la población es de 4 gramos cuadrados. Una muestra aleatoria de 40 animales arroja una media de 16,5 gramos.

a) Estime puntualmente la cantidad promedio de agua .

b) Con un nivel de confianza del 95 estime la cantidad promedio de agua.

c) Realice los cálculos solicitados en el inciso b) pero con un nivel de confianza de 90 % . Compare los intervalos obtenidos.

ACTIVIDAD 2

En una escuela para adultos , se seleccionó una muestra de 100 alumnos aparentemente sanos, de 25 años de edad, donde se muestra una presión sanguínea media de 125. Si se supone que la desviación estándar de la población es de 15, calcule

a) El intervalo de confianza del 90 por ciento para µ

b) El intervalo confianza del 95 por ciento para µ

ACTIVIDAD 3 Una investigación realizada en el área de educación sostiene que la

edad promedio de los docentes del área rural ha disminuido . La edad promedio de los docentes rurales en elos últimos años fue de 35 años.

Para ello,se extrae una muestra aleatoria de 100 docentes en la que la edad promedio es de 28 años con una desviación estándar de 8 año.

Page 124: 7. metodologia y estadistica aplicada a la educacion

1 24

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

¿Confirman estos datos la hipótesis de esta investigación?. Trabaje con α = 0,01 y α = 0,05.

ACTIVIDAD 4

Una muestra aleatoria que representa el tiempo ( en minutos) que tardaron 36 estudiantes en familiarizarse con el manejo de un software adquirido por las Autoridades del Colegio, dio un tiempo promedio de 10 minutos . El tiempo se distribuye normalmente. con una desviación estándar de 3 minutos.

a) Determine e interprete un intervalo del 95 % de confianza para el verdadero tiempo promedio.

b) El instructor considera que el tiempo promedio requerido por los alumnos es mayor que 10 minutos, ¿ qué se puede decir de acuerdo con el intervalo hallado?.

Page 125: 7. metodologia y estadistica aplicada a la educacion

1 25

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

ANEXO TABLAS ESTADÍSTICAS

Page 126: 7. metodologia y estadistica aplicada a la educacion

1 26

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Page 127: 7. metodologia y estadistica aplicada a la educacion

1 27

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Page 128: 7. metodologia y estadistica aplicada a la educacion

1 28

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Page 129: 7. metodologia y estadistica aplicada a la educacion

1 29

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Page 130: 7. metodologia y estadistica aplicada a la educacion

1 30

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Page 131: 7. metodologia y estadistica aplicada a la educacion

1 31

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

Page 132: 7. metodologia y estadistica aplicada a la educacion

1 32

Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE

BIBLIOGRAFÍA

­ Benítez, Celia de; Pece, Marta G.; Galíndez, Margarita de. (2003). Serie Didáctica N°7: “Elementos de Estadística para técnicos en vivero y plantaciones forestales”, con guía de ejercitación.

­ Barbancho, A. (1983). Estadística Elemental Moderna . 9 a Edición. Ariel, S. A. – Barcelona. ISBN 84­344­2005­8.

­ Daniel, W.W. (1997) Bioestadística. ISBN 968­18­5196­X.

­ Kreyszig, E. (1994). Introducción a la Estadística Matemática . Principios y métodos. LIMUSA. –Noriega Editores. ISBN 968­18­ 0729­4.

­ Peña, D. y Romo, J. (1999) . Introducción a la Estadística para las Ciencias Sociales. ISBN 84­481­1617­8.

­ Triola, M.F.(2004). Estadística. Novena edición.ISBN 970­26­0519­ 9. Editorial Pearson. México. 837 pags.

­ Ya­Lun, Chou. (1990). Análisis Estadístico. ISBN 970­10­0046­3. pags.808.