tema 2 clase 2 tabulacion cruzada

19
Apuntes sobre Estadística Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Febrero Febrero Febrero Febrero 20 20 20 2011 11 11 11. 1 Organización de Los Datos: Tabulación Cruzada (Borrador para corrección) Héctor Medina Disla Santo domingo, D. N. Febrero 2011

Upload: mercedes-sanchez

Post on 08-Aug-2015

404 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

1

Organización de Los Datos: Tabulación

Cruzada (Borrador para corrección)

Héctor Medina Disla

Santo domingo, D. N. Febrero 2011

Page 2: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

2

2.1 TABULACIÓN CRUZADA También se le llama tabla de doble entrada, tabla de contingencia o distribución de frecuencia bivariada y se utiliza para presentar dos o más variables en un solo cuadro. La Tabulación Cruzada proporciona una descripción básica de la interrelación que hay entre las variables que se tabulan en el cuadro, de igual forma ayuda a buscar patrones de interacción siempre que la frecuencia de cada celda represente un número significativo con respecto al total. Para realizar un cuadro de doble entrada se sigue el mismo procedimiento que para construir una distribución de frecuencia con una variable. Es decir que se debe tomar en consideración las variables a incluir en el cuadro de doble entrada, (cualitativa o cuantitativa y en el caso de las variables cuantitativas, se debe tomar en cuenta si estas son continuas o discontinuas).

2.7.1 TABULACIÓN CRUZADA PARA DOS VARIABLES Para la construcción de un cuadro de doble entrada con dos variable, se coloca una de las variables en la primera columna o columna principal y la otra variable en la primera fila, de forma tal que se forme una celda común para cada una de las categorías de las variables incluidas. La variable que se coloca en la primera fila generalmente es aquella que tienen un mayor número de categorías. Para ilustrar lo que se ha dicho, suponga que estamos interesados en conocer la relación que existe entre dos variables, digamos X e Y. Suponga además que la variable X tiene cinco categorías, X1, X2, X3, X4 y X5 y que la variable Y tiene tres categorías, Y1, Y2, Y3, si queremos presentar estas dos variables en un solo cuadro, el cuadro tendría la forma siguiente:

Yi Xi Y1 Y2 Y3

TOTAL

X1 C11 C12 C13 Total X1

X2 C21 C22 C23 Total X2

X3 . . . . X4 . . . . X5 C51 C52 C53 Total X5

TOTAL Total Y1 Total Y2 Total Y3 Total general

Page 3: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

3

El cuadro indica dos renglones para el total, esto es debido a que estamos presentando solo dos variables, así, en el total de la última fila representa el total de cada columna, mientras que el total de la última columna representa el total de cada fila del cuadro. En las celdas que se forman, se colocarán los datos que tienen las dos características del cuadro. Por ejemplo, en la celda C11, se colocan los elementos que son comunes a X1 y a Y1, en la columna C12 se colocan los elementos que son comunes a X1 y a Y2 y así sucesivamente. Ejemplo: Se evaluó el sexo y la calificación final de treinta estudiantes de una escuela primaria para conocer la relación entre la calificación en matemáticas y el sexo de los/as estudiantes. Los datos se muestran en la tabla siguiente.

No. Sexo Calif. No. Sexo Calif. No. Sexo Calif.

1 Masc. 68 11 Masc. 70 21 Fem 87

2 Fem 86 12 Fem 91 22 Masc. 76

3 Masc. 74 13 Masc. 72 23 Masc. 81

4 Masc. 72 14 Fem 70 24 Masc. 77

5 Masc. 72 15 Masc. 65 25 Fem 77

6 Fem 85 16 Fem 82 26 Masc. 73

7 Fem 66 17 Fem 68 27 Fem 60

8 Fem 79 18 Masc. 86 28 Masc. 60

9 Masc. 70 19 Masc. 71 29 Masc. 71

10 Masc. 72 20 Fem 82 30 Masc. 73

Para este caso tenemos dos variables, una variable cuantitativa, (calificación matemática) y una cualitativa, (sexo de los/as estudiantes). La variable sexo tiene dos categorías, masculino y femenino, y la calificación en matemática es continua y su rango es mayor de 10 por lo tanto hay que hacer una distribución con clases. Para ello vamos a dividir esta variable en cuatro categorías, los estudiantes con menos de 70 puntos, los que tienen entre 70 y 80 puntos, los que tienen entre 80 y 90 y los que tienen 90 o más puntos. Luego de esta clasificación el cuadro queda como se ilustra a continuación: Como se muestra en el cuadro siguiente, el primer alumno es de sexo masculino y tiene una calificación de 68 puntos, por lo tanto se coloca en la columna de masculino y en la primera fila, ya que aquí de colocan los que tienen calificación entre 60 y 69 puntos. El segundo estudiante es una estudiante y tiene una calificación de 86 puntos, por lo tanto se coloca en la columna de sexo femenino y en la tercera fila, ya que aquí se deben colocar los estudiantes que tienen entre 80 y 89 puntos.

Page 4: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

4

El tercer estudiante es sexo masculino y tiene una calificación de 72 puntos, por lo que se coloca en la columna de masculino y en la segunda fila, ya que en esta se colocan los estudiantes con calificación entre 70 y 79 puntos. El procedimiento se continúa hasta tabular los datos de la tabla como se ilustra a continuación

Sexo Calificación Masculino Femenino

Total

60 - 69 /// ///

70 - 79 ///////////// ///

80 - 89 // /////

90 - 100 /

Total

Luego del conteo de las frecuencias, los datos son

Cuadro No. Calificación en matemáticas y sexo de los estudiantes

Sexo Calificación

Masculino Femenino Total

60 - 69 3 3 6

70 - 79 13 3 16

80 - 89 2 5 7

90 - 100 0 1 1

Total 18 12 30 Fuente: Registro de la escuela

Preguntas

1. Determinar el porcentaje de estudiante por sexo Como se muestra en el cuadro de los 30 estudiantes, 18 son de sexo masculino, lo que representa un 60.0% del total de estudiantes,

%0.6010030

18 =×=masculinodedePorcentaje , de igual forma, el porcentaje

de estudiante femenino es de 40.0%

2. Calcular el porcentaje de estudiantes con menos de 80 puntos

Page 5: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

5

Con menos de 80 puntos hay un total de 22 estudiantes, (6 de 60 a 69 y 16 con puntuación entre 70 y 79), lo que representa un 73.3% 3. De los que tienen menos de 90 puntos, ¿qué porcentaje es

femenino? En este caso se está pidiendo un porcentaje para un grupo determinado, los estudiantes que tienen menos de 90 puntos. Como se muestra en el cuadro hay un total de 29 estudiantes con una puntuación menor a 90 puntos y de estos 29 estudiantes 11 son de sexo femenino, por lo tanto este porcentaje

es: %9.3710029

11 =×

4. Del grupo femenino ¿qué porcentaje tiene menos de 90 puntos? Al igual que en la pregunta anterior, en este caso se está pidiendo un porcentaje para un grupo determinado, las estudiantes de sexo femenino. Como se muestra en el cuadro hay un total de 12 estudiantes de sexo femenino y de estas 11 estudiantes tienen una calificación menor de 90

puntos, por lo tanto este porcentaje es: %7.9110012

11 =×

5. Que porcentaje de estudiantes tiene entre 80 y 89 puntos

Con calificación entre 80 y 89 puntos hay un total de siete estudiantes, por

lo que este porcentaje es %3.2310030

7 =×

Análisis de los datos del cuadro En muchos casos se requiere del análisis de los datos de un cuadro, no de responder a preguntas específicas, en este sentido el análisis se hace atendiendo al objetivo o lo que se desea destacar de la información en el cuadro. Un análisis de cuadro anterior destacando el rendimiento por sexo podría ser: “Los datos que se muestran en el cuadro indican que un 60.0% de la población estudiada es de sexo masculino y un 40.0% de sexo femenino. En cuanto al rendimiento de los estudiantes, un 80.0% tiene una calificación de 80 0 más puntos, mientras que solo un 3.3% tiene calificación por encima de 90.0%, [(1/30)×100]”

Page 6: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

6

En cuanto al sexo los datos indican que de las mujeres un 25.0%,

%0.2510012

3 =× , en los hombres este porcentaje es 16.7%, %7.1610018

3 =× .

Page 7: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

7

Distribución de frecuencia y cuadros de doble entrada con Excel. Una forma sencilla, rápida y segura para construir una distribución de frecuencia es utilizando el Excel de Microsoft. Veamos un ejemplo paso a paso. Paso 1: Abrir el archivo en Excel con los datos que van a analizar, (vamos a trabajar con un archivo que tiene 10 variables y 150 casos. El archivo se llama Ejemplo_Tabulación_Cruzada

En este archivo las variables cualitativas están codificadas; así, en la variable sexo el uno representa a los varones, el dos a las hembras, en la variable escuela el uno representa la escuela pública y el dos la escuela privada, en la variable condición el uno representa indica que es promovido y el dos que es remitente, en la variable con quien vive el uno representa que vive con ambos padres, el dos con la madre, el tres con el padre y el cuatro con un familiar. Paso 2: Con el archivo abierto, elegimos la opción datos y una vez entrado en la opción datos, elegimos la opción Informe de tablas y gráficos dinámicos

Page 8: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

8

Paso 3: Cuando se abre la opción el programa pide identificar la fuente de los datos, es decir si están en la misma hoja o si es una base externa. Por defecto trae marcada una la hoja de Excel. Elegimos la opción siguiente Cuando pulsamos seguir, nos pide marcar los datos que vamos a analizar. Aquí marcamos los datos incluyendo el nombre de las variables, si no se le pone un nombre a las variables, el Excel asume la primera fina como nombre de las variables

Hay que tener mucho cuidado al marcar el rango de los datos, para no incluir celdas en blanco o con un caracter no alfanumérico, pues esto dificulta el agrupamiento de las variables cuantitativas incluidas en e cuadro.

Page 9: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

9

Una vez marcado el rango de datos a analizar, pulsamos la opción siguiente y aparece el siguiente recuadro en el que se pide identificar el rango de salida, si en la misma hoja o en una hoja de cálculo nueva. Por lo general trae por defecto esta ultima opción y es la más recomendada. Una vez que se ha decidido el rango de salida, pulsamos la opción Diseño y aparece el siguiente recuadro. Como se muestra, a la derecha del recuadro aparece el nombre de las variables y a la izquierda el formato para el cuadro. En el formato del cuadro arrastramos el nombre de la variable que va en la primera columna del cuadro y la colocamos donde dice FILA, luego arrastramos la variable que va en la primera fila al lugar donde dice COLUMNA y luego elegimos una variable para hacer el conteo, esta variable la colocamos en medio del cuadro donde dice DATOS. Vamos a hacer un cuadro con la variable promedio y el tipo de escuela, elegimos la variable No. Para contar veamos el recuadro que nos sale:

Page 10: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

10

Vemos que en el recuadro de datos dice suma y lo que nos interesa es el conteo. Para lograrlo pulsamos doble clic sobre Suma de No., se despliega la lista de opciones Se elige Contar, pulsamos Aceptar, se muestra que ahora en el recuadro de datos dice Cuenta de No.

Page 11: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

11

Aquí pulsamos Aceptar y luego Finalizar, se obtiene el cuadro deseado

Page 12: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

12

Como se muestra en la tabla tenemos las dos variables. Ahora bien, los datos del promedio del rendimiento están ordenados en orden ascendente pero no organizados. Par agruparlos en una distribución con clase, nos colocamos sobre el nombre de la variable y pulsamos un clic derecho. Luego elegimos la opción Agrupar y mostrar detalle y dentro de esta se elige la opción Agrupar Al elegir agrupar el programa indica el dato menor y el mayor observado y sugiere un tamaño para intervalo, el cual puede ser cambiado de acuerdo al objetivo que se persigue al hacer la agrupación. En el ejemplo nos sugiere un intervalo de 10, si se desea este intervalo se presiona Aceptar y si no es asi se cambia por el valor del intervalo deseado y se presiona Aceptar

Page 13: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

13

Al pulsar Aceptar, se obtiene el cuadro que se busca

Ahora el cuado se puede copiar en otro lugar para darle la forma deseada y poner título y fuente. En el caso del tipo de escuela se cambian los números por su significado: el uno escuela pública y el dos por escuela privada.

Cuadro No. Cantidad de estudiante por calificación y tipo de escuela

ESCUELA Calificación Prom. Pública Privada

Total

56.5-66.5 19 7 26 66.5-76.5 46 16 62 76.5-86.5 19 27 46 86.5-96.5 5 11 16 Total 89 61 150 Fuente: Encuesta en colegios y escuelas

Page 14: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

14

Ahora suponga que se desea otro tipo de agrupación de los datos, por ejemplo, menos de 70, de 70 a 80, de 80 a 90 y de 90 y más. El procedimiento a seguir es el mismo: nos colocamos sobre el nombre de la variable y pulsamos un clic derecho. Luego elegimos la opción Agrupar y mostrar detalle y dentro de esta se elige la opción Agrupar Como se desea hincar en 70, cambiamos el valor de inicio y colocamos 70 y cambiamos el valor final y le indicamos que termine en 90 y el intervalo lo dejamos en 10, dado que va de 70 a 80 y de 80 a 90.

Page 15: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

15

El resultado obtenido con la operación es

Igual que en el caso anterior, se copia el cuadro en otro lugar y se da el formato deseado

Cuadro No. Cantidad de estudiante por calificación y tipo de escuela

ESCUELA Calificación Prom. Pública Privada

Total

<70 41 13 54 70-80 30 18 48 80-90 16 24 40 >90 2 6 8

Total 89 61 150 Fuente: Encuesta en colegios y escuelas

Distribuciones de Frecuencia Si lo que se desea es hacer una distribución de frecuencia para una sola variable, basta con eliminar una de las variables en el cuado y dejar la que se desee organizar. Veamos un ejemplo con el rendimiento promedio, como la calificación mínima es de 56.5 y la mayor de 96.5 le vamos a indicar que inicie el 55 y termine en 100 y que haga los intervalos de cinco. Estos intervalos han sido modificados para que los datos se presenten de forma más precisa, pero si se tratara de una variable en la cual es importante tomar en cuenta las cifras decimales entonces los límites se dejan tal cual o se inicia en uno que sea conveniente.

Page 16: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

16

El resultado que se obtiene es el que se muestra a continuación

El cuadro que resulta se puede copiar y hacer los arreglos correspondientes, así como calcular las demás frecuencias. En cuadro siguiente se muestra la distribución de frecuencia completa

Page 17: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

17

Cuadro No.: Calificación promedio de los estudiantes

Calificación Promedio No. % FA

% Acumulado

55-60 3 2.0 3 2.0 60-65 20 13.3 23 15.3 65-70 31 20.7 54 36.0 70-75 31 20.7 85 56.7 75-80 17 11.3 102 68.0 80-85 27 18.0 129 86.0 85-90 13 8.7 142 94.7 90-95 7 4.7 149 99.3 95-100 1 0.7 150 100.0

Total 150 100.0

Fuente: Encuesta en colegios privados y escuelas públicas

Page 18: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

18

Ejercicios Propuestos: Con los datos que se presentan en la tabla siguiente crear un pequeño reporte indicando la relación entre las siguientes variables:

1) El rendimiento académico y el sexo de los estudiantes 2) El número de asignatura y sexo de los estudiantes. 3) El gasto en transporte y número de asignaturas cursadas. 4) La edad de los estudiantes y el número de asignaturas cursadas.

Para el índice académico divida esta variable en tres categorías, los que tienen menos de 75 puntos, los que tienen entre 75 y 80 puntos y los que tienen más de 80 puntos. En el caso del número de asignaturas, divídala en tres categorías, los que cursan menos de cuatro asignaturas, los que están cursando cuatro asignaturas y los que cursan más de cuatro. Para la edad divida esta variable en tres categorías, los que tienen entre 20 y 23 años, los que están entre 24 y 27 años y los que tienen de 28 y más años. En el caso del gasto en transporte haga una división en categorías, si lo considera necesario y ser así, divida la variable a su conveniencia.

Datos personales de 30 estudiantes de Informática

No. EDAD SEXO # DE ASIG.

INDICE ACAD.

GASTO EN TRANSP.

1 22 M 3 80.0 20

2 24 F 3 77.8 50

3 23 M 4 75.6 60

4 25 M 5 74.6 30

5 21 M 3 82.1 30

6 25 F 3 74.3 50

7 22 M 3 77.7 40

8 21 F 6 80.1 40

9 28 F 3 70.3 40

10 28 F 4 70.3 40

11 29 M 5 73.5 40

12 25 F 3 74.3 20

13 20 M 4 79.8 40

14 30 F 2 73.3 20

15 28 F 3 81.5 40

16 24 F 4 74.4 40

17 28 F 3 78.6 40

18 24 F 6 76.7 40

19 21 F 4 77.7 20

20 24 M 3 79.4 20

21 35 M 2 75.7 40

Page 19: Tema 2 Clase 2 Tabulacion Cruzada

Apuntes sobre Estadística

Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. Elaborado por H. Medina Disla. FebreroFebreroFebreroFebrero 20 20 20 2011111111....

19

22 21 F 4 83.0 40

23 24 M 3 81.2 50

24 22 F 3 76.8 60

25 21 F 4 80.7 30

26 26 F 3 70.8 50

27 25 F 4 71.3 20

28 24 M 5 74.9 80

29 29 M 3 82.6 30

30 25 F 5 80.6 20 FUENTE: ENCUESTA EN EL AULA EST-211 SEC-01. 24/02/2007.