variables en estadistica

5
VARIABLES EN ESTADÍSTICA 2010 DEFINICIÓN Cuando se hable de variable se hará referencia a una característica de interés que puede ser medida u observada a las unidades elementales de una población y que tiene una variabilidad intrínseca a los mismos. Se simbolizará con letras minúsculas (x, y, a, b,...) que puede tomar cualquier valor (o atributo) de un conjunto determinado de elementos, que se llamará recorrido de la variable. CLASIFICACIÓN SEGÚN LA NATURALEZA DE LA VARIABLE Según su naturaleza las variables se clasifican del siguiente modo: Variables cualitativas. Son llamadas también variables categóricas. Miden una cualidad o atributo de determinada unidad elemental y no toman valores numéricos, o si los toman, solo representan códigos; ejemplo de ello es la variable sexo que resultará ser masculino o femenino; También el estado civil que será: casado, soltero, separado, viudo. Una degustación un producto puede ser: bueno, regular, malo o excelente. Variables Cuantitativas. Como su nombre lo indica están asociadas a un número (numéricas) entero o real, ellas pueden ser: Variables discretas: resultan de conteos asociados a los números enteros positivos, por ejemplo el número de personas infectadas de gripe en una comunidad, el número de aves migratorias en el verano pasado; El número de personas que opinan a favor de un candidato. Variables continuas: estas variables resultan básicamente de mediciones asociadas a un instrumento de medición o una razón, por consiguiente están asociadas a los números reales; en este tipo de variables es muy común encontrar mediciones, razones o tiempos por tal razón tales valores resultan decimales como por ejemplo: la calificación numérica de una evaluación, medición del peso de una persona; tiempos de llegada a una estación, tasa de desempleados por municipio en el país. CLASIFICACIÓN SEGÚN LA ESCALA O NIVEL DE MEDICIÓN Las escalas de medición son las herramientas apropiadas para medir y clasificar las variables mediante un orden jerárquico según la cantidad de información que ofrezcan al investigador. Estas permitirán precisar en

Upload: juan-de-j-sandoval

Post on 13-Jun-2015

677 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Variables en estadistica

VARIABLES EN ESTADÍSTICA 2010

DEFINICIÓN

Cuando se hable de variable se hará referencia a una característica de interés que puede ser medida u

observada a las unidades elementales de una población y que tiene una variabilidad intrínseca a los mismos.

Se simbolizará con letras minúsculas (x, y, a, b,...) que puede tomar cualquier valor (o atributo) de un conjunto

determinado de elementos, que se llamará recorrido de la variable.

CLASIFICACIÓN SEGÚN LA NATURALEZA DE LA VARIABLE

Según su naturaleza las variables se clasifican del siguiente modo:

• Variables cualitativas. Son llamadas también variables categóricas. Miden una cualidad o atributo

de determinada unidad elemental y no toman valores numéricos, o si los toman, solo representan

códigos; ejemplo de ello es la variable sexo que resultará ser masculino o femenino; También el

estado civil que será: casado, soltero, separado, viudo. Una degustación un producto puede ser:

bueno, regular, malo o excelente.

• Variables Cuantitativas. Como su nombre lo indica están asociadas a un número (numéricas)

entero o real, ellas pueden ser:

• Variables discretas: resultan de conteos asociados a los números enteros positivos, por

ejemplo el número de personas infectadas de gripe en una comunidad, el número de aves

migratorias en el verano pasado; El número de personas que opinan a favor de un

candidato.

• Variables continuas: estas variables resultan básicamente de mediciones asociadas a un

instrumento de medición o una razón, por consiguiente están asociadas a los números

reales; en este tipo de variables es muy común encontrar mediciones, razones o tiempos

por tal razón tales valores resultan decimales como por ejemplo: la calificación numérica de

una evaluación, medición del peso de una persona; tiempos de llegada a una estación, tasa

de desempleados por municipio en el país.

CLASIFICACIÓN SEGÚN LA ESCALA O NIVEL DE MEDICIÓN

Las escalas de medición son las herramientas apropiadas para medir y clasificar las variables mediante un

orden jerárquico según la cantidad de información que ofrezcan al investigador. Estas permitirán precisar en

Page 2: Variables en estadistica

VARIABLES EN ESTADÍSTICA 2010

su momento las técnicas de muestreo y metodologías estadísticas adecuadas para los análisis estadísticos.

Para empezar, es conveniente definir mejor el concepto de medida, se entiende el acto de medir como “un

proceso por el cual los números o símbolos se asignan para representar características o propiedades de

acuerdo a determinadas reglas o patrones de comparación establecidos”.

Según su escala de medición (nivel), las variables se clasifican en nominales u ordinales (el caso de las

cualitativas) y de intervalo o razón (el caso de las cuantitativas).

ESCALA NOMINAL. Son variables cualitativas cuyas categorías no se pueden ordenar según criterios

universales, por eso son llamadas variables en escala nominal. Los estadísticos que son apropiados para las

escalas nominales están solamente basados sobre conteos de frecuencias absolutas o relativas sobre las

categorías o la identificación del atributo más frecuente (la moda).

Considere la variable sexo (biológico), sus categorías son hombre y mujer. Típicamente se puede usar

números para facilidad de notación, por ejemplo se puede representar hombre con 1 y mujer con 2 (esto es

absolutamente necesario) para representarlos. La asignación de números los entre las categorías no tiene

importancia numérica y sería inapropiado realizar cálculos numéricos (como por ejemplo operaciones

aritméticas u ordenarlos), otro ejemplo de ello es el número de la cedula. Estos números simplemente son

utilizados para clasificar sujetos en diferentes grupos y contar qué cantidad hay en cada categoría.

ESCALA ORDINAL. Supóngase que se desea medir la preferencia por un producto (1: me gusta muchísimo,

2: me gusta medianamente, 3: me gusta poco, 4: no me gusta), que tiene de un individuo para cuatro marcas

de refresco, digamos A, B, C y D. Podría preguntársele a cada sujeto el rango de orden de de preferencia de

las cuatro marcas, Considere el siguiente rango de orden para una preferencia particular de un sujeto:

MARCA RANGO

A 1

B 2

C 3

D 4

Desde la tabla anterior se puede concluir que el sujeto en mención prefiere más la marca A que la marca C,

prefiere la C más que la D, etc... No obstante, aunque las diferencias entre los valores numéricos sucesivos

asignados a las categorías sean las mismas, no se puede manifestar que este individuo prefiera tantas veces

mas una marca que otra, como por ejemplo decir que D es 4 veces más preferida que A, no porque los

Page 3: Variables en estadistica

VARIABLES EN ESTADÍSTICA 2010

números asignados son códigos, que bien podían ser cambiados (como por ejemplo por 0, 10, 12, 28), sin

embargo, se sabe el orden de su preferencia. Variables con estas categorías, son catalogadas en escalas de

medición ordinales. Los estadísticos que pueden ser calculados en la escala ordinal son: son los mismos de la

escala nominal, en adición a los estadísticos de orden (mediana, percentiles), además, distribuciones de

frecuencias acumuladas y estadísticos no paramétricos tales como la correlación de Spearman1.

ESCALA DE INTERVALO. Supóngase que en vez de preguntar al individuo en el ejemplo anterior, por el

rango de orden de las 4 marcas, se le pregunta por un orden de preferencia de 1 a 10 (por ejemplo que tanto

le gusta el producto), de cada una de las marca de acuerdo a la siguiente escala:

Tabla No 1

Si se asume que categorías sucesivas representan iguales grados de preferencia entonces se podría decir

que la diferencia entre la preferencia de un sujeto para la marca que se codificó con 1 y 2, es la misma

diferencia para otra marca que se codificó con 4 y 5. Sin embargo, no se puede decir que la preferencia por

una marca digamos codificó con 5, es 5 veces más preferida que la marca codificó con 1. El siguiente ejemplo

donde se inicia una codificación desde 4 hasta 22, clarifica este punto:

Tabla No 2

Desde la tabla 2 es claro que las diferencias entre códigos sucesivos son iguales; sin embargo, el cociente

entre el último valor (22) y el primer (4) no es el mismo que para la escala de la tabla 1, que es de 10. La

razón entre el último valor y el primero es de 10 para la tabla No 1 y de 5,5 para la tabla 2, no obstante, los

valores en preferencias son los mismos.

Al cambiar la escala se ha cambiado el valor de la categoría base (es decir el valor del peor nivel de

preferencia). La escala de intervalo no tiene un valor o punto de base natural. Esto es, el valor base es

arbitrario. Las escalas de medición cuyas categorías sucesivas representan iguales niveles de la

1 Estadístico que permite calcular la correlación entre dos variables cuyas categorías o valores se puedan

ordenar, creado por Charles Spearman, Estadístico de S. XIX, fundador de la estadística no paramétrica

PUNTO DE

ESCALA10 9 8 7 6 5 4 3 2 1

PREFERENCIA Excelente Muy bueno Medio bueno AceptableMedianamente

aceptablePoco aceptable Bajo

Medianamente

bajoMuy bajo malo

PUNTO DE

ES CALA22 20 18 16 14 12 10 8 6 4

PREFERENCIA Excelente Muy bueno Medio bueno AceptableMedianamente

aceptablePoco aceptable Bajo

M edianamente

bajoM uy bajo malo

Page 4: Variables en estadistica

VARIABLES EN ESTADÍSTICA 2010

característica que está siendo medida y cuyos valores de base son arbitrarios son llamadas: Variables en

Escala de Intervalo. Valores como por ejemplo, los de la temperatura son variables de escala de intervalo

porque no hay ceros absolutos, por ejemplo, 0°C no indica ausencia de medida, por consiguiente no es un

punto de referencia válido para comparar los valores de la temperatura. Tampoco se podrá decir que para

cada individuo hay la misma sensación, al pasar de frio o calor, por ejemplos pasar de 20°C a 30°C, no es lo

mismo que pasar de –10°C a 0°C (aunque la diferencia sea la misma), razón por la cual aquí no tienen

sentido los cocientes entre pares de valores de la temperatura ya que las mismas distancias entre los valores

son arbitrarias. Se podría decir que las variables en escala de intervalo son puntajes numéricos ampliados de

la escala ordinal en la que no necesariamente se deberá tomar valores enteros.

Las variables en esta escala se pueden calcular todos los estadísticos conocidos excepto comparaciones con

algunos en los haya que realizar un cociente entre valores de la variable tales como el coeficiente de

variación.

ESCALA DE RAZÓN. La escala de razón tiene todas las propiedades de las variables en escala de intervalo,

pero además de ello, tiene una base natural que no puede ser cambiada, como por ejemplo, la edad de un

sujeto que tiene un valor absoluto de base natural (cero) y no depende de las unidades de medición que se

asignen. Las escalas de razón pueden ser transformadas multiplicando por una constante, sin embargo ellas

no pueden ser transformadas adicionando una constante, esto cambiaría su valor de base.

En las escalas de razón se dan afirmaciones como: la edad de Jorge es 3 veces la edad de su hijo Samuel.

No hay restricción para que todo tipo de estadísticos numéricos puedan ser calculados en unos datos de

escala de razón. Las variables medidas usando escalas de intervalo y de razón son denominadas variables

métricas.

Taller No 1

1. Clasificar las siguientes características según su naturaleza, escala de medición:

1. ¿Cuál es su preferencia política?

2. ¿Qué marca de cerveza en Colombia le gusta más?

3. ¿Cómo se considera en cuanto a su rendimiento académico en el ITM?

4. ¿A qué velocidad en Km/h regularmente anda Ud en un móvil (carro, moto)?

5. ¿Cuánto pesa ud. en Kg?

6. ¿Cuál fue su puntaje cuantitativo obtenido en la pruebas de ICFES?

7. ¿Cuál es su Signo del zodiaco?

Page 5: Variables en estadistica

VARIABLES EN ESTADÍSTICA 2010

8. En que semestre académico del ITM está actualmente?

9. ¿Cuál es el Nivel educativo del padre?

10. ¿Hace cuanto tiempo empezó a estudiar durante toda su vida?

11. ¿Qué tipo de colegio es de donde proviene ud?

12. ¿Cuál es color de su cabello?

13. ¿Qué cantidad de cantidad de memoria en Gigabyte tiene su computador?

14. ¿a qué temperatura en grados Celsius esta de Medellín actualmente?

15. ¿En qué régimen de seguridad social se encuentra actualmente?

16. ¿Cuál es el tipo de creencia religiosa que profesa?

Clasifique las variables anteriores siguiente cuadro, según su naturaleza, escala de medición,

categorías (si es cualitativa) o unidad de medida, estadísticos calculables con una tabla de la siguiente

forma:

Operatividad de variables

definición Naturaleza Escala de medición Categorización o unidad

de medida

Estadísticos

a calcular

“como se debe preguntar”

“cuáles son las categorías

(cuales) o la unidad de

medida”

“cuáles son los posibles

estadísticos a calcular con

dicha variable”