unidad uno conceptos fundamentales -...

14
7 UNIDAD UNO: Organización de datos UNIDAD UNO “La estadística no es más que el sentido común expresado numéricamente” Pierre Simón, marqués de Laplace, matemático francés del siglo XVIII Palabras Clave 1.1 Objetivos Específicos de la Unidad Saber qué significa Estadística. Especificar los dos tipos de Estadística Aprender los pasos del proceso de una investigación estadística. Conocer y diferenciar los conceptos fundamentales en estadística. Ordenar y agrupar los datos o información estadística en grupos de fácil manejo e interpretación. Presentar la información estadística en forma gráfica para su descripción visual. Estadística Estadística Inferencial Población Proceso de investigación estadística Estadística Descriptiva Muestreo Estadígrafo Censo CONCEPTOS FUNDAMENTALES

Upload: lamtu

Post on 27-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

7

UNIDADU

NO:O

rganiz

ació

nd

ed

atos

UNIDAD UNO

“La estadística no es más que el sentido común expresado numéricamente”

Pierre Simón, marqués de Laplace, matemático francés del siglo XVIII

Palabras Clave

1.1 Objetivos Específicos de la Unidad

• Saber qué significa Estadística. • Especificar los dos tipos de Estadística • Aprender los pasos del proceso de una investigación estadística. • Conocer y diferenciar los conceptos fundamentales en estadística. • Ordenar y agrupar los datos o información estadística en grupos de fácil manejo e

interpretación. • Presentar la información estadística en forma gráfica para su descripción visual.

Estadística Estadística Inferencial

Población Proceso de investigación estadística

Estadística Descriptiva Muestreo

Estadígrafo Censo

Parámetro Distribución de frecuencias

CONCEPTOS FUNDAMENTALES

1.2 DESARROLLO TEMÁTICO

1.2.1 Definiciones Básicas

Tome nota

1. ¿Qué es la Estadística?

El término estadística se deriva de la palabra ESTADO, en razón a que los gobiernos, para su planificación, han llevado registros de muchas variables como población, nacimientos, defunciones, exportaciones, impuestos, producción, etc.

Aunque existen diferentes definiciones de lo que es la estadística, para este módulo asumiremos la siguiente:

La estadística es el conjunto de métodos o procedimientos que se emplean para recoger, organizar, procesar, resumir, presentar, interpretar y analizar una serie de datos numéricos, para la toma de decisiones bajo incertidumbre.

2. La estadística tiene dos grandes divisiones:

Estadística Descriptiva: Es la que se utiliza cuando las conclusiones que se obtienen de los datos en estudio, no rebasan los límites de los mismos, es decir las conclusiones solo son válidas para el grupo de donde se obtienen los datos. La estadística descriptiva utiliza tablas, gráficos y medidas representativas para mostrar el comportamiento de la serie de datos. Un ejemplo es cuando describimos un grupo de personas clasificándolas de acuerdo al género:

Estadística inferencial: Trabaja con base en grupos pequeños llamados muestras y los resultados obtenidos los generaliza a un grupo mayor llamado población. Implica por lo regular, tomar decisiones sobre el grupo mayor del cual forman parte los datos.

El proceso de tomar decisiones en situaciones generales, a partir de la información del grupo pequeño, es arriesgado y no puede realizarse con certeza absoluta, si no con incertidumbre. Sin embargo esta última no es total, puede controlarse, puede medirse que tan grande es la confianza de los resultados, lo cual se realiza con base en el cálculo de las probabilidades.

GENERO

Númerodepersonas

Femenino 6

Masculino 4

3. Conceptos básicos

En cualquier trabajo en el que se aplique la estadística, debe hacerse referencia a un conjunto de elementos, conocido como población.

Población o Universo: Es el conjunto total de personas, elementos u objetos con características comunes de los cuales se quiere obtener información. Tal como se define el término población, tiene un significado mucho más amplio que el usual, ya que puede referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo.

La población debe estar perfectamente definida en el tiempo y en el espacio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede delimitado. Si, por ejemplo, para hacer un análisis de las pequeñas empresas, se debe especificar cuáles son y en qué período de tiempo se analizan: pequeñas empresas de la capital de país en el año 2008.

El tamaño de una población viene dado por la cantidad de elementos que la componen. La población es finita cuando se puede establecer con exactitud el número de elementos que la conforman, por ejemplo cuando se quiere hacer un estudio con todos los estudiantes del Politécnico; de otra manera se dice que es infinita por ejemplo cuando se quieren estudiar las estrellas en el firmamento.

Unidad de análisis: Es el objeto del cual se desea obtener información. Muchas veces nos referimos a las unidades de análisis con el nombre de elementos. En estadística, un elemento o unidad de análisis puede ser algo con existencia real, como un automóvil una casa, o algo más abstracto como la temperatura o un intervalo de tiempo. Dada esta definición, puede redefinirse población como el conjunto de unidades de análisis.

Muestra: Es un subconjunto o parte representativa de unidades de análisis de una población dada, con el que se pretende suministrar información sobre la población. Para que este subconjunto de unidades de análisis sea de utilidad estadística, deben reunirse ciertos requisitos en la selección de los elementos, para que la muestra se considere representativa.

Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la población que se defina tenga tamaño infinito, y en consecuencia, no fuera posible observar a todos sus elementos. En otras ocasiones, el costo de la observación exhaustiva puede ser muy elevado, el tiempo de recolección de la información muy extenso, o más aún, la observación de los elementos puede ser destructiva. Por ejemplo, si quisiéramos hacer un estudio de la calidad de una nueva marca de cerillas, no podríamos probarlas a todas pues las destruiríamos.

Parámetro: Es el número calculado sobre los datos de una población, que cuantifica una característica de ella.

Estadística: Es el número calculado a partir de los datos de la muestra, que cuantifica una característica de ella.

Dato: Es cada uno de los individuos, cosas, entes abstractos, etc., que integran una población o universo determinado. Dicho de otra forma, cada valor observado de la variable.

Variable: Es la característica observada en los elementos de la población o la muestra; la variable es la cualidad o cantidad medible que se estudia en las unidades de análisis y que varía de una unidad a otra. Por ejemplo: edad, ingreso de un individuo, sexo, estado civil, nacionalidad, religión, cantidad de lluvia caída, etc.

Las variables pueden ser:

Cualitativas: Denominadas también atributos, son todos aquellos fenómenos que pueden ser descritos cualitativamente es decir mediante palabras; son ejemplos de atributos: la clasificación de los alumnos de una universidad por departamento de origen, clasificación de un grupo de personas por ocupación, por sexo, por cargo, color de los ojos, etc.

Cuantitativas: Son todos aquellos fenómenos susceptibles de ser expresados cuantitativamente, es decir mediante números. Por ejemplo: peso, estatura, número de hijos, salarios, etc.

Las variables cuantitativas se dividen en: discretas y continuas, pero esta clasificación tiene más valor teórico que práctico.

Las variables discretas son aquellas que admiten solamente valores enteros, es decir no tienen valores intermedios, por ejemplo, el número de hijos por familia, ya que no se puede decir que una familia tiene dos hijos y medio.

Otros ejemplos de variables discretas:

• Número de automóviles que entran a un parqueadero. • Número de cheques girados al mes.

Las variables continuas, son aquellas que admiten valores fraccionarios y de las que se pueden establecer intervalos. Por ejemplo, una persona que mide un metro con setenta centímetros, que pesa sesenta kilos, una libra y cuatro onzas, etc.

Otros ejemplos de variables continuas son:

• El peso de las cajas de tomates. • El tiempo de duración de una conversación telefónica. • El tiempo que gastamos de la casa al trabajo. • Las ventas semanales de un almacén.

Para representar las variables utilizamos como símbolo las últimas letras del alfabeto castellano (en mayúsculas) X, Y, Z.

CUALITATIVAS

VARIABLES

CUANTITATIVAS

VARIABLES

DISCRETAS

VARIABLES

CONTINUAS

Nivel de medición: las variables pueden ser medidas con mayor o menor grado de precisión, según la escala de medida utilizada para su observación. Podemos distinguir los siguientes niveles de medición de una variable conocidas también como escalas de medida:

• Nominal: sólo permite clasificar a las unidades de análisis en categorías. Por ejemplo: sexo –femenino y masculino.

• Ordinal: además de clasificar a los elementos en distintas categorías, permite establecer una relación de orden de las mismas. Por ejemplo: clase social –baja, media y alta-.

• De Intervalo: permite clasificar, ordenar y medir la distancia entre las diferentes categorías. La representación de la variable es numérica con sentido matemático, es decir los valores de la variable se pueden sumar, restar, multiplicar y dividir. En esta escala de medida el valor 0 (cero) es arbitrario, es decir el 0 no indica ausencia de. Por ejemplo, en el caso de la temperatura, decir que estamos a 0 grados no significa que no haya temperatura.

• Razón o Proporción: Como en la escala anterior, es numérica, pero aquí el valor 0 sí indica ausencia. Por Ejemplo: el ingreso de personas en un lugar.

Se puede decir entonces, de acuerdo al nivel de medición utilizado para su observación, que:

• Variables cualitativas: son las variables medidas en escala nominal u ordinal, ya que la característica que miden de la unidad de análisis es una cualidad.

• Variables cuantitativas: son las variables medidas en escala intervalar, o de razón o proporción, puesto que lo que miden es una cantidad.

3. Métodos de recolección de datos

La forma de obtener la información original de las unidades de análisis que componen el universo por investigar, puede ser efectuada a través de un censo, una encuesta o un registro administrativo.

Censo

Es un método de recolección de datos, mediante el cual, la información se obtiene de la totalidad de los elementos que componen la población o universo bajo estudio.

El término censo se aplica a aquellos levamientos de información que comprenden todas las unidades de todo un país y que se realizan con una frecuencia de recolección quinquenal o decenal, como es el caso de los censos de población, económicos, agropecuarios, etc., También se aplican a otros levantamientos de información, según sea su cobertura geográfica, número de unidades de información o frecuencia de recolección, siempre que incluya todas las unidades que componen el universo que se investiga.

Encuesta

Es un método de recolección, mediante el cual, la información se obtiene sólo de un subconjunto o muestra de elementos del universo en estudio, que permite obtener información sobre él mismo.

Para que la información obtenida con la encuesta sea generalizable a la población, la muestra utilizada debe ser representativa de la población de la que proviene. Para lograrlo, se utilizan métodos de selección de unidades especialmente diseñados con este fin.

Para diseñar correctamente una encuesta es necesario tomar en consideración algunos elementos básicos tales como:

• Titulo: Todo formulario debe tener un nombre o titulo indicando a que se refiere o que es lo que contiene.

• Instrucciones : Las instrucciones se refieren a las orientaciones que se brindan al encuestado sobre cómo se debe llenar el formulario

• Identificación del encuestado y del formulario: El formulario debe contener información escrita para su identificación, como: numero, fecha y lugar en que fue o será llenado; igualmente necesaria es la identificación de la persona o unidad de estudio, su dirección u otro dato general que facilite su ubicación. Es frecuente que se presente el interrogante acerca si debe o no aparecer el nombre de la persona encuestada en el instrumento, se estima que ello debe estar sujeto al criterio del investigador o si se necesita esa información para los objetivos de su estudio. Al respecto, algunos autores opinan que, el anonimato generalmente contribuye a obtener datos más veraces y por consiguiente confiables.

• Cuerpo del instrumento: Se refiere a las preguntas o "ítem" referentes a las variables que se medirán según el problema y objetivos del estudio.

• Identificación del encuestador: Finalmente, los formularios deben contener como dato de identificación del investigador el nombre de la persona que recogerá la información, además debe registrarse la fecha y lugar donde se aplique el formulario.

Preguntas del formulario. Uno de los aspectos relevantes a considerar en el diseño del formulario es el de las preguntas o "ítem" del mismo; estas determinan en última instancia el alcance y logro de los objetivos de investigación, y a través de ellas se medirán las variables en estudio, obteniendo la información pertinente. Así mismo, debe considerarse, entre otras: tipo de preguntas, su redacción, número y orden.

Referente al tipo de preguntas se consideran dos: dicotómicas y las de respuestas múltiples. Las primeras son las que tienen dos alternativas; un ejemplo de estas puede ser aquella cuya respuesta es sí_____ o no_____.

La de respuestas múltiples son las preguntas con varias alternativas, donde el encuestado debe recoger múltiples alternativas, ya que con una pregunta se obtiene mayor información que con las dicotómicas. Lo anteriormente expuesto se aclara con el siguiente ejemplo:

Dicotómica

Posee casa propia si_________ no________

La casa donde vive es alquilada si_________ no________

La casa donde vive la está pagando si_________ no________

Respuesta Múltiple

La casa donde vive:

Es propia ______

La está pagando ______

Es alquilada ______

A las preguntas dicotómicas y de selección múltiples se les llama cerradas o estructuradas, ya que al lado de ellas se anotan varias respuestas posibles entre las que el sujeto de estudio o entrevistado deberá optar. En la elaboración de este tipo de preguntas debe tenerse presente que las alternativas de respuesta deben ser mutuamente excluyentes. Este tipo de preguntas tienen la ventaja de requerir menos tiempo y menos destreza del entrevistador, así como facilitar la tabulación de la información obtenida.

También existen las preguntas abiertas, donde no se le da al encuestado las posibles respuestas, permitiéndole responder libremente sobre la base de marco de referencia; así, el

encuestador se limita a registrar las respuestas según fue brindada. Se les llama también preguntas no estructuradas, y tienen la desventaja de dificultar la tabulación de los datos por la diversidad de respuestas que se obtienen.

Respecto a la redacción de la preguntas, se considera que es uno de los aspectos que deben tratarse muy cuidadosamente, para ello se proporcionan algunas recomendaciones:

• Las preguntas deben redactarse lo más claramente posible, sin dejar dudas acerca del grado de precisión que se espera de las respuestas. A manera de ejemplo, si se indaga sobre el sueldo de una persona debe aclararse si se desea conocer el "nominal" o el "efectivo", "sueldo semanal", "quincenal" o "mensual".

• El lenguaje usado debe ser simple y comprensible por los encuestados, no se deben usar tecnicismos o palabras desconocidas por ellos, así como tener precaución con el uso de palabras que tienen significado diferentes para cada persona como "mucho", "poco", "frecuentemente".

• Las preguntas deben ser específicas, conteniendo una sola idea y evitando las interrogantes dobles o múltiples. Por ejemplo: "¿Planea usted estudiar este año y trabajar el próximo?", si la respuesta es "no", cabe preguntarse a que aspecto de la interrogante está respondiendo la persona negativamente.

• Las peguntas deben formularse de una manera neutral o imparcial, evitando las interrogantes negativas o positivas que induzcan o favorezcan una respuesta.

Ejemplos de preguntas incorrectas son las siguientes:

• ¿Se opone usted a que el personal se capacite a través del método de educación virtual? • ¿Favorece usted que el personal se capacite a través del método de educación virtual?

Probablemente estaría mejor redactado de la siguiente manera:

• ¿Cuál es su opinión sobre la aplicación del método de educación virtual para capacitar el personal?

Es de observarse que no induce ni negativa ni positivamente la respuesta; es neutral e imparcial. Esta pregunta convendría que se dejara abierta

• Las preguntas no deben sugerir que una respuesta es más deseable que otras. Hay interrogantes que plantean directa e indirectamente la respuesta probable que desea el encuestador. Ejemplo: "está de acuerdo con el trabajo actual, ¿no es cierto?". Aunque el consultado este inconforme se le induce a decir que si está de acuerdo con el mismo.

• Las preguntas requieren plantearse de tal manera que se obtenga la información amplia y completa para los fines del estudio. Si se desea conocer las revistas o referencias que reciben o leen los distintos agentes de salud para su capacitación y formación general, probablemente no bastará saber el nombre de las revistas sino también la frecuencia y que secciones o áreas lee de esas revistas.

Existe otra serie de consideraciones, aunque se estima que se han planteado algunas de las relevantes.

Otro aspecto referente a las preguntas es el orden de ubicación según las secciones a áreas del formulario. Conviene ubicar primero las preguntas simples y neutrales y posteriormente las más difíciles y las de índole personal; las iníciales deben ser fáciles de contestar y no despertar reacciones negativas en el encuestado, ya que pueden afectar las respuestas y la disposición a responder el resto del formulario. El orden psicológico debe tenerse muy en cuenta, ubicando en el centro o al final de las secciones o del formulario las preguntas personales sobre datos que usualmente no son brindados por las personas, tales como ingreso económico y vida sexual.

En relación con número de preguntas que deben incluirse en el formulario, no se tiene una cantidad determinada, aunque cabe tener presente que este debe mostrar una extensión y ámbito ilimitado, lo cual estará supeditado al tipo de problema y la medición de las variables en estudio. También depende de los recursos disponibles, la calidad de la información requerida y las características del encuestado.

Es importante tener en cuenta que el diseño de encuestas amerita el concurso de personal especializado en el tema ya que generalmente es el proceso de un trabajo interdisciplinario, porque en las grandes empresas esta información es la materia prima de las bases de datos.

Registro administrativo

yarran

z,www.sxc.hu

Existen oficinas públicas que llevan registros administrativos para sus propios fines. Por ejemplo; los Registros Civiles que registran los nacimientos, los casamientos, las defunciones, etc., los Ministerios de Educación que llevan registros de matriculación de alumnos, deserción escolar, etc., la Aduana que registra las importaciones y exportaciones, etc.

Esta información puede ser utilizada con fines estadísticos y se obtiene tal como está disponible. Los fines administrativos no siempre coinciden totalmente con los fines estadísticos.

Por ejemplo, para un estudio sobre determinada enfermedad, se puede recurrir a los

registros disponibles en hospitales, sanatorios, etc. Estos registros habrán sido diseñados

para dar respuesta a ciertos requerimientos administrativos y seguramente la información

que contienen no coincidirá exactamente con los requerimientos estadísticos.

Los registros constituyen la forma más económica de obtener información estadística de una población.

1.4.2 PLANTEAMIENTO Y PREPARACIÓN DE UNA INVESTIGACIÓN ESTADÍSTICA

El proceso de aplicación de la estadística implica una serie de pasos:

1. Selección y determinación de la población o muestra y de las características contenidas que se desean estudiar. En el caso de que se desee tomar una muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o no probabilístico).

2. Obtención de los datos. Esta puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la realización de experimentos.

3. Clasificación, tabulación y organización de los datos. La clasificación incluye el tratamiento de los datos considerados anómalos, que pueden en un momento

dado falsear el análisis de los indicadores estadísticos. La tabulación implica el resumen de los datos en tablas y gráficos estadísticos.

4. Análisis descriptivo de los datos. El análisis se complementa con la obtención de indicadores estadísticos como las medidas de tendencia central, dispersión, posición y forma.

5. Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos, que involucran elementos probabilísticas, que permiten inferir conclusiones de una muestra hacia la población (opcional).

6. Elaboración de conclusiones. Se construye el informe final.

1. 5 BIBLIOGRAFIA (1) Martínez B. C., Estadística y Muestreo. 11 ed., ECOE, 2002. (2) Lind D.A., Marchall W.G, Wathen S.A. Estadística para Administración y Economía,

Decimotercera edición .Mc Graw Hill 2008 (3) Lincoln L.CH.,Estadística para las Ciencias Administativas, 3 ed. Mc. Graw Hill 1993.