1a la estadistica en la investigacion

25
Cátedra Estadística UNIDAD I LA ESTADÍSTICA EN LA INVESTIGACIÓN INTRODUCCIÓN - DEFINICIONES La concepción profana de la Estadística suele incluir la recopilación de grandes masas de datos y su presentación en cuadros y gráficos además puede incluir también el cálculo de totales, promedios, porcentajes, etc.. Esta concepción tiene unos sesenta años de retraso, estas operaciones más o menos rutinarias constituyen solamente parte incidental de la Estadística de hoy. La Estadística es la ciencia de la experimentación; el conocimiento de las Técnicas Estadísticas ayuda a tratar datos experimentales y a programar experimentos de una forma más eficiente. Describiremos la Estadística como la tecnología del método científico que proporciona instrumentos válidos para la toma de decisiones cuando prevalecen condiciones de incertidumbre. Estos instrumentos pueden ser de aplicación completamente general y útiles en cualquier campo de la ciencia: físico, biológico ó social. Sin discutir lo que se entiende por método científico, recordemos sus tres aspectos principales: - Ejecución de experimentos. - Obtención de conclusiones objetivas a partir de los experimentos. - Construcción de leyes que simplifiquen la descripción de conclusiones fundadas en amplias clases de experimentos. La Estadística Descriptiva está relacionada principalmente con los dos primeros de estos aspectos que se define: La Estadística Descriptiva se puede definir cómo los método que implican la recolección, presentación y caracterización de un conjunto de datos a fin de describir en forma apropiada las diversas características de ese conjunto de datos. Cuando la finalidad al recopilar información deja de ser una actividad solamente de descripción de la muestra y lo que se desea es estimar parámetros poblacionales en base a esos datos observados, teniendo como base la Teoría de Probabilidades, esta actividad define la Estadística Inferencial. La Estadística Inferencial se puede definir cómo los métodos que posibilitan la estimación de una característica de una población o la toma de una decisión concerniente a una población, trabajando con la información obtenida a partir de una muestra Definiciones Población estadística o universo objeto de estudio, al conjunto de todos los elementos (personas, animales o cosas) que presentan una o varias características definidas, susceptibles de ser observadas: La población queda especificada cuando se han determinado las características que la Estadística Descriptiva 1

Upload: fernanda-gomez-vasquez

Post on 21-Dec-2015

16 views

Category:

Documents


1 download

DESCRIPTION

Estadistica

TRANSCRIPT

Page 1: 1a La Estadistica en La Investigacion

Cátedra Estadística

UNIDAD I

LA ESTADÍSTICA EN LA INVESTIGACIÓN

INTRODUCCIÓN - DEFINICIONES

La concepción profana de la Estadística suele incluir la recopilación de grandes masas de datos y su presentación en cuadros y gráficos además puede incluir también el cálculo de totales, promedios, porcentajes, etc.. Esta concepción tiene unos sesenta años de retraso, estas operaciones más o menos rutinarias constituyen solamente parte incidental de la Estadística de hoy.

La Estadística es la ciencia de la experimentación; el conocimiento de las Técnicas Estadísticas ayuda a tratar datos experimentales y a programar experimentos de una forma más eficiente.

Describiremos la Estadística como la tecnología del método científico que proporciona instrumentos válidos para la toma de decisiones cuando prevalecen condiciones de incertidumbre. Estos instrumentos pueden ser de aplicación completamente general y útiles en cualquier campo de la ciencia: físico, biológico ó social.

Sin discutir lo que se entiende por método científico, recordemos sus tres aspectos principales:

- Ejecución de experimentos.

- Obtención de conclusiones objetivas a partir de los experimentos.

- Construcción de leyes que simplifiquen la descripción de conclusiones fundadas en amplias clases de experimentos.

La Estadística Descriptiva está relacionada principalmente con los dos primeros de estos aspectos que se define:

La Estadística Descriptiva se puede definir cómo los método que implican la recolección, presentación y caracterización de un conjunto de datos a fin de describir en forma apropiada las diversas características de ese conjunto de datos.

Cuando la finalidad al recopilar información deja de ser una actividad solamente de descripción de la muestra y lo que se desea es estimar parámetros poblacionales en base a esos datos observados, teniendo como base la Teoría de Probabilidades, esta actividad define la Estadística Inferencial.

La Estadística Inferencial se puede definir cómo los métodos que posibilitan la estimación de una característica de una población o la toma de una decisión concerniente a una población, trabajando con la información obtenida a partir de una muestra

Definiciones

Población estadística o universo objeto de estudio, al conjunto de todos los elementos (personas, animales o cosas) que presentan una o varias características definidas, susceptibles de ser observadas: La población queda especificada cuando se han determinado las características que la definen, quedando establecido el marco poblacional al enumerar, de ser posible, sus elementos.

Muestra a un subconjunto de elementos pertenecientes a una población, en la cual se estudian sus características; dicha muestra debe ser obtenida de forma.

Unidad Estadística es cada uno de los elementos que compone la población, por lo tanto los elementos que componen la muestra también son unidades estadísticas.

Variables es cada una de las características que se le miden u observan a cada unidad estadística.

Estadística Descriptiva 1

Page 2: 1a La Estadistica en La Investigacion

Cátedra Estadística

Dato es el valor que asume la variable en cada unidad estadística, deben ser números que pueden ser comparados, analizados e interpretados y deben estar presentados en forma ordenada y sistemática.

Parámetro es el valor que asume la variable en la población (característica de la población).

Estadístico es el valor que asume la variable en una muestra.

Modelo: es una idealización de la realidad (no es una fórmula mágica, es un instrumento). El estadístico considera la probabilidad como una idealización de la proporción de veces que se presenta un determinado resultado en las pruebas repetidas de un experimento; luego, un modelo de probabilidad es el tipo de modelo matemático elegido por él.

MUESTRA

Es evidente que el empleo de una muestra es el único medio que permite estudiar una población infinita o finita pero muy extensa. Aún en el caso de poblaciones finitas que podrían ser abarcadas en su totalidad, el uso de muestras suele tener ventajas pues no sólo economiza esfuerzos, sino que permite obtener información más detallada que la que se puede conseguir mediante un examen global de toda la población, reduce costos y tiempo. En algunos casos se hace imprescindible: aquellos en que el estudio sea destructivo, por ejemplo a los efectos de calcular el voltaje necesario para que un dispositivo eléctrico falle.

Por supuesto que no siempre se va a recomendar el uso de las muestras. En ciertos casos, la muestra tiene que ser tan grande que habrá pequeñas diferencias entre emplear un censo completo o un muestreo. Es evidente que en el caso de que la información requerida sea sobre todas las unidades individuales, ello no se puede obtener sino mediante un censo completo. Un factor que evidencia la decisión de usar o no el muestreo, es la relativa dificultad y costo en organizarlo, ya sea el muestreo o el censo completo. La cantidad de trabajo y el gasto requerido por unidad para recolectar información, es siempre mayor mediante una muestra que mediante un censo completo.

Toda recopilación de información por muestreo presenta sus propias dificultades, algunas de ellas, ajenas a los censos completos.

Los errores: afectan los resultados de una investigación por muestreo, y son esencialmente de dos tipos distintos.

errores de muestreo

otros errores: i) errores tendenciales

ii) errores accidentales

Los errores de muestreo son errores de representatividad, es decir, los que resultan de tomar una muestra en lugar de toda la población. Cualquiera sea el método de seleccionar una muestra, una estimación por muestreo de una determinada característica de la población, diferirá inevitablemente del verdadero valor poblacional. Esta diferencia entre la estimación de la muestra y el verdadero valor poblacional, se llama "error de muestreo".

Los errores tendenciales, llamados también inclinaciones, vicios, sesgos, etc., se presentan con persistencia en un determinado sentido y en magnitud aproximadamente constante de observación en observación, cuando éstas se hallan sujetas a las mismas condiciones experimentales, por ejemplo, el mismo entrevistador, el mismo cuestionario, etc..

Los errores accidentales son introducidos por una infinidad de circunstancias fortuitas, como puede ser el tiempo, la hora de entrevista, algún suceso personal que repercute en el ánimo del entrevistado, etc.

La Teoría de Muestreo busca desarrollar métodos de selección de muestras y métodos de estimación, que proporcionen el menor costo posible, y también, valores estimados que sean lo suficientemente precisos para nuestros propósitos.

Estadística Descriptiva 2

Page 3: 1a La Estadistica en La Investigacion

Cátedra Estadística

Existe una clasificación de las muestras, en dos grupos:

a) Muestras Probabilísticas: son extraídas mediante métodos de selección basados en la Teoría de Probabilidades, y son los únicos métodos que nos proveen de una medida de la precisión.

b) Muestras Dirigidas o No probabilísticas: son extraídas mediante un muestreo dirigido, pero no son recomendables pues los errores de muestreo no pueden calcularse partiendo de la muestra, sino que deben fijarse por propio discernimiento.

Un método de muestreo, si ha de ser útil, debe dar una idea precisa del grado probable de error que se tendrá al hacer una estimación a partir de una muestra.

La precisión de los resultados obtenidos de la muestra, no sólo depende del tamaño de la misma, sino también de otras partes del diseño de la muestra, como lo son: el modo en que la muestra es seleccionada, y el modo en que se realizan las estimaciones.

Una de las medidas que proporciona la magnitud del error del muestreo es el error estándar del estimador, que a la vez, da una medida de la seguridad de la estimación de la muestra.

Tamaño de la Muestra: su cálculo varía según el tipo de muestreo, dependiendo del error que se admite en las estimaciones, de la probabilidad de dicho error, de el o los parámetros a estimar y de sus variancias, y en algunos casos, del costo del muestreo.

Método de Selección de Muestras: La selección de la muestra debe realizarse de manera tal que ésta resulte representativa de toda la población. Previo a la elección del método de muestreo a utilizarse, debe tenerse una idea sobre el material del que se dispone; es decir, debe conocerse la infraestructura para poder así definir la población que se va a estudiar, y hacer posible la identificación de cada una de las unidades de muestreo. Esta información puede estar constituida por mapas, como también por listas de industrias ó de comercios con sus respectivas direcciones. La calidad y naturaleza de esta información determina en gran parte el método de selección de la muestra, como así también su costo y la fiabilidad de las estimaciones obtenidas.

Las Unidades de Muestreo pueden definirse como los elementos o partes en que se divide la población, y sobre las cuales quiere estimarse una ó varias características. La suma de todas las unidades de muestreo debe comprender el total de la población.

Debe hacerse una distinción entre unidades de muestreo y unidades de relevamiento.

- Las Unidades Estadísticas o de Muestreo son cada uno de los elementos individuales que en forma conjunta constituyen la población, sobre la que se requiere el relevamiento.

- La Unidad de Relevamiento es un conjunto de unidades estadísticas cuyo objeto es facilitar la obtención del dato.

Por ejemplo: en un censo, la unidad de relevamiento es la vivienda, y la unidad estadística es el hombre.

Muestreo de Encuestas

Los elementos de una población son las unidades de las que se busca la información; son los individuos, las unidades elementales que forman la población acerca de la cual se van a hacer inferencias; estas unidades de análisis se determinan mediante los objetivos de la encuesta.

La población es el agregado de los elementos, y los elementos son las unidades básicas que forman y definen la población. Esta debe definirse en términos de: a) el contenido; b) las unidades; c) la extensión, y d) el tiempo. Por ejemplo, en el diseño de una encuesta de las expectativas de consumidores se podría especificar: a) todas las personas; b) en unidades familiares; c) en todo un país, y d) en 1972. A menudo debe redefinirse la población deseada para obtener una población de encuesta que sea

Estadística Descriptiva 3

Page 4: 1a La Estadistica en La Investigacion

Cátedra Estadística

factible. Por ejemplo, lo anterior podría redefinirse como: a) todas las personas mayores de 18 años de edad que vivan en viviendas particulares, b) en unidades de gasto, c) en determinada región de un país, d) el 1' de enero de 1972.

Una encuesta puede dar información acerca de varias y diversas poblaciones. La misma encuesta puede abarcar contenidos diferentes. Por ejemplo, una encuesta de accidentes en el hogar puede proporcionar información acerca de accidentes aislados, personas lesionadas en accidentes, familias que han sufrido accidentes, y hogares con accidentes. Se pueden formar unidades diferentes con los mismos datos. Los datos acerca de consumidores pueden presentarse en términos de personas, unidades de gasto, familias o viviendas. Las extensiones (espacios) diferentes aparecen generalmente en forma de subclases para las que preparan a menudo los resultados de la encuesta. Las divisiones pueden ser geográficas, como para datos regionales, o pueden no serlo, como sucede en las subclases de edades u ocupaciones.

Las características de los elementos de la población se transforman en variables mediante las operaciones de medición de la encuesta. Esto nos permite hablar de muchas variables (Xi,Yi,Zi,Pi, etc.) de un mismo elemento. Podemos considerar también las relaciones entre las variables de un elemento, los cambios de variables y la exactitud de las mediciones de las variables. Una estadística basada en las variables encontradas en una muestra es una variable aleatoria.

Una misma encuesta puede usar diferentes clases de unidades de muestreo, y en muestreo polietápico se usa una jerarquía de unidades de muestreo o conglomerados, de manera que el elemento pertenezca únicamente a una unidad de muestreo en cada etapa. Por ejemplo, una muestra de los habitantes de un Estado puede tomarse al seleccionar sucesivamente los municipios, las localidades, los segmentos, las viviendas y, finalmente, las personas. La población es también un agregado de las unidades de muestreo especificadas para cada etapa. Las unidades de listado (listados) se usan para identificar y seleccionar unidades de muestreo a partir de listas. Los problemas pueden ser serios si los elementos no se identifican unívocamente con los listados. Por ejemplo, una muestra de familias tomada de listados de teléfonos puede involucrar serias dificultades.

La investigación empírica puede hacerse de diferentes maneras: por medio de observaciones casuales, de observaciones controladas, de experimentos o de encuestas. Aquí se tratará el muestreo de encuestas. La investigación por medio de encuestas tiene por objetivo estimar valores específicos de la población. Un valor de la población es una expresión numérica que sintetiza los valores de una o varias características de los N elementos de una población completa; es una medida resumida de una cualidad de la distribución de la variable o variables en la población definida.

El valor de la muestra, o estadística, es una estimación que se calcula a partir de los n elementos en la muestra. La media de los elementos de la muestra es una variable aleatoria, que depende del diseño de la muestra y de la combinación particular de los elementos que resultaron seleccionados. Por tanto, la estimación que se hace es solamente una de las que pudieron haberse obtenido con el mismo diseño de muestra. Por el contrario, el valor de la población depende de los N valores en dicha población. Es una constante independiente de las fluctuaciones de la selección, aunque por lo general se desconozca.

Procedimientos de selección de elementos

Se puede considerar como muestra cualquier censo del 100% por dos razones. Según el grado en que esté sujeto a errores de observación, el valor de la población obtenido de un censo es solamente uno de los muchos que pudieran haber resultado de realizar esencialmente las mismas operaciones.

Estadística Descriptiva 4

Page 5: 1a La Estadistica en La Investigacion

Cátedra Estadística

Muestreo de encuestas, o el muestreo de población, estudia los métodos para seleccionar y observar una parte (muestra) de la población con el fin de hacer inferencias acerca de toda la población. Una muestra puede tener varias ventajas sobre un censo completo: a) economía; b) rapidez y oportunidad; c) posibilidad de hacerse (si la observación es destructiva, el empleo de un censo no es práctico); d) calidad y precisión (en algunas situaciones no hay dinero suficiente para pagar el personal adiestrado y los supervisores necesarios para realizar un buen censo, o aun para obtener una muestra grande).

Por otra parte, los censos completos poseen ventajas especiales en algunas situaciones: a) se pueden obtener datos para unidades pequeñas; b) la aceptación pública es más fácil de alcanzar para datos completos; c) la colaboración y la respuesta del público se pueden obtener más fácilmente; d) el sesgo de cobertura puede ser más fácil de evaluar y de reducir; e) no se requieren estadísticos expertos en muestreo.

Un campo importante del muestreo que está más allá del alcance del muestreo de encuestas es el del control de calidad. Éste trata del muestreo de aceptación mediante inspección de lotes; esto es consiste en tomar una muestra de cada lote para juzgar si concuerda con la calidad para todo el universo. Para ello, se hace uso frecuente del muestreo secuencial, en donde el tamaño de la muestra depende de los resultados de selecciones sucesivas. Pero, en general, los procedimientos de recolección procesamiento y análisis de las encuestas son largos y complicados poco aptos para ser utilizados en muestreo secuencial.

El muestreo de encuestas se concentra en el estudio de muestras probabilísticas para estimar valores de la población.

Frecuentemente hacemos inferencias acerca de poblaciones de muestras informales y arbitrarias: juzgamos una canasta de uvas probando una de ellas- un comprador acepta un envío después de inspeccionar unos cuantos artículos que escoge casualmente. Hay mucha investigación en las ciencias físicas y biológicas que se basa en elementos seleccionados de una manera casual. Los investigadores suponen, vaga e implícitamente, que se han seleccionado elementos típicos. Esperan que las características importantes se distribuyan uniforme o aleatoriamente en la población. Estos son ejemplos simples de muestreo, que se basa en suposiciones muy amplias acerca de la distribución de las variables de la encuesta de la población.

Se pueden distinguir varias formas de muestreo.

MUESTREO PROBABILÍSTICO Y MUESTREO NO PROBABILÍSTICO

El muestreo probabilístico se caracteriza porque cada elemento de la población tiene una probabilidad conocida y no nula de ser seleccionada. La selección se hace por un proceso de aleatorización y el valor de la probabilidad se determina de acuerdo a la naturaleza del diseño muestral.

Se llama muestreo no probabilístico a cualquier método de muestreo en que la oportunidad de escoger un elemento determinado de la población es desconocida, independientemente de que existan o no otras especificaciones.

Muestreo No Probabilístico

Muestras Casuales o Fortuitas:

Los elementos de estas muestras son elegidos simplemente porque son accesibles, pueden ser sujetos voluntarios o porque son personas que saben expresarse, etc. Son ejemplos ilustrativos la entrevista al "hombre de la calle", los elementos que les llega a la mano para sacar conclusiones en medicina, arqueología e historia. La

Estadística Descriptiva 5

Page 6: 1a La Estadistica en La Investigacion

Cátedra Estadística

astronomía, la física experimental, y la química son las principales ciencias que tienen muy poco cuidado acerca de la representabilidad de sus especimenes.

Selección Experta o Muestreo a Juicio:

La selección experta es una forma de muestreo no aleatorio o muestreo de juicio utilizada por los expertos para seleccionar especimenes, unidades, o porciones, representativas o típicas. Por ejemplo, consideremos el muestreo de juicio de individuos representativos, o especimenes para experimentos; o la práctica de contabilidad de seleccionar semanas típicas para una auditoria ; o la práctica común de seleccionar una ciudad o villa típicas para representar una población nacional, urbana o rural. A menudo sucede que los expertos tienen diferentes puntos de vista acerca de la mejor manera de seleccionar especimenes representativos, o para decidir cuáles son las unidades más representativas.

Muestreo por Cuotas:

El muestreo de cuota es una forma de muestreo no aleatorio ampliamente utilizado en encuestas de opinión, de mercado y otras semejantes. Los enumeradores reciben la instrucción de obtener cuotas especificadas a partir de las cuales se construye una muestra relativamente proporcional a la población, con respecto a unas cuantas variables demográficas. Dentro de las cuotas, se supone que los enumeradores obtienen individuos representativos. La naturaleza de los controles y de las instrucciones dependen del juicio experto de la persona que practica este tipo de muestreo.

Muestreo poblaciones móviles:

El muestreo de poblaciones móviles suele depender de métodos de captura-marca-recaptura. La población total se estima de la proporción de los individuos en la recaptura (insectos, peces, venados ), que han sido capturados previamente y marcados. Hay modelos teóricos ingeniosos que se utilizan para expresar en forma explícita las suposiciones del método.

Estos tipos diferentes de muestreo de modelos varían muy ampliamente en grado y área de justificación. Sin embargo, tienen en común gran dependencia en la validez de suposiciones muy amplias acerca de las distribuciones de las variables de encuesta en la población. Por lo contrario, a partir de los resultados de un muestreo probabilístico ideal, pueden hacerse las inferencias a la población enteramente por métodos estadísticos, sin suposiciones acerca de las distribuciones de la población. Se evita la necesidad de suposiciones de aleatorización de la población al introducir la aleatorización en el procedimiento de selección. En forma semejante, al jugar a las cartas y en las loterías, en lugar de confiar en el juicio del que da las cartas para obtener una distribución justa insistimos en que se barajen abierta y cabalmente las cartas, y en que las fichas de la lotería se mezclen de la misma manera.

Muestreo Probabilístico

En el muestreo probabilístico, cada elemento de la población tiene una probabilidad conocida y no nula de ser seleccionado; esto implica conocer el tamaño de la población.

Las propiedades deseadas e idealizadas de las muestras probabilísticas solamente pueden realizarse en forma aproximada, puesto que se introducen muchas imperfecciones en la ejecución real de muestras prácticas.

Estadística Descriptiva 6

Page 7: 1a La Estadistica en La Investigacion

Cátedra Estadística

Por tanto, en la inferencia de valores de la muestra a valores de la población también intervienen suposiciones acerca de los posibles efectos de las imperfecciones; pero a menudo podemos investigar, reducir con éxito y poner algunos límites a los efectos posibles o probables de las imperfecciones. Por tanto, es útil y se justifica utilizar los muestreos probabilísticos ya que poseen ventajas con respecto a los no probabilísticos.

Muestreo Aleatorio Simple

Es el método más sencillo de selección de los elementos de una población y es el que más se utiliza. La selección aleatoria simple de una población se efectúa en forma tal que cada muestra posible de un tamaño dado tiene la misma probabilidad de selec-ción. Es decir que todos los elementos que componen la población tienen igual probabilidad .

Muestro Estratificado

Si en el momento de construir el marco muestral se cuenta con alguna información adicional sobre alguna variable en particular de la población que se relaciona con el objeto de estudio, se puede usar esa información, para reducir el error de muestreo a través de la estratificación.

El muestreo estratificado consiste en agrupar los elementos de la población de acuerdo a su semejanza con respecto a las variables a investigar. Luego se extrae una muestra aleatoria de cada estrato.

Es muy importante la definición de los estratos cuando se conoce, según la definición de nuestro objeto de estudio, una variable o variables que separan a los elementos de la población en conjuntos homogéneos bajo esa variable. Es decir que el comportamiento de la variable en los elementos del estrato es homogénea y entre los estratos es heterogénea.

Muestreo Sistemático

Para escoger una muestra sistemática, el primer paso es determinar el número total de componentes del universo. Divídase esta cifra por el tamaño de muestra deseado resultando así el intervalo de muestreo. Después selecciónese un número al azar entre 1 y la cifra del intervalo del muestreo. Esto identifica el primer elemento en la lista que incluirá la muestra. Añádase a este número el intervalo del muestreo. El resultado identifica al segundo elemento que será incluido en la muestra. Y así sucesiva-mente hasta completar el tamaño de la muestra.

Una dificultad básica puede surgir en el muestreo sistemático cuando la lista del universo contiene "periodicidades ocultas". Un ejemplo : supongamos que el problema es sacar una muestra de una lista de cien establecimientos de comestibles consistentes en veinte cadenas y ochenta independientes. La lista de tiendas es confeccionada de la siguiente manera:

I,I,I,I,C,I,I,I,I,C. . . . . . . . . . I,I,I,I,C.

I denota una tienda independiente y C denota una tienda de la cadena. Ha de hacerse un muestreo sistemático de una de cada cinco tiendas.

Con un procedimiento de muestreo sistemático, se obtendría bien la totalidad de la muestra en tiendas independientes (cuatro veces de cada cinco) o la totalidad en tiendas en cadena (una vez de cada cinco). Debido a que la lista contiene una periodicidad igual a un múltiplo del intervalo de muestreo (uno en cinco),ese procedimiento de muestreo daría un intervalo de muestreo fuera de 1 en 10,1 en 20, o en cualquier otro múltiplo de cinco, la dificultad seguiría persistiendo.

Una variación del muestreo sistemático que podría utilizarse cuando existe algún ordenamiento periódico en la población consiste en aplicar, dentro de cada intervalo de muestreo, un número al azar distinto.

Estadística Descriptiva 7

Page 8: 1a La Estadistica en La Investigacion

Cátedra Estadística

Muestreo por Conglomerados

Cuando la selección individual de elementos es demasiado costosa, se facilitan las tareas de la encuesta si se seleccionan conglomerados, es decir, mediante el muestreo de unidades que contienen varios elementos; por ejemplo, los empleados de una empresa pueden seleccionarse por grupos de trabajo, los estudiantes de una escuela por clases designadas, o las viviendas de una ciudad por manzanas. El muestreo de conglomerados difiere del muestreo de elementos, en donde los elementos constituyen unidades de muestreo, de manera que cada unidad contiene sólo un elemento simple.

El experto debe investigar el marco y, si es necesario, diseñar procedimientos para evitar la confusión en dicha identificación. Lo que constituye un conglomerado aceptable es asunto que depende de las condiciones prácticas, que a su vez dependen de la situación de la encuesta y de los recursos disponibles. Los elementos individuales se determinan por los objetivos de la encuesta. El experto en muestreo, entonces, debe decidir si puede utilizarlas como unidades únicas de muestreo, o si debe definir conglomerados de los elementos específicos como unidades de muestreo. En algunos estudios, se considera la vivienda como un conglomerado de personas; pero en otros estudios, pueden utilizarse como elementos ciudades enteras. La población de los Estados Unidos se puede considerar alternativamente como un conglomerado de unidades que son municipios (condados) completos; o de ciudades, pueblos y congregaciones; o de segmentos de áreas y manzanas; o de viviendas; o por último de personas individuales. Las unidades adecuadas de muestreo se definen para que se conformen a las necesidades de un diseño de muestreo práctico y económico, aplicado a la distribución física de la población, y a su marco de selección. Al escoger conglomerados, se reconocen en el diseño del muestreo algunas características de la distribución física de la población y de la naturaleza del marco.

El número de elementos de un conglomerado se llama tamaño del conglomerado. Los conglomerados son, en la mayoría de las poblaciones, de tamaño desigual; por ejemplo, las viviendas en manzanas, las personas en viviendas, los empleados en secciones, etc. Los conglomerados de igual tamaño se presentan raras veces en diseño de muestreo, pero constituyen una introducción sencilla a la teoría del muestreo de conglomerados.

En el muestreo por conglomerados se trabaja con grupos de elementos (unidades de muestreo) que son heterogéneos respecto de una variable específica definida en el estudio, pero entre los conglomerados la variable se comporta en forma homogénea

Muestreo de áreas

El muestreo por áreas es un procedimiento práctico de listado que proporciona buenos marcos para seleccionar viviendas. Las viviendas sirven de unidades muestrales de personas, familias o de otras poblaciones que también se asocien con las viviendas, como son los perros, las heladeras o jardines. El muestreo por áreas también se emplea para seleccionar muchas clases de muestras además de las de viviendas: tiendas, gran-jas, cosechas y flora; también la fauna, aunque por su movilidad agrega nuevas compli -caciones. El muestreo por áreas constituye un marco conveniente y efectivo para las vi -viendas y las personas, esto se debe a varias razones, a) El empleo de mapas permite identificar claramente a toda la población de viviendas (elementos) con una lista defini -da de manzanas y segmentos (conglomerados).b) Esta identificación posee permanencia, durante el periodo de encuesta a partir del momento del listado, c) El trabajador de campo puede identificar con rapidez y claridad las fronteras de manzanas y segmentos, y a las viviendas dentro de ellos, d) La vivienda sirve de medio conveniente para el muestreo de personas, puesto que se identifica con facilidad, es relativamente estable, suele contener pocas personas, y se puede identifi -car, de manera única, a toda persona con una sola vivienda. En consecuencia, la vivien -da sirve de unidad de muestreo única e identificable para un conglomerado pequeño de personas, y de otras poblaciones que puedan asociarse fácilmente con las viviendas.

Estadística Descriptiva 8

Page 9: 1a La Estadistica en La Investigacion

Cátedra Estadística

Las características del modelo que son deseables están sometidas a imperfeccio-nes y excepciones enfadosas que pueden conducir a sesgos de selección. Hace falta te-ner buenas instrucciones para reducirlas a proporciones manipulables, y el investigador debe buscar las mejores soluciones prácticas dentro de los recursos de que disponga

Muestreo en dos etapas

El muestreo en dos etapas o submuestreo consiste en dividir a la población que se quiere estudiar en un cierto número de estratos, llamados en este caso: unidades primarias, las cuales contienen a su vez, un determinado número de elementos, llamados unidades secundarias. De ésas unidades primarias, sólo algunas se eligen para incluirlas en la muestra, de las cuales se toma una muestra de unidades secundarias. De esta manera, la selección de la muestra final comprende dos operaciones:

a) Selección de una muestra de unidades primarias.

b) Selección de una muestra de unidades secundarias, dentro de esas unidades primarias.

Estos planes de muestreo (en dos etapas) se usan generalmente para reducir los costos.

ETAPAS OPERATIVAS DE LA INVESTIGACIÓN ESTADÍSTICA

La estadística se encuentra íntimamente relacionada el método científico, motivo por el cual es indispensable poner de relevancia ciertas consideraciones acerca del método para después poder explicitar la metodología estadística. No existe un modelo único de método científico. La diversidad de métodos proviene también de que en el pasado se planteaban problemas cuyas características lógicas actualmente son muy diferentes, requiriéndose entonces métodos diversos. Este problema se manifiesta en el caso de las investigaciones sociales, tanto cuando se trata de estudios que proponen explicar mutaciones cualitativas cono en aquellos que analizan cambios cuantitativos. El tipo de método no sólo depende de los gustos personales del investigador, sino también de las cuestiones que se plantea. Vale decir, que un mismo problema puede ser abordado de diferentes modos por dos o más investigadores o por un mismo investigador.

Pese al uso de distintos métodos según las distintas situaciones, existen aspectos generales que son comunes a todas las ciencias, y destacamos los puntos en que interviene la estadística metódicamente, mediante un conjunto de etapas que deben cumplirse en forma ordenada y precisa. Estos aspectos comunes son los siguientes:

- La realización de experimentos e investigaciones.

- La obtención de conclusiones objetivas y generalizaciones de las mismas a partir de la realización de los experimentos e investigaciones.

- La construcción de leyes que simplifiquen la descripción de esas conclusiones para ampliar las distintas clases de experimentos.

A la Estadística le interesan los dos primeros puntos mencionados. e interviene mediante el seguimiento ordenado de varias fases. Antes de seguir avanzando, siguiendo a Blalock, señalemos que: "UN ANÁLISIS ESTADÍSTICO, POR MUY ELABORADO QUE SEA, RARAMENTE O NUNCA LLEGARA A COMPENSAR LA FALLAS DE UN PROYECTO MAL CONCEBIDO O DE UN INSTRUMENTO DE RECOLECCIÓN DE DATOS DEFICIENTES".

Sin pretender dar un esquema rígido, podemos considerar las siguientes etapas metodológicas:

1- Formulación o definición del problema: La investigación estadística comienza planteándose el objeto a investigar. Una vez que conoce el objeto de la investigación, debe formular el problema en la forma más precisa y completa posible para poder

Estadística Descriptiva 9

Page 10: 1a La Estadistica en La Investigacion

Cátedra Estadística

determinar cuáles serán los datos más relevantes y necesarios para la puesta en marcha de la investigación. Esta formulación puede hacerse a priori, en cuyo caso deberá estar claramente enunciada y se podrá pasar directamente a la etapa siguiente. Si se falla en este análisis previo es posible que se utilicen datos totalmente innecesarios que no hagan a la investigación, y se omitan o dejen de lado otros relevantes de importancia básica.

Como cualquier otro proceso de elaboración, además del aspecto operativo, es necesario saber con que materia prima se trabajará, que equivaldría en el tema que nos ocupa, a definir que datos deben obtenerse a partir de las conclusiones estadísticas dependerán básicamente de los datos, los que a su vez dependen de la precisión en la formulación del objeto en estudio.

2- Diseño del experimento: Formulado o definido el problema con precisión, pasamos a esta segunda etapa que hace a la decisión sobre los aspectos de la investigación que se refieren al experimento en sí.

La decisión tendrá que tomarse en primer lugar respecto a si se va a estudiar toda la población, en cuyo caso deberá hacerse una enumeración completa o censo; o bien estudiar una parte representativa de esa población, para lo que se usará una muestra.

En el caso de censo o relevamiento de la población total, no realizaremos ninguna discriminación; este procedimiento es el que nos proporciona una información completa y confiable, pero también resulta más oneroso ya que se necesita mayor cantidad de personas y material.

En el caso del muestreo o elección de una parte de la población total, la confiabilidad es menor, pero es menos costoso y podemos incluir mayor cantidad de datos.

¿Cuál es la razón por la que el investigador social utiliza muestras? Además de las que hemos mencionado, el investigador frecuentemente se encuentra en la situación de disponer de gran cantidad de datos, resultándole imposible absorberlos a todos, y tampoco puede comprender intuitivamente lo que los datos contienen. En este caso se debe entonces resumir, y lo hace empleando medidas de cálculo que le permiten sustituir la masa total de información por algunas pocas cantidades. Al reducir, deben indicarse claramente las limitaciones a las que queda sujeta la información reducida.

En esta situación lo que se busca es tratar de hacer una inferencia sobre la base de la información proporcionada por la muestra acerca de la población de la que se ha extraído la misma. Luego, obtener una muestra representativa es fundamental en Teoría Estadística; ello supone preguntas como estas:

* ¿Qué tipo de datos se van a recopilar? ¿Cuáles variables permiten trabajar operativamente el problema?

* ¿Cómo se obtendrá la información?

* ¿De qué tamaño debe ser la muestra?

* ¿Qué método de selección de muestra va a aplicarse?

Estas preguntas son resueltas por lo que se conoce como Diseño de Muestras o Diseño de Experimentos. El riesgo que se corre de no cumplimentar correctamente esta etapa, es que no se llegue a ninguna conclusión válida en la investigación encarada.

En el caso de que sea necesario reunir información procedente de personas, la confección del cuestionario también constituye una parte importante del diseño experimental.

Finalmente corresponde a esta etapa la elaboración del Plan Tabulatorio, en directa relación con las hipótesis establecidas en al etapa anterior.

Resumiendo, la importancia fundamental del Diseño Experimental radica en que provee las pautas generales que dirigirán la realización del experimento eliminando y

Estadística Descriptiva 10

Page 11: 1a La Estadistica en La Investigacion

Cátedra Estadística

disminuyendo al menor grado posible los efectos extraños que no hacen a la investigación en sí, y posibilita la utilización de técnicas para analizar los resultados de modo tal que no se vean mezclados los efectos de los factores en estudio con los de aquellos factores que no interesan a la investigación.

Además esta es una etapa decisiva porque es la que asegura que experimento cumpla con la condición de aleatoriedad siendo esta la clase de experimentos propios de la Estadística, ya que permitan hacer inferencias.

3 -Recopilación de la información: Esta etapa es costosa y rutinaria, en su desarrollo y estudio se debe emplear generalmente mucho tiempo y personal auxiliar.

Consiste en recopilar o recoger aquella información que se adecua al problema que nos interesa, respetando los límites que hemos impuesto en las etapas anteriores.

Algunas veces el estudioso se servirá de datos disponibles dentro del medio en que estudia. En otras ocasiones, la recopilación la efectuarán de materiales publicados, ya sean periódicos, semanarios económicos, revistas especializadas, publicaciones estadísticas oficiales o privadas, etc. En estos casos la recopilación no involucra grandes costos ni emplea gran cantidad de tiempo, pero por lo general nos encontramos con que el problema no es tan simple, ya que se necesita una información que no nos es fácil encontrar, en las formas antes mencionadas, debiendo recoger los datos estadísticos de la fuente primaria que los origina.

De este modo se puede decir que los datos se recogen de distintas fuentes:

Fuente Directa: cuando los datos son obtenidos directamente por el investigador que realiza el relevamiento estadístico. Tema que más adelante se explicitará.

Fuente Indirecta: cuando nos valemos de estudios realizados por otros, ya sean estudios particulares o de organismos oficiales, pudiendo estar publicados o no.

La fuente indirecta podrá ser a su vez: Fuente Primaria, cuando existe una sola fuente, vale decir, que los datos provienen de un sólo recopilador o estudio anterior, que fue el que originalmente los recogió. Y Fuente Secundaria, cuando los datos han sufrido una reimpresión realizada por un organismo ajeno al recopilador primigenio .

Al llegar a este punto, es necesario aclarar que la fuente primaria es más confiable que la secundaria, generalmente está exceptuada de errores propios de la trascripción , las fuentes primarias no omiten información explicitada referente a términos, unidades, métodos utilizados, etc. Al ofrecer más detalle no omite categorías.

Las fuentes en general deben proporcionar dos elementos de gran importancia:

- Seguridad del dato: o sea que debe ser preciso y confiable , debe utilizarse un método de muestreo que proporcione una muestra representativa, la recopilación usará métodos imparciales, tabulación correcta, etc.

- Las fuentes deberán ser susceptibles de comparación, para ello deberán usar las mismas definiciones e igual método de cálculos.

Recabar información de primera mano (fuente directa) es una de las tareas importantes con que tiene que enfrentarse el estadístico. Aunque no se vean en la necesidad de recurrir a la fuente directa para obtener un dato original, sino que lo obtengan de fuentes ya existentes, el conocimiento del procedimiento a seguir en estos casos, será útil para hacer un uso inteligente de la información estadística disponible.

Hay dos métodos de Relevamiento Estadístico:

Relevamiento dinámico: se refiere a los datos obtenidos en operaciones que se realizan en forma continuada a través del tiempo y de modo sistemático ininterrumpidamente. Podrían ser Registros Permanentes como el Registro Civil, la información se proporciona a la autoridad competente cuando ocurre el hecho. La información también puede ser interna o sea registros que lleva el mismo organismo

Estadística Descriptiva 11

Page 12: 1a La Estadistica en La Investigacion

Cátedra Estadística

que hace el estudio. O tratarse de muestreos por ejemplo de una línea de producción llamados registro secuencial.

Relevamiento estático: El procedimiento puede describirse en las siguientes etapas:

- Elaboración de un plan general, que incluye ver lo que han hecho otras personas, reflexionar sobre aspectos generales de lo que se desearía saber, determinar el marco de la población, determinar el lugar donde se realizará la entrevista, ó si se enviará el cuestionario por correo, ver el aspecto legal, etc.

- Formulación de preguntas y redacción del cuestionario: hay que considerar que no pueden incluirse todas las preguntas que quisiéramos obtener respuestas. Una vez seleccionados los puntos que se incluirán, se formularán las preguntas de modo que puedan ser contestadas con rapidez y exactitud.

En gran medida, el éxito de una investigación depende de la eficiencia del cuestionario elaborado para la obtención de datos. Los factores que hay que tener en cuenta en la preparación de un cuestionario son numerosos. Puesto que la claridad del cuestionario es un requisito esencial, habrán de tenerse en cuenta algunas consideraciones para que las preguntas puedan ser respondidas con rapidez y exactitud.

* No fiarse de la memoria del entrevistado: las preguntas deben limitarse al pasado inmediato, ayudando al entrevistado a retroceder paso a paso en el tiempo, recordando la información que interesa.

* No hacer preguntas que obliguen al entrevistado a hacer cálculos. Es necesario concretar la pregunta para obtener contestaciones más exactas con mayor facilidad.

* Evitar preguntas embarazosas ó formularlas de manera que se logre la respuesta en forma indirecta.

* No hacer preguntas que impliquen la respuesta.

* Insertar un conjunto de posibles respuestas entre las que pueda elegir la que más concuerde con su opinión, para los casos en que la pregunta no pueda ser contestada con exactitud.

* Incluir preguntas que puedan complementarse, de forma tal que el “si” o “no” de primera pregunta excluya ó requiera las siguientes.

* Incluir preguntas control, para controlar la veracidad de las respuestas.

* Evitar preguntas abiertas, porque dan lugar a una gran cantidad situaciones.

* Ordenar las preguntas del cuestionario siguiendo la secuencia lógica del pensamiento.

* No confeccionar cuestionarios extensos: es preferible tener poca información de buena calidad y no mucha de calidad poco satisfactoria.

* Tener cuidado con la mala redacción.

Antes de realizar el trabajo de campo, deben realizarse pruebas del cuestionario sobre un número limitado de personas de diferente condición económica y cultural. Esta prueba permite descubrir los defectos, eliminar los equívocos y ambigüedades, escoger la oportuna formulación de las preguntas según los objetivos de la entrevista.

Se hará uso del cuestionario mediante la entrevista personal en la que intervienen: los entrevistadores, de quienes depende en gran parte el éxito de una investigación. Para llegar a ser un buen entrevistador se requieren largos períodos de práctica, cursos especiales de adiestramiento e instrucciones precisas: existen , manuales para los entrevistadores e instrucciones para llegar al cuestionario; respecto a la elección de los entrevistadores se exigen requisitos como : cultura, personalidad, facultad de adaptación, honestidad, memoria, precisión, mentalidad investigadora, cordialidad, etc. También intervienen los supervisores, quienes controlan el trabajo de

Estadística Descriptiva 12

Page 13: 1a La Estadistica en La Investigacion

Cátedra Estadística

los entrevistadores y el cuestionario en sí; y el entrevistado, quien responde al cuestionario, y es quien constituye la Unidad Estadística.

4 - Organización de la Información: Esta etapa consiste en la ordenación sistemática y adecuada de todos los datos que fueron recopilados.

En algunas ocasiones los datos necesitan ser corregidos de acuerdo a las necesidades de la investigación. Los datos pueden haberse extraído de publicaciones internas o externas, y en éstos casos la corrección de los mismos no demandará gran cantidad de tiempo, ni dará lugar a grandes incomodidades; pero cuando hayan provenido de una encuesta pueden surgir diversas situaciones provenientes del modo en que se originaron.

Según Stephen P.Shao, el recopilador tendrá que realizar algunas de estas tareas:

- Solucionar el problema de la inconsistencia de los datos.

- Tratar de solucionar aquellos problemas surgidos como consecuencia de una escritura pobre

- Tratar de que todas las preguntas sean contestadas o, de lo contrario, consignarlas como falta de interrogación al sujeto a quien fueron dirigidas.

- Establecer cálculos precisos de las cifras proporcionadas por el informante.

Efectuada la depuración, se inicia el trabajo de escritorio con el objeto de realizar la elaboración. La Codificación consiste en la asignación de un número a cada respuesta, número que corresponde a una clave cuidadosamente preparada. Este código sirve de base a la tabulación mecánica, y puede prepararse previamente a la realización del trabajo de campo, cuando se confecciona el cuestionario.

Se dan casos en que la respuesta no necesita codificarse.

Decididas las clasificaciones adecuadas, se compilan los datos de acuerdo al Plan de Tabulaciones.

5- Presentación de datos estadísticos: Una vez que hemos recopilado y organizado el conjunto de datos estadísticos, debemos presentarlos como el resultado obtenido de nuestra tarea. Muchos lectores tienen tendencia a no leer en un informe escrito las cifras estadísticas que se señalan; una forma de evitar esto, es presentando las mismas en cuadros estadísticos sencillos y claros, o gráficos simples y atractivos, o sea, recurriendo a alguna forma de presentar los datos de modo que cumplan con su objetivo (descripción cuantitativa de un fenómeno).

Las formas en que se pueden presentar los datos estadísticos son:

- Párrafos de textos

- Cuadros estadísticos

- Gráficos estadísticos.

Analizaremos estos métodos de presentación de la información recopilada y organizada previamente.

Párrafos de textos: Consiste en la explicación escrita de la información. Sólo es recomendable cuando se trabaja con pocas cifras o ítems. En cambio, cuando se trabaja con un conjunto numeroso de datos, ésta forma de presentación es poco clara e ineficiente, debiendo recurrirse a otros métodos. Tiene ciertas ventajas, como la de poder expresar con palabras la importancia de ciertas cantidades, así como la de efectuar y destacar comparaciones que se crean necesarias hacer.

Cuadros estadísticos: Este método suele usarse con mayor frecuencia que el anterior. Consiste en el arreglo sistemático de las cifras de una matriz identificando filas y columnas, o sea, utilizando una tabla de doble entrada. Para su construcción existen ciertas normas básicas que permiten que el cuadro cumpla con su objetivo que es presentar la información ordenadamente, facilitando su interpretación y análisis.

Estadística Descriptiva 13

Page 14: 1a La Estadistica en La Investigacion

Cátedra Estadística

De acuerdo con el propósito para el que se construyen los cuadros estadísticos, pueden clasificarse en:

a) Cuadros generales o de referencia: son los usados como fuente de información, no tienen un propósito determinado sino que simplemente proporciona información detallada. Es el tipo de cuadro que presentan las publicaciones de organismos generalmente gubernamentales, que recogen información primaria.

b) Cuadros de texto o de resumen: Son aquellos que tienen un propósito específico: generalmente son de menor tamaño respecto a los anteriores, son breves y claros y van acompañados de algún texto correspondiente a una investigación particular; incluyen datos relacionados entre sí y eventualmente algún tipo de elaboración propia del autor.

Puede darse la siguiente clasificación general de las partes principales de un cuadro: Título, Encabezados, Columna Matriz o Conceptos, Cuerpo, Fuente de Información y Notas de Introducción y al Pie. Todas ellas son importantes y contribuyen conjuntamente a que el cuadro que se presente sea claro, preciso y de fácil interpretación. Brevemente expondremos qué significan y cómo se confeccionan cada una de ellas:

Títulos: debe ir en la parte superior del cuadro y expresar en forma clara y precisa el contenido (datos) del cuadro, para lo cual resulta útil tener en cuanta , al redactarlo, las siguientes cuestiones: ¿Qué? datos se están presentando, ¿Dónde? o sea qué área geográfica corresponden esos datos, ¿Cómo? están clasificados los datos y por último ¿Cuándo? O sea, a qué período (meses, años, etc.) corresponde la información.

Encabezados: son los títulos que corresponden a cada columna componente del cuadro y se colocan en la parte superior de las mismas. El primer encabezado corresponde a la columna matriz o concepto, los siguientes corresponden a las columnas de datos. En algunos casos se presentan encabezados y subencabezados.

Columna Matriz o Conceptos: Es la primer columna que se presenta en un cuadro, en la cual se colocan los conceptos que identifican cada fila de un cuadro; estos conceptos corresponden a una determinada clasificación cuya naturaleza se señala en el encabezado correspondiente a esta columna. Es posible, si se presenta la necesidad, dividir cada concepto en subconceptos.

Cuerpo: Es la parte del cuadro en la que se presenta el conjunto de datos estadísticos, cuyo arreglo en filas y columnas se hará de acuerdo a las clasificaciones que se presentan en la Columna Matriz y en los Encabezados .

Fuente: es el lugar de donde se obtuvo la información y se indica al pie del cuadro. Si los datos fueron recopilados por el mismo investigador se colocará “elaboración propia ¨, en caso que los datos fueron proporcionados por otro organismo o equipos de trabajo o se obtuvieron de publicaciones deberá colocarse el origen de los mismos, indicando autor, nombre de la institución, título de la publicación, número de serie, volumen, página, edición, editorial fecha de publicación, etc., según corresponda. Puede ocurrir que sea necesario indicar más de una fuente. Si se desconoce el origen de la información, se colocará: Fuente: “Desconocida”. Si la información se obtuvo directamente (personalmente) se colocará: Fuente: “Elaboración Propia”, pero en ningún caso debe faltar esta parte del cuadro.

La indicación correcta de la fuente de información de un cuadro permitirá al lector evaluar la confiabilidad de las cifras presentadas, y obtener información adicional en la fuente original, si así lo deseara.

Notas de Introducción: son las que tienen por objeto aclarar ciertos aspectos generales, relativos a todo el cuadro, que no han sido señalados en el título; por ejemplo: la unidad de medida correspondiente a los datos presentados en el cuadro. Generalmente se colocan entre paréntesis o con letras de menor tamaño que las utilizadas para el título.

Estadística Descriptiva 14

Page 15: 1a La Estadistica en La Investigacion

Cátedra Estadística

Notas al pie: van debajo del cuerpo del cuadro y antes que la fuente; en ellas se consignarán explicaciones relativas a algún dato particular, o a alguna fila o columna en especial.

Es necesario tener en cuenta ciertas normas básicas para las construcciones de cuadros. Recopilada y organizada la información que se desea presentar, será posible determinara el propósito de una tabla, estructurando la misma teniendo en cuenta sus partes componentes. Señalaremos algunos aspectos que hacen a la real utilidad del cuadro:

- Tener las cifras ordenadas en columnas y filas facilita las comparaciones entre sí. Sin embargo , debe tenerse en cuenta que es más fácil comparar cifras ubicadas en columnas que en filas, y que las comparaciones entre columnas adyacentes es más factible de hacer que entre columnas separadas, esto último debe tenerse presente sobre todo cuando existen subencabezados.

- Si hay cifras que por alguna razón deben destacarse del resto de la información, deberán colocarse en aquéllas posiciones de la tabla adecuadas para tal fin. Como nuestros hábitos hacen que se lea de izquierda a derecha y de arriba hacia abajo, resulta que las posiciones de mayor énfasis serán para los encabezados de la izquierda (columna adyacente a la columna matriz) y de la fila superior. Por lo tanto, los Totales irán en la primera o última fila (o columna) según se quiera o no resaltar sus cifras.

- Tanto en la Columna Matriz como en los Encabezados, teniendo en cuenta la naturaleza de los datos estadísticos que se presentan, es posible ordenar las clasificaciones de acuerdo a dos arreglos: alfabético o por magnitud. Las clasificaciones posibles son: cronológica, geográfica, cualitativa y cuantitativa y la elección de una u otra será de forma tal que facilite el análisis y las comparaciones por parte del lector.

- Cuando es necesario presentar la información en valor relativo utilizando porcentajes, debe indicarse: relativo a qué es el porcentaje (si respecto del total, se de aumento, si e disminución, etc.) y a qué cifra le corresponde el 100%.

- Si la precisión que presentan las cifras es innecesaria a los fines del cuadro, deberán ser redondeadas siguiendo el método tradicional: si la última cifra significativa es mayor que 5, se la elimina y se agrega una unidad a la cifra anterior; en caso contrario, simplemente se la elimina. Incluso, si éstas cifras son números grandes, puede llevarse el dato a miles o millones, en cuyo caso deberá indicarse, dicha unidad utilizada, en las notas de encabezamiento (o introducción) o en las de pie.

- Si algún dato se desconoce debe colocarse el símbolo: s/i (aclarando en nota). Y si algún dato es cero debe colocarse una rayita.

- Por último , hemos de recomendar simplicidad de la presentación de los cuadros, para lo cual, tratar el menor número posible de temas por tabla; elegir un tamaño y forma adecuadas al informe que se presenta; no trazar más rayas que las necesarias para dividir columnas o filas, siendo esenciales aquéllas que separan encabezados, subencabezados, la columna matriz y los totales. Todo el cuadro debe enmarcarse en un recuadro.

Gráficos estadísticos: Tiene por objeto presentar a los datos estadísticos por medio de figuras: líneas, áreas, volúmenes, etc.

Este método suele reemplazar o complementar a los cuadros estadísticos, que sólo presentan cifras y que en general resultan inexpresivas; en cambio, un gráfico ayuda a visualizar rápidamente una situación cualquiera describiéndola, debido a su claridad, facilidad de comprensión y retención de los resultados. Un gráfico destaca ciertos hechos esenciales de los fenómenos observados y sirve como un medio de control, ya que hace particularmente visible toda variación anormal y toda discontinuidad crítica en la marcha del fenómeno en observación. Es el indicador óptimo de máximos y mínimos y de evoluciones de tendencia. Es el instrumento ideal para la comparación de distribuciones referidas a un mismo fenómeno y representada en la

Estadística Descriptiva 15

Page 16: 1a La Estadistica en La Investigacion

Cátedra Estadística

misma escala de magnitudes. Por último diremos que un gráfico resulta siempre más atractivo y comprensible para su análisis, que un cuadro, por lo cual, difícilmente se lo deje de lado en la lectura de un texto, hecho que puede ocurrir con los cuadros.

Pero debemos señalar ciertas limitaciones del método:

- En un gráfico no se puede presentar una gran cantidad de información como lo permite hacer un cuadro, ya que puede resultar confuso si en un mismo gráfico se pretende comparar varias distribuciones.

- Un gráfico desprecia necesariamente ciertos detalles y no puede pretender la misma precisión que los cuadros, que permiten la lectura exacta de las cifras presentadas.

- En general, la confección de un gráfico lleva más tiempo que la elaboración de un cuadro.

Las partes componentes de un gráfico coinciden en cierto modo con las de un cuadro: podemos indicarlas en el siguiente orden: título, diagrama, fuente, notas, referencias y escalas, estas dos últimas se incluirán cuando sea necesario. Valen las mismas indicaciones que las hechas para cuadros, salvo respecto al título, el cual puede ir colocado en la parte superior o inferior del diagrama. El diagrama correspondería al cuerpo del cuadro, puede presentar distintas formas y su objeto es presentar la información a través de un gráfico; los más comunes son barras, líneas, dimensiones, mapas estadísticos y símbolos, que darán lugar a una clasificación posterior de los gráficos estadísticos. La escala es una de las componentes de un gráfico con la que hay que tener especial cuidado. Los gráficos se harán con referencia al sistema de ejes coordenados cartesianos ortogonales tomando en el eje de las abscisas (X) las clasificaciones cuantitativas o cronológicas y en el de las ordenadas (Y) se representarán las magnitudes que corresponden, para lo cual se necesita tomar como unidad de medida aquélla cantidad que origina una escala cuyo límite inferior esté por debajo del menor valor observado y su límite superior cubra al mayor valor observado; la escala se marca a partir del origen del sistema (al cual le corresponde el cero); si las magnitudes tienen un rango alejado del origen, será necesario cortar el eje. Si la clasificación es cualitativa o geográfica, ésta se ubica en el eje de las ordenadas (Y).

De acuerdo al diagrama que se utilice, los gráficos pueden clasificarse de la siguiente forma:

a) Gráficos lineales : entre los cuales encontramos los de series cronológicas, los de saldos netos, los semilogarítmicos y los logarítmicos.

Este gráfico permite observar la variación de un fenómeno a través del tiempo, o la tendencia del fenómeno. Es muy usado para representar la evolución de series de datos correspondientes a ingresos y egresos. Se observa en este gráfico una suba importante en el tercer trimestre para el sector Este, mientras que para los otros sectores hay una leve tendencia a disminuir.

Estadística Descriptiva 16

Page 17: 1a La Estadistica en La Investigacion

Cátedra Estadística

En general en todos los gráficos hay que tener cuidado en la elección de la escala. La elección de una escala inadecuada puede desvirtuar la información que se quiere representar. Los siguientes gráficos muestran la misma información utilizando diferentes escalas:

b) Gráficos de barras : entre los que se encuentran los de barras absolutas simples, barras porcentuales simples, barras absolutas subdivididas, barras porcentuales subdivididas, el de barras compuestas, el de barra única y del de barras direccionales.

El siguiente es un gráfico de barras absolutas simples. Las barras son absolutas porque representan cantidades netas y no porcentajes, y son simples ya que cada barra indica una procedencia. Por otro lado, hay que notar que las barras son horizontales porque la variable clasificatoria (procedencia) es cualitativa. Se observa que el mayor volumen de exportación de trigo por vía marítima procede de Bahía Blanca, y que la diferencia con las otras dos procedencias es muy importante. Un gráfico de esta forma pero que utilice valores en porcentaje es un gráfico de barras porcentuales simples.

Total de exportaciones por vía marítima - 1993

0 50 100 150 200

Rosario

B. Aires

B. Blanca

Los gráficos de barras subdivididas muestran mayor cantidad de datos que el anterior. Cada barra se subdivide de acuerdo con la composición de la misma. En las barras subdivididas absolutas (gráfico de la izquierda) el valor máximo de la barra indica el total. Este gráfico permite comparar tanto el total de exportaciones de cada lugar como la cantidad de exportaciones de cada modalidad (trigo, girasol etc.). En el gráfico de barras subdivididas porcentuales se compara la proporción de exportación de cada tipo de grano en los diferentes lugares, independientemente del total.

Podemos observar que hay un mayor volumen de exportación procedente de Bahía Blanca y que en esta zona la exportación de trigo es la más significativa. En el gráfico porcentual podemos observar que la proporción de soja proveniente de Rosario es mayor que la de las otras ciudades.

Estadística Descriptiva 17

Exportaciones de granos por vía marítima - 1993

0 50 100 150 200

Rosario

B. Aires

B. Blanca

Trigo

Girasol

Soja

Exportaciones de granos por vía marítima - 1993

0% 50% 100%

Rosario

B. Aires

B. Blanca

Trigo

Girasol

Soja

Page 18: 1a La Estadistica en La Investigacion

Cátedra Estadística

De la misma manera, es posible confeccionar gráficos de barras subdivididas verticales cuando la variable clasificatoria es cronológica o cuantitativa.

En los gráficos porcentuales se observa la composición de cada barra sin importar el total. Por ejemplo, la proporción de soja en el año 1995 es mayor que en el 1996 y 1997 (gráfico de la derecha) aunque la producción total de ese año sea mucho menor que en los otros (gráfico de la izquierda).

Los gráficos de barras compuestas utilizan una barra para cada una de las modalidades que la componen. Así, la información dada anteriormente en un gráfico de barras subdivididas puede representarse como en el gráfico siguiente. Estas barras permiten una mejor comparación entre las modalidades.

Puede observarse cómo varía la producción de trigo en los diferentes lugares, la producción de soja es casi igual en todos lados y se observa una pequeña diferencia en la producción de girasol.

Estadística Descriptiva 18

Page 19: 1a La Estadistica en La Investigacion

Cátedra Estadística

En las barras direccionales, el sentido de las barras también tiene un significado. Los usos más frecuentes de estas barras son: gráficos de datos con saldos que pueden ser positivos o negativos y pirámides poblacionales donde la dirección indica el sexo. En la pirámide de población se observa que la mayor cantidad de habitantes tiene entre 10 y 20 años. Esto indica una preponderancia de la población joven.

c) Gráficos de áreas: entre éstos se encuentra el gráfico de sectores, comúnmente llamado gráfico de torta, y el gráfico de franjas o partes componentes.

El gráfico de torta es siempre porcentual y es equivalente a realizar un gráfico con una barra porcentual única. El gráfico de franjas muestra los valores en diferentes períodos, los totales y la tendencia o la evolución.

d)Entre otros tipos de gráficos encontramos: Gráficos de volumen, pictogramas, mapas estadísticos, gráficos de Gantt, organigramas, etc. El que se muestra a continuación es un pictograma:

En los pictogramas cada dibujo indica una cierta cantidad de unidades. No se puede va -riar el tamaño del dibujo pero sí se puede cortar proporcionalmente.

Fiat

Ford

Estadística Descriptiva 19

F

F

= 10.000 unidades

Producción automotriz - 1999

Page 20: 1a La Estadistica en La Investigacion

Cátedra Estadística

Las reglas generales que utilizaremos para graficar la información son:

Los gráficos lineales son ideales para representar series de tiempo. En caso de existir más de una clasificación se usan distintos trazos, aclarando en las referencias.

Los gráficos de barras verticales se usan para las clasificaciones cronológicas o cuantitativas.

Los gráficos de barras horizontales se utilizan para clasificaciones cualitativas o geográficas.

Las barras son rectángulos horizontales o verticales, todos de igual ancho y cuya longitud es proporcional al dato que representan.

Las barras no deben ser excesivamente cortas y anchas, ni largas y angostas. Entre barra y barra debe dejarse un espacio menor que el ancho de la barra y mayor

que la mitad de dicho ancho. No deben rayarse las barras con líneas horizontales ni verticales. No debe usarse un número excesivo de barras por gráfico, (no más de 6). Las escalas pueden ser en valor absoluto o porcentual. Las barras subdivididas son ideales para reflejar el total general aparte de las

subclasificaciones. La barra única generalmente es horizontal, la escala es en valores porcentuales y su

longitud total corresponde al 100%. En valores relativos se representan las partes componentes del total.

Las barras compuestas se utilizan para comparar dos series de datos correspondientes a distintos períodos (barras verticales) o a distintos lugares geográficos (barras horizontales).

Las barras direccionales se utilizan para reflejar las variaciones en uno y otro sentido: ingresos y egresos; importaciones y exportaciones; migraciones y emigraciones; positivo y negativo; masculino y femenino (pirámide de población)

6 Análisis de la Información:

Este paso está relacionado con la definición de que tipo de análisis vamos a realizar, si inferencial o descriptivo. En el análisis descriptivo se utilizan coeficientes de asociación y regresión; medidas de posición y dispersión, etc. En el área de la estadística inferencial se utilizan técnicas de estimación de parámetros, pruebas de hipótesis, etc.

7 Interpretación de la Información:

En esta etapa el investigador da una explicación comprensiva de la investigación y de los resultados hallados y así llegar a la conclusión. Cuáles son las conclusiones que se desprenden del análisis? Qué nos dicen las cifras que sea nuevo, que refuerce o arroje dudas sobre hipótesis anteriores, o (si el estudio es lo suficientemente amplio)que compruebe o refute opiniones anteriores?. Los resultados deben interpretarse a la luz de las limitaciones del material original. No deben deducirse conclusiones demasiado precisas de datos que por si mismos no son más que aproximaciones. Sin embargo, es de esencial importancia que el investigador descubra y aclare todo lo que haya de útil o aplicable en sus datos.

Estadística Descriptiva 20