estadÍstica descriptiva. introducciÓn.€sicas.pdf · por quÉ estudiar estadistica? 1....
TRANSCRIPT
ESTADÍSTICA DESCRIPTIVA.
INTRODUCCIÓN.
Los antecedentes de la Estadística serán tan remotos como lo pueda ser la historia del
hombre. Es fácilmente imaginable que las sociedades humanas más primitivas estuvieran
interesadas en enumerar sus características más relevantes: familias, hombres aptos para
la guerra, utensilios de caza y labranza, cabezas de ganado, etc.
Filológicamente, el término Estadística tiene su raíz en la palabra estadista, y ésta, a su
vez, en el latín ⟪status⟫. De aquí nace su primera vocación: la de constituirse como la
exteriorización cuantitativa de las cosas del Estado.
Su historia nos dice que hasta mediados del siglo XIX la estadística se usaba para dar la
información de tipo socio-económico de un Estado.
En la actualidad, hemos de partir del hecho de que cada vez vivimos en una sociedad en la
que pensamos y tomamos decisiones según los datos y análisis estadísticos que se nos
ofrecen.
La estadística, por tanto, se ha convertido en una herramienta indispensable para
investigar cualquier tipo de cosa.
DEFINICIONES DE ESTADÍSTICA
La Estadística, es una rama de las matemáticas que se ocupa de reunir, organizar y
analizar grandes cantidades de datos numéricos para obtener así características
comunes entre sí, también ayuda a resolver problemas como el diseño de
experimentos y la toma de decisiones.
Se ocupa de los métodos científicos para recolectar, organizar, resumir,
presentar y analizar datos así como de sacar conclusiones válidas y tomar
decisiones con base a este análisis.
En un sentido más común, el término estadística hace referencia a una
determinada información numérica por ejemplo: La expectativa de vida de los
ecuatorianos al nacer es 72,79 años para los hombres y 78,82 para las
mujeres; enero (2 014) cerró con una inflación mensual de 0.11%.
Las técnicas estadísticas se utilizan para tomar decisiones que afectan nuestra vida
diaria y por tanto influyen en nuestro bienestar personal.
El conocimiento de métodos estadísticos ayuda a entender por qué se toman
decisiones y aportan a una mejor comprensión respecto a la forma en que nos afectan
las mismas.
Sin importar la línea de trabajo futura se tendrá que tomar decisiones que involucran
datos, el conocimiento de los métodos estadísticos ayudará a tomarlas con mayor
efectividad.
RAMAS DE LA ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA.- Describe y analiza un grupo dado sin sacar conclusiones
para un grupo mayor.
Su finalidad es obtener información, analizarla, elaborarla y simplificarla lo necesario para
que pueda ser interpretada cómoda y rápidamente, por tanto, pueda utilizarse
eficazmente para el fin que se desee.
INFERENCIA ESTADÍSTICA.- Analiza e interpreta una muestra de datos y determina
conclusiones aplicables a toda la población. Como se selecciona la muestra, cómo se
realiza la inferencia, y qué grado de confianza se puede tener en ella son aspectos
fundamentales de la estadística inferencial, para cuyo estudio se requiere un alto
nivel de conocimientos de estadística, probabilidad y matemáticas.
POR QUÉ ESTUDIAR ESTADISTICA?
1. Enriquecimiento Profesional.
2. Para tomar decisiones acertadas
3. Es fundamental para continuar la secuencia de un ciclo estudiantil.
4. Sirve para comprender literatura en la que intervienen cifras estadísticas.
5. Incremento en el desarrollo intelectual de las personas permitiendo aplicar los
conocimientos.
CAMPOS DE APLICACIÓN DE LA ESTADÍSTICA
Es tan amplio el campo de aplicación de la Estadística que será larga su enumeración y que
podríamos resumirlo diciendo que todas las ciencias, en una u otra forma, la aplican. Sin
embargo podríamos decir que en las actividades económicas el empresario, el industrial o
el hombre de negocios en general, la utilizan, ya sea para análisis financiero, en las ventas
o en los procesos de producción, también en la investigación de mercados, para el
lanzamiento de un producto, para averiguar su grado de aceptación o para proyección de
su producción y de sus ventas; cuando desea aceptar o realizar un lote de su producción o
de la materia comprada; en la elaboración del presupuesto o como parte integrante en el
desarrollo, políticas y desarrollo de carácter administrativo.
APLICACIÓN DE LA ESTADÍSTICA
EN LAS CIENCIAS
EN LA EMPRESA
Economía
Administración
Física
Química
Sociología
Psicología
Ingeniería
Finanzas
Seguros
Producción
Control de calidad
Administración
Recursos Humanos
Comercialización
Arquitectura
Astronomía
Agronomía
Mercadeo, investigación de
mercado
ABUSOS DE LA ESTADÍSTICA.
- Acomodar los datos para obtener los resultados que interesan
- Hacer comparaciones equivocadas, por ejemplo comparar los salarios actuales
(2014) con los del año 2000 sin tomar en cuenta el poder adquisitivo de la moneda
en cada uno de esos años.
- Hacer conclusiones a partir de información insuficiente o incorrecta.
ETAPAS DE LA INVESTIGACIÓN ESTADÍSTICA
En general en un procedimiento de investigación estadística se pueden distinguir tres
etapas perfectamente diferenciadas, todas importantes y dependientes en gran medida
de la etapa anterior.
1. Diseño y planificación de la investigación.- Es fundamental que esta primera etapa
sea desarrollada con total responsabilidad y acierto, que sus elementos sean
definidos con total claridad y precisión; de su éxito depende el de la investigación.
Por lo general requiere un equipo de profesionales multidisciplinarios. Esta etapa
consiste en conceptualizar y definir el problema a investigarse, puntualizar su
alcance, cobertura y profundidad; establecer los objetivos, las hipótesis y las
variables de estudio; operacionalización de las variables , diseñar la técnica de
investigación, su instrumento de medición, la determinación de los recursos
disponibles y los requeridos (recursos naturales, materiales y económicos); y, la
planificación de las acciones que deben ser desarrolladas para que la investigación
culmine con los resultados esperados (elaboración del cronograma de trabajo)
2. Organización y ejecución de la investigación.- Esta etapa puede ser considerada la
más sencilla porque no demanda servicios con gran especialización, en la mayoría
de los casos y no por eso es menos importante porque de su éxito depende la
calidad de los datos.
En esta segunda etapa se efectuarán todas las acciones para reclutar, capacitar y
organizar al personal del trabajo de campo; organizar las labores de campo; y, la
toma y control de la información en forma ordenada y sistemática.
3. Procesamiento y análisis de los resultados.- Similarmente a la primera esta
requiere de profesionales de varias especializaciones y comprende el
procesamiento electrónico de datos y obtención de cuadros de salida; el análisis
descriptivo y explicativo de las variables, la prueba de hipótesis, el cumplimiento
de los objetivos; el análisis inferencial; y, la elaboración del informe final de la
investigación.
FUENTE DE DATOS
FUENTE DESCRIPCIÓN APLICACIÓN
Primaria Toma de información directa de los
elementos
Censos y encuestas
Secundaria Toma de información indirecta de los
elementos
Registros, informes,
anuarios estadísticos
MUESTRA
Es un subconjunto representativo de población. Las muestras se obtienen con la
intención de inferir (deducir) propiedades de la totalidad de la población.
MUESTREO
Es un procedimiento de investigación estadística que pretende estudiar el
universo de interés, con base en la información que se obtiene de una parte de
las unidades que componen dicho universo.
Población Muestra
MUESTREO PROBABILÍSTICO.- Todos los métodos probabilísticos tienen un
propósito común, permitir que el azar determine los elementos que incluirán en
la muestra.
El muestreo probabilístico nos asegura la representatividad de la muestra
extraída y es, por tanto, el más recomendable.
MUESTREO NO PROBABILÍSTICO.- Los miembros de la muestra son elegidos a
voluntad y criterio de quien investiga por tanto ésta puede ser no representativa.
No es posible establecer la posibilidad de que los miembros del universo sean
seleccionados como parte de la muestra.
Ventajas del muestreo
Menor costo
Información más exacta (mejor calidad) que la del Censo debido a la menor
cantidad de recurso humano que utiliza en comparación con la del censo
permite capacitarlos mejor y más selectivamente
Mayor rapidez en la obtención de resultados
N
n INFERIR
Técnica más utilizada y que permite obtener información de casi cualquier tipo
de población.
Gran capacidad para estandarizar datos, lo que permite su tratamiento
informático y el análisis estadístico
Relativamente barata para la información que se obtiene con ello.
Desventajas:
El planeamiento y ejecución de la investigación suele ser más complejo que si se
realizara por censo.
Requiere para su diseño de profesionales con buenos conocimientos de teoría y
habilidad en su aplicación
POBLACIÓN O UNIVERSO.-Es el conjunto de elementos que son de nuestro interés de
investigación que poseen características comunes y observables en un lugar
(ESPACIO) y en un momento determinado (TIEMPO).
ELEMENTOS O UNIDADES DE ANÁLISIS O UNIDADES DE OBSERVACIÓN.- Cada uno de
los objetos que forman la población o universo y que son fuente de datos. Es la unidad
básica del estudio.
Pueden ser clasificados como:
Elementos individuales; o
Elementos colectivos
ELEMENTO INDIVIDUAL.- Es la persona cuando se analiza la población del Ecuador o
de un provincia en particular, es el miembro del hogar cuando se analiza la población
de los hogares, es el estudiante cuando se analiza la población estudiantil, es el
trabajador cuando se analiza la población de trabajadores . En cada uno de los casos
citados el elemento caracteriza a un individuo en estudio, es “un elemento individual.
ELEMENTOS COLECTIVOS. Cuando se analiza la producción de la industria textil, la
población está conformada por el conjunto de todas las empresas textiles y un
elemento es cualquiera de las empresas de producción textil; si se analiza la atención
hospitalaria de los hospitales que pertenecen al Estado, la población está conformada
por todos los hospitales del Estado. Es estos ejemplos, el elemento caracteriza a un
colectivo y la población es el conjunto de todos los “elementos colectivos”
PARÁMETRO.- Es una medida que está en función de una población, entre las más
conocidas tenemos:
Media poblacional (miu)
Varianza 2
Desviación típica
Estadístico.- Es una medida que está en función de una muestra, entre las que
podemos mencionar:
Varianza s2
Desviación típica s
Media ̅
POBLACIÓN MUESTRA
Conjunto de elementos subconjunto de elementos
Tiempo
Espacio
CENSO MUESTREO
Parámetro Estadístico
Describe a la población Describe la muestra
VARIABLES
Son características o cualidades que poseen los elementos de una población o muestra,
éstas pueden ser medibles y observables
Clasificación de las variables:
Cualitativas: la característica de estudio es no numérica; por ejemplo: la preferencia
religiosa, el sexo, el color del cabello, el estado civil, etc.
a. Nominal : una variable cualitativa nominal presenta modalidades no numéricas que no
admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades:
soltero, casado, separado, divorciado y viudo.
N
n INFERIR
b: Ordinal : una variable cualitativa ordinal presenta modalidades no númericas, en las
que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable,
sobresaliente.
Cuantitativa: asume valores numéricos acompañados de una unidad de medida; por
ejemplo: calificaciones de un examen, etc. Se clasifican en:
a. Continuas: pueden tomar cualquier valor dentro de un intervalo, generalmente
proceden de mediciones. Ejemplos: tiempo en realizar una transacción bancaria, ventas
mensuales, etc.
b. Discretas: Sólo pueden tomar determinados valores en un intervalo, por lo general
números enteros, y suelen ser el resultado de un conteo. Ejemplo: el número de
productos defectuosos, número de empleados de un departamento, etc.
VARIABLES Y ESCALAS DE MEDICIÓN
CARACTERÍSTICAS
VARIABLE
MEDIDA
CUALITATIVA
Nominal.- Clasifica a los
elementos en dos o más
categorías que expresa la
condición o estado de
variable en el elemento sin
orden, ni prelación
Nominal
Ordinal.- Clasifica a los
elementos en dos o más
categorías que expresa un
grado diferente de la misma
dimensión, nivel de
prelación, prioridad u orden
Ordinal
CUANTITATIVA
Discreta.- Asume sólo
valores enteros y positivos,
resultado del conteo del
número de elementos que
poseen una dimensión
Escala
Métrica
Continua.- Toma cualquier
valor, entero y/o
fraccionario, resultado de la
medición de la dimensión
en cada elemento
MÉTODOS NUMÉRICOS PARA DESCRIBIR DATOS CUANTITATIVOS Y CUALITATIVOS
Una vez que se han recogido y tabulado los datos, deben presentarse de manera
organizada para facilitar el acceso a la información. La mejor manera de examinar estos
datos es presentarlos en forma resumida, elaborando tablas y gráficas apropiadas que
permitan observar las principales características de los datos.
Para el agrupamiento de datos, se establecerán los siguientes conceptos:
Frecuencia Absoluta (fi): es un número que indica la cantidad de veces que se repite un
dato.
Frecuencia Relativa (fr): es un número que indica la proporción que representa la
frecuencia absoluta respecto del total de datos. Se calcula como: fr = fi/n.
Frecuencia Acumulada Absoluta (Fi): es la frecuencia total de todos los valores
acumulados hasta el valor correspondiente de la serie.
Frecuencia Acumulada Relativa (Fr): es un número que indica la proporción que
representa la frecuencia acumulada absoluta respecto del total de datos. Se calcula como:
Fr = Fi/n
DISTRIBUCIÓN DE FRECUENCIAS
Una distribución de frecuencias organiza los datos de manera resumida. Es una tabla
compuesta por dos columnas, en una se ubican los valores de la variable y en otra sus
respectivas frecuencias absolutas y/o relativas. Se reconocen dos tipos de distribuciones:
Muestra todos los valores que toma la variable, con sus respectivas frecuencias. De uso
común para variables cualitativas, y en cuantitativas cuando no hay muchos valores
diferentes. Ejemplo: Supongamos que los siguientes datos corresponden al peso en Kg. de
un grupo de estudiantes: 56, 58, 61, 62, 67, 68, 70, 75, 56, 58, 61, 68, 75, 58, 68, 68. Al
construir la de distribución de frecuencias obtenemos:
Peso (Kg.)
Frecuencia absoluta (fi)
Frecuencia relativa (fr)
Frecuencia acumulada
absoluta (Fi)
Frecuencia acumulada
relativa (Fr)
56 2 12,5 2 12,5
58 3 18,8 5 31,3
61 2 12,5 7 43,8
62 1 6,3 8 50,0
67 1 6,3 9 56,3
68 4 25,0 13 81,3
70 1 6,3 14 87,5
75 2 12,5 16 100,0
TOTAL n = 16 100,0
Por clases o intervalos: Utilizadas para variables cuantitativas, generalmente continuas.
Se agrupan los datos por intervalos, y la frecuencia absoluta se cuenta como el número de
datos incluidos en cada intervalo. Para construir una distribución de frecuencias por
clases, generalmente se siguen los siguientes pasos:
- Selección del número de clases: es una decisión arbitraria que depende
fundamentalmente del número de datos; se recomienda que la distribución de
frecuencias tenga entre 5 y 15 clases (si no existen suficientes clases, o si hay demasiadas,
la información se dispersa y no es de utilidad). Hay muchos criterios que se pueden utilizar
para calcular el número de clases, entre ellos:
Número de clases c= √ ; donde “n” el número total de observaciones.
Número de clases ; donde “n” el número total de observaciones.
Número de clases c =≥ 1+3,322 Log n (Regla de Sturges) ; “n” el número total de
observaciones.
- Determinación del ancho o amplitud del intervalo: Para facilitar la interpretación de los
datos, es recomendable que todas las clases tengan el mismo ancho; sin embargo, pueden
haber particularidades donde no sea adecuado el uso de clases iguales, en estos casos
debe predominar el buen juicio del investigador.
EL ancho del intervalo puede determinarse de acuerdo a la fórmula:
En donde:
El valor obtenido con esta fórmula sirve como referencia, y puede ser redondeado de
acuerdo a la conveniencia del investigador.
- Determinación de los límites de clase: Los límites de clase deben estar claramente
definidos, para garantizar que todos los datos pertenezcan a alguna y sólo una de las
clases.
El límite inferior de la primera clase debe ser un número menor o igual al valor mínimo de
la variable, y los límites inferiores (Li) de las siguientes clases se obtienen sumando a este
primer valor el ancho de intervalo definido. Para determinar los límites superiores (Ls) se
puede tomar dos criterios:
a. considerar el límite inferior de la siguiente clase, siempre que cada clase se asuma como
un intervalo semiabierto (útil en variables continuas).
b. considerar el límite inferior de la siguiente clase restado una unidad, esto es adecuado
para variables discretas, siempre que las clases se asuman como intervalos cerrados.
Es importante notar que el límite superior de la última clase debe ser superior o igual al
valor máximo de la variable.
- Cálculo de la marca de clase ( ): La marca de clase es el valor representativo de la
misma, se calcula como el promedio de los límites inferior y superior.
- Determinación de las frecuencias de clase: Una vez definidas las clases, las frecuencias
absolutas de clase se determinan como el número de datos que pertenecen a cada clase.
La suma de las frecuencias absolutas debe coincidir con el total de datos. Las frecuencias
relativas se determinan según la fórmula: fr = fi/n
65 63 65 63 69 67 53 58 60 61
64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62
63 65 63 70 67 66 57 59 61 62
64 64 63 69 67 66 58 60 61 62
Construir la distribución de frecuencias: 1. Identificar el valor más alto y el más pequeño en el grupo de datos Xmáx=72 Xmín=53 2. Calcular el Rango R=Xmáx-Xmín R=72-53 R=19 3. Selección del número de clases: 1+3.322log50= 6,606 Se usan 7 clases. 4 Determinación del ancho del intervalo:
Como los datos son enteros entonces se decide que los intervalos serán de ancho i= 3 5. Determinación de los límites de clase y construcción de la distribución:
Li - Ls
(Li+Ls)/2
fi fr Fi Fr
[53 –55] 54 2 4 2 4
[56 – 58] 57 5 10 7 14
[59 – 61] 60 9 18 16 32
[62 – 64] 63 15 30 31 62
[65 – 67] 66 12 24 43 86
[68 – 70] 69 5 10 48 96
[71 – 73] 72 2 4 50 100
50 100