estadistica tema 3.ppt [modo de compatibilidad]personales.unican.es/rasillad/tema 3.1 introduccion...

44
Estadística descriptiva Estadística descriptiva Tema 3

Upload: dothuan

Post on 19-Oct-2018

225 views

Category:

Documents


0 download

TRANSCRIPT

Estadística descriptivaEstadística descriptiva

Tema 3

Esquema de aprendizajeEsquema de aprendizaje

� Apartado 1 ◦ Introducción

� Apartado 2◦ Organización y representación de los

datosdatos

� Apartado 3◦ Parámetros estadísticos

IntroducciónIntroducción

Tema 3.1

IntroducciónIntroducción

� Definición de estadística: ◦ Según el Diccionario de la Lengua Española

(RAE): � Estudio de los datos cuantitativos acerca de la población, de

los recursos naturales e industriales, del tráfico o de los recursos naturales e industriales, del tráfico o de

cualquier otra manifestación de las sociedades humanas.

� Colección de datos numéricos clasificados según un

determinado criterio � estadísticas de natalidad,

estadísticas de empleo, estadísticas de precios etc.

� Rama de la matemática que utiliza grandes conjuntos de

datos numéricos para obtener inferencias basadas en el

cálculo de probabilidades.

IntroducciónIntroducción

� Definición de estadística:

◦ En la vida cotidiana se contemplan las tres acepciones, siendo

quizás la 2ª la más conocida � resultados ya elaborados en

un estudio en el que se empleó la Estadística como método.

◦ Actualmente, se aplica en todas las áreas del saber y, de

manera determinante, en las Ciencias Sociales.

� Administración de Empresas: evaluación de la aceptación de un

producto antes de comercializarlo

� Economía: evolución de los precios o hábitos de los consumidores

� Sociología: perfiles y dinámica de colectivos sociales

� Relaciones Laborales: análisis de salarios, de desempleo o de

accidentes laborales

IntroducciónIntroducción

� Definición de estadística: ◦ Académica-científica: disciplina que

� La parte del método científico que mediante el análisis

matemático nos permite obtener información sobre la

realidad que nos rodea.realidad que nos rodea.

� Utiliza los números para el estudio de las leyes que

dependen del azar

� Busca la causa de un comportamiento particular mediante

el razonamiento inductivo � hace comparaciones y saca

conclusiones mediante el recuento, ordenación y

clasificación de los datos.

IntroducciónIntroducción

� Vida ordinaria contempla dos tipos de fenómenos o hechos:◦ Deterministas

◦ Aleatorios

IntroducciónIntroducción

� Vida ordinaria contempla dos tipos de fenómenos o hechos:◦ Deterministas

� Mismas condiciones = iguales resultados. EjemplosEjemplos

� Cuerpo abandonado en el campo gravitatorioterrestre, que, por efecto de su propio peso, se desplaza siguiendo la vertical del lugar

� Movimiento del globo terrestre � sucesiónsistemática de días y noches.

IntroducciónIntroducción

� Vida ordinaria contempla dos tipos de fenómenos o hechos:◦ Aleatorios

� Mismas condiciones = sin garantía de obtener idéntico resultado en cada prueba: obtener idéntico resultado en cada prueba:

� Lanzamiento de un dado: no podemos garantizarcon certeza absoluta qué número saldrá, sólo queserá un número entre 1 y 6.

� Peatón que cruza todos los días una calle en lasmismas condiciones � el resultado de ser o no atropellado no es predecible antes de cadatravesía.

IntroducciónIntroducción

� Vida ordinaria contempla dos tipos de fenómenos o hechos:◦ Aleatorios

� Los fenómenos aleatorios están regidos por la leydel azardel azar

� Azar: incapacidad de repetir experiencias iguales �

resultados no coincidentes

� ¿El azar como reconocimiento de la incapacidadhumana para reproducir las condiciones de partida(Galileo)?

� En el lanzamiento de una moneda se obtienenresultados diferentes por que ésta no se ha lanzadoen condiciones exactamente idénticas.

IntroducciónIntroducción

� Vida ordinaria contempla dos tipos de fenómenos o hechos:◦ Aleatorios

� Los fenómenos aleatorios están regidos por la ley del azar, del azar,

� La distinción entre fenómenos deterministas y aleatorios no es clara � la progresión del conocimiento científico relega muchos fenómenos aleatorios a la consideración de deterministas (profundización en el conocimiento de las causas que explican dichos fenómenos).

IntroducciónIntroducción

� Estadística matemática◦ Ciencia que estudia los fenómenos

aleatorios y que, en una segunda fase, los generaliza y predice o infiere resultados.

� Estadística descriptiva◦ Una parte de la EM (históricamente

anterior), que trata de la descripción numérica de conjuntos (útil cuando están formados por muchos elementos)

IntroducciónIntroducción

� Estadística descriptiva

◦ Objeto de estudio � colectivos numerosos de los

que se describen y analizan unos determinados

caracteres

◦◦ No pretende obtener conclusiones generales �

objeto de la Estadística inductiva o Inferencia

estadística.

◦ El colectivo puede tener tamaño demasiado grande

� obliga a centrarse en un subconjunto del que,

si está bien seleccionado, se extrapolarán los

resultados para la totalidad del conjunto.

IntroducciónIntroducción

� Conceptos◦◦ PoblaciónPoblación: todo el conjunto de elementos

(personas, objetos, ideas o acontecimientos) a los que se somete a un estudio estadístico

� Sinónimo: colectivo o universo. � Sinónimo: colectivo o universo.

�� IndividuoIndividuo: cada uno de los elementos quecomponen una población (alumnos clase, vehículos parque móvil

�� TamañoTamaño de una población: número de individuos

� Letra N.

� Algunas veces infinito �

IntroducciónIntroducción

� Conceptos◦◦ MuestraMuestra: subconjunto representativo de

una población de referencia

� Tamaño muestral � número de valores de � Tamaño muestral � número de valores de una variable (N) que corresponden a los elementos de una muestra

� Menor que el número de valores de esa mismavariable correspondientes su población

Introducción Introducción

� Conceptos

◦◦ ValorValor: cada uno de los distintos resultados que se pueden obtener en un proceso.

� Si lanzamos una moneda al aire 5 veces sólo

obtenemos dos valores: cara y cruzobtenemos dos valores: cara y cruz

◦◦ DatoDato: cada uno de los valores obtenidos al realizar un proceso.

� Si lanzamos una moneda al aire 5 veces

obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Introducción Introducción

� Conceptos◦◦ ParámetroParámetro: valor numérico calculado a

partir de todos los datos de la poblacióna través de una determinada expresiónmatemáticamatemática

◦◦ EstadísticoEstadístico: valor numérico calculado a partir de los datos de una muestra gracias a una expresión matemática.

IntroducciónIntroducción

� Conceptos◦◦ MuestreoMuestreo: datos obtenidos de una

proporción reducida y representativa de la población

� Puede ser � Puede ser

� Aleatorio: los elementos de la muestra se seleccionan al azar (medios probabilísticos)

� No aleatorio: usa criterios (dividir la poblaciónen barrios, por edades, por nivel económico) para elegir el número de datos en la proporción más conveniente para quereproduzcan de forma adecuada los caracteres de la población

IntroducciónIntroducción

� Conceptos◦◦ MuestreoMuestreo: datos obtenidos de una

proporción reducida y representativa de la población

� Ventajas� Ventajas

� Reducción de tiempo y costes;

� Imprescindible cuando la población es infinita o la prueba es destructiva (pe duración de las bombillas).

� Inconvenientes

� Las conclusiones están sometidas a un cierto grado de error, mayor cuanto más pequeño es el tamaño de la muestra.

IntroducciónIntroducción

� Conceptos◦ Variable: cada una de las características

o cualidades que poseen los individuosde una base de datos

� “Varía” de sujeto a sujeto (cada sujeto tiene� “Varía” de sujeto a sujeto (cada sujeto tieneun valor para cada variable)

� Escala de una variable: conjunto de valoresque puede tomar una variable. Ejemplos:

� “sexo”� valores “hombre” y “mujer”

� “ingresos anuales” � valores cualquier númeroentre 0 y cientos de miles o millones de euros

IntroducciónIntroducción

� Conceptos◦ Variable

� Suele designarse con letras mayúsculas del final del abecedario

� (X, Y, ZX, Y, Z)� (X, Y, ZX, Y, Z)

� Los valores que toman las variables se representan con letras minúsculas con subíndice

� X1, X2, X3…Xn

IntroducciónIntroducción

� Conceptos◦ Atributo

� Cualidad no susceptible de medida

� Se designa con las primeras letrasmayúsculas de abecedario (A, B, C, DA, B, C, D, ...), mayúsculas de abecedario (A, B, C, DA, B, C, D, ...),

� Las distintas modalidades correspondientescon letra minúscula con subíndices (a1, a2..an)

� Atributo A: color del cabello.

� Modalidades: a1 cabello negro, a2 cabello rubioetc..

IntroducciónIntroducción

� Conceptos◦ ¿Por qué es importante el tipo de variable?

� El proceso de definir y medir las variables escrucial

� Una definición incorrecta: todo lo que venga detrás� Una definición incorrecta: todo lo que venga detrásestará mal

� Algunas no hace falta definirlas ni hay dificultadpara medirlas (ejemplo “sexo”)

� Otras variables aparentemente “obvias” no lo son tanto: ejemplo “estado civil”

� ¿Otras variables?: “preferencias musicales”

� Prueba y error, para definir y medir variables quecaptan características como “estatus social”, “niveleducativo”, “ideología política”, “religiosidad”...

IntroducciónIntroducción

� Conceptos

◦ Según el tipo de valores que toman lasvariables, distinguimos diferentes tipos de variables variables

� Cualitativas

� Cuantitativa

IntroducciónIntroducción

� Conceptos◦ Variable

� Tipos de variables

�� CualitativasCualitativas o o categóricascategóricas: sus característicasno pueden ser medidas con números.

� Los valores son “categorías”

� Son diferentes por una cualidad, no por unacantidad (no cuantificables� ningún “valor” esmayor o menor que otro

� No sometidas a determinadas operacionesaritméticas. Ejemplo: “media” de estado civil o de partido político

� Dos tipos: nominales y ordinales

IntroducciónIntroducción

� Conceptos◦ Variable

� Tipos de variables CualitativasCualitativas

� Nominal: no se pueden ordenar

� Ej: estado civil (soltero, casado, separado, � Ej: estado civil (soltero, casado, separado, divorciado y viudo)

IntroducciónIntroducción� Conceptos◦ Variable

� Tipos de variables CualitativasCualitativas

� Dos tipos:

� Ordinal (cuasicuantitativa): aunque sus valores son “categorías”, unos pueden ser “mayores” o “categorías”, unos pueden ser “mayores” o “menores" que los demás

� Nota de un examen (suspenso, aprobado, notable,

sobresaliente)

� Puesto en una prueba deportiva (1º, 2º, 3º),

� Medallas de una prueba deportiva (oro, plata, bronce),

clase social (baja, media, alta)

� Opinión sobre una propuesta política (muy en contra, más

bien en contra, indiferente, más bien a favor, muy a favor)

IntroducciónIntroducción� Conceptos◦ Variable

� Tipos de variables CualitativasCualitativas� Ordinal (cuasicuantitativa):

� Tratamiento estadístico:

� A veces, como variables cualitativas� A veces, como variables cualitativas

� A veces, como variables cuantitativas: “cambiando” las etiquetas por números y “transformando” la variable en cuantitativa

� Los resultados del análisis pueden variar según quénúmeros asignemos a los valores: métodosespecíficos para escalas ordinales

� Riesgo de pérdida de información: con númerospodemos calcular media; con “categorías” no podemos calcular media o su cálculo será menospreciso.

IntroducciónIntroducción

� Conceptos◦ Variable

� Tipos de variables

�� CuantitativaCuantitativa: se expresan mediante un número (se pueden medir o cuantificar)

� Ejemplos: edad, ingresos, nota en un examen, número de años de educación, kilómetros de distancia entre trabajo y residencia...

� Al ser "números", cada posible valor es menor o mayor que otro valor.

� Se pueden someter a operaciones aritméticas

� OJO� “números” que son “etiquetas”: códigopostal; el número de teléfono; el código de unaasignatura

IntroducciónIntroducción

� Conceptos◦ Variable

� Tipos de variables

�� CuantitativaCuantitativa:

� El conjunto de valores forman una escala de � El conjunto de valores forman una escala de intervalo

� Intervalo: distancia entre valores � podemoscalcular la distancia o intervalo entre cualquier par de valores. Ejemplo: ingresos 10.000, 30.000, 40.000 €

IntroducciónIntroducción

� Conceptos◦ Variable

� Tipos de variables

� Según el número de valores que tengan en la escala

� Discretas: toma valores aislados, sin intermedios � Discretas: toma valores aislados, sin intermedios entre dos valores específicos.

� Los valores son números enteros. Ej: personas en el hogar.

� El número de valores posibles entre dos valores dados es finito

� Resultado de contar

IntroducciónIntroducción

� Conceptos◦ Variable

� Tipos de variables

� Según el número de valores que tengan en la escala

�� ContinuasContinuas: puede tomar cualquier valor entre �� ContinuasContinuas: puede tomar cualquier valor entre dos números (número de valores posibles entre dos valores es infinito).

� Resultado de medir. Ej: altura, peso, tamaño del piso, edad…

IntroducciónIntroducción

� Conceptos◦ Variable

� Variables cuantitativas:

� La diferencia está difuminada

� Variables que son resultado de “medir” � Variables que son resultado de “medir” (continuas), pero redondeamos y convertimos en número finito de valores enteros. Ej: escala ideológica de izquierda a derecha, (valores 1 a 7)

� Variables que son resultado de contar (discretas), pero que tienen muchísimos valores diferentes. Ej ingresos, población de un municipio

IntroducciónIntroducción

� Conceptos◦ Variable

� Variables cuantitativas:

� En la práctica:

� Variables “discretas”: cuantitativas con pocos� Variables “discretas”: cuantitativas con pocosvalores distintos (ejemplo: escala ideológica). Poranalogía, también las variables cualitativas, y de escala ordinal

� Variables “continuas”: cuantitativas con muchosvalores distintos (ejemplo: ingresos)

IntroducciónIntroducción

�� SerieSerie estadísticaestadística

◦ Resultados numéricos de las observaciones

realizadas sobre un colectivo

◦ Obtenida

� Serie cronológica o temporal: observar su variación a lo

largo del tiempo. Ej: cotizaciones en Bolsa a lo largo del

mes pasado

� Atemporales: efectuadas en un momento fijo

� Espaciales: comparan los valores de una variable en distintosespacios geográficos. Ej: renta «per capita» en las distintasComunidades Autónomas.

� De frecuencias: estudian la repetición de un determinado hechoo fenómeno (las más usuales en los procesos estadísticos)

IntroducciónIntroducción

� Fases de un estudio estadístico:◦ Diseño o planteamiento del problema

◦ Planificación (trabajo de campo)

◦ Recopilación de la información◦ Recopilación de la información

◦ Organización, análisis y representación de la

información

◦ Interpretación y elaboración de un informe con

las conclusiones

IntroducciónIntroducción

� Fases de un estudio estadístico:◦ Diseño o planteamiento del problema (coste

económico y tiempo):

� Objetivo a conseguir

� Población o muestra a estudiar

� Caracteres que interesan

� Presentación que se hará con los datos recogidos.

IntroducciónIntroducción

� Fases de un estudio estadístico :◦ Planificación del trabajo de campo

� Forma de obtener la información, enfoque a adoptar,

tácticas de la investigación

� Cuando se recurre a datos primarios � diseño de todo

el proceso del trabajo de campo, procedimientos de

entrevista, características del muestreo, diseño de

herramientas, etc.

IntroducciónIntroducción

� Fases de un estudio estadístico:◦ Recopilación de la información

� Directa: cuestionario con preguntas y espacios para las

respuestas.

Presencial: entrevistados que anota las respuestas� Presencial: entrevistados que anota las respuestas

� No presencial: correo, web.

� Indirecta: fichero obtenido de una memoria, banco de

datos, etc.

� Depuración de la información obtenida: problemas

derivados de la no-respuesta, los errores de campo, los

errores de oficina, los datos desaparecidos y los datos

anómalos?

IntroducciónIntroducción

� Fases de un estudio estadístico:◦ Organización, análisis y representación de la

información

� Tabla o matriz de datos sometida a análisis � soporte

informáticoinformático

IntroducciónIntroducción

� Fases de un estudio estadístico:◦ Organización, análisis y representación de la

información

� Análisis descriptivo:

� Organización y resumen de los datos para la extracción de información

relevante

� Tablas, gráficos y parámetros/estadísticos que describen los valores

analizados.

� Inferencia estadística: si la población sigue un modelo o

una distribución conocida y los datos que tenemos son

realizaciones aleatorias de ese modelo, la fiabilidad de los

resultados se recurre al cálculo de probabilidades.

IntroducciónIntroducción

� Fases de un estudio estadístico:◦ Elaboración e interpretación de un informe con

las conclusiones

� Informe o memoria que relata la investigación realizada (útil

para futuras investigacionespara futuras investigaciones

� ¿Son las conclusiones coherentes con la teoría o con el

conocimiento existente (estado de la cuestión)?

� Base para la toma de decisiones: debería guiar a quienes

actuarán teniendo en cuenta la información recibida (o no…)

� ¿Posibilidad de extrapolación?

IntroducciónIntroducción

� Fases de un estudio estadístico:◦ En el proceso descrito aparecen las tres ramas

fundamentales de la Estadística corno ciencia y

que son objeto de estudio en las asignaturas

habituales de Estadística:habituales de Estadística:

� Estadística descriptiva.

� Cálculo de probabilidades.

� Inferencia estadística.

IntroducciónIntroducción