ut-4: distribuciones fundamentales de muestreo y ... · pdf file2 organización de la...
TRANSCRIPT
1
UT-4: Distribuciones fundamentales de muestreo y
descripción de datosSub tema: Muestreo aleatorio. Distribuciones
muestrales. Distribuciones muestrales de medias. Teorema del límite central. Aplicaciones.
DF
2
Organización de la Clase
1. Introducción2. Distribuciones fundamentales de
muestreo3. Algunas aplicaciones al caso de
medias muestrales4. Sugerencias para la gestión del
autoaprendizaje
3
1. Introducción
Estadística
Descriptiva Inferencial
Posición del tema en la asignatura. Relaciones.
4
La cuestión del título del tema
UT-1: Estadística descriptiva y análisis de datosDistribuciones de frecuencias
(Patrón de comportamiento de los datos)
UT-3: Variables aleatoriasy distribuciones de probabilidadDistribuciones de probabilidad
(Modelos matemáticos)
UT-4: Distribuciones fundamentales de muestreo
5
Distribuciones de frecuencias en un contexto dado
Cuatro casos:1. Las bolsas de cemento2. Los derrames del Río Grande3. Los caudales del Río Mendoza4. La resistencia del hormigón
6
Distribución de frecuencias de las observaciones individuales
Se extrae una muestra de tamaño n.
x
fr
1xM1
j123...n
...
xj
x1x2x3
xn
7
Caso 1. Las bolsas de cemento
Box-and-Whisker Plot
Peso49,8 49,9 50 50,1 50,2
Histogram
Peso
frequ
ency
49,8 49,9 50 50,1 50,20
3
6
9
12
15
n = 40
Media = 49,983 kg
Desv. Est.= 0,060 kg
Información obtenida de la muestraX: Peso de las bolsas de cemento, en kg
Density Trace for Peso
49,8 49,9 50 50,1 50,2
Peso
0
1
2
3
4
5
6
dens
ityHistogram for Peso
49,8 49,9 50 50,1 50,2
Peso
0
4
8
12
16
frequ
ency
Trazado de la densidad empírica. Comparación con la Curva Normal.
8
Caso 2. Los derrames del Río Grande
Density Trace
DMAde
nsity
0 2 4 6 8(X 1000)
0
0,5
1
1,5
2
2,5
3(X 0,0001)
Normal Distribution
0 2 4 6 8(X 1000)DMA
0
0,2
0,4
0,6
0,8
1
cum
ulat
ive
prob
abili
ty
Histogram for DMA
0 2 4 6 8(X 1000)DMA
0
3
6
9
12
15
freq
uenc
y
n = 27 años
Media = 3.492,33 hm³
Mediana = 3.565 hm³
Desv. Est.= 1.135, 1 hm³
Coef. Variac. = 32,5%
Q1 =2.488 hm³
Q3 = 4.223 hm³
Información obtenida de la muestra.X: Derrame medio anual, en la estación La Gotera.Registro de 27 años.
9
Caso 3. Los caudales del Río Mendoza
n = 528 meses
Media = 44,54 m³/s
Mediana = 31,9 m³/s
Desv. Est.= 35, 3 m³/s
Coef. Variac. = 79,3%
Q1 =21 m³/s
Q3 = 55 m³/s
Box-and-Whisker Plot
0 50 100 150 200 250 300
QMMGUIDO
Histogram
-10 40 90 140 190 240 290
QMMGUIDO
0
50
100
150
200
250
300
frequ
ency
Density Trace
0 50 100 150 200 250 300
QMMGUIDO
0
2
4
6
8
10(X 0,001)
dens
ity
Información obtenida de la muestra.X: Caudal medio mensual, en la estación GuidoRegistro de 528 meses (44 años)
10
Caso 4: La resistencia del hormigón
Histograma
Tensión
frequ
ency
150 200 250 300 350 400 4500
10
20
30
40
Polígono de frecuencias
Tensión
Por
cent
aje
150 200 250 300 350 400 4500
5
10
15
20
25
Curva de densidad empírica
Tensión
dens
ity
150 200 250 300 350 400 4500
2
4
6
8(X 0,001)
Histograma y curva normal
Tensión (kg/cm²)
frequ
ency
150 200 250 300 350 400 4500
10
20
30
40
Resistencia a compresión del hormigón a la edad de 28 días, en kgf/cm². Resultados obtenidos por alumnos del ciclo 2004 en el laboratorio de ensayos del ITIEM.
¿Normalidad?
11
Distribución de las observaciones individuales: Formas
0 5 10 15 20 25
Sesgo derechoMedia > Moda
μ
SimetríaMedia = Moda
μ
0 5 10 15 20 25 30
Sesgo izquierdoMedia < Moda
μ
¿Qué tanto se aproxima a la normalidad?
12
2. Distribuciones fundamentales de muestreo
Aplicación al caso de la media muestral
13
Población & Muestra
Población(Parámetros)
Muestra(Estadísticas)
μ
x
Total de observaciones que nos interesan para el estudio(finitas – infinitas)
14
Base conceptual para muestrear poblaciones
Se extraen todas las muestras posibles de tamaño n.
i
123...k
1x2x3x
kx...
ix1x
M2
M3Mi
Mk
M1
2x
3x
kx
ixx
fr
15
1x
M2M3Mi
Mk
M1
2x
3x
kx
ix
Comparación de las distribuciones de frecuencias
x
x
j123...n
...
xj
x1x2x3
xn
i123...k
1x2x3x
kx...
ix
X
X
xM
16
Muestreo Aleatorio
Definición
Sean X1, X2, ... , Xn variables aleatorias independientes, cada una con la misma distribución de probabilidad f(x).Definimos entonces a X1, X2, ... , Xn, como una muestra aleatoria de tamaño n de la población f(x) y escribimos su distribución de probabilidad conjunta como:
f(x1, x2, ... , xn) = f(x1) f(x2) ... f(xn)
¡Nuestras inferencias acerca de una población han de ser válidas, siempre que las muestras que obtengamos sean
representativas de tal población!
17
Distribuciones muestrales
Definición
La distribución de probabilidad de una estadística se llama distribución muestral.
Dado que una estadística es una variable aleatoria que depende de la muestra observada, debe tener una
distribución de probabilidad.
18
Comparando distribuciones
xx
Distribución de las observaciones individuales de la población
Distribución de muestreo de la media
μ
Si la estadística fuese la media muestral:
n
XiX
n
i∑== 1
19
¿Se obtiene de una población normal?
Distribuciones de medias muestrales
PREGUNTAS DE INTERÉS
¿Qué tamaño tiene?
La muestra:
20
Media y varianza de la media muestralSi X1, X2, ... , Xn representan una muestra aleatoria de tamaño n, que se toma de una población con media μX y varianza σ²X, entonces:
n
XiX
n
i∑== 1
XX
n
i
n
iX n
nXiE
nXi
nEXE μμμ ==⎟
⎠
⎞⎜⎝
⎛=⎟
⎠
⎞⎜⎝
⎛== ∑∑
==
111)(11
nn
nXiV
nXi
nVXV X
X
n
i
n
iX
22
21
21
2 111)( σσσ ==⎟⎠
⎞⎜⎝
⎛=⎟
⎠
⎞⎜⎝
⎛== ∑∑
==
nX
X
σσ = Error estándar de la media muestral
21
Muestreo de poblaciones Normales( )XXxNX 2,;~ σμ
nX
X
XX2
2 σσ
μμ
=
=
( )XXxNX 2,;~ σμ
n
XiX
n
i∑== 1
0 10 20 30 40 50 600
0,03
0,06
0,09
0,12
0,15
X: Variable en estudio
X: Media muestral
22
Muestreo de poblaciones No Normales
Teorema del Límite Central: Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media μX y varianza finita σ²X, entonces la forma límite de la distribución de:
Conforme n→∞, es la distribución normal estándar:
Z ~ N (0; 1)
n
XZX
X
σμ−
=
X ~ No normal o Desconocida
¿ n →∞ ? n ≥ 30 Muestras grandes y pequeñas