estimaciÓn puntual y por intervalo -...
TRANSCRIPT
ESTIMACIÓNESTIMACIÓN
puntual y por intervalo
( )
V.E.Rohen
¿Podemos conocer el comportamiento del ser humano?
V.E.Rohen
Podemos usar la información contenida enla muestra para tratar de “adivinaradivinar” algúnaspecto de la población bajo estudio ysustituirla en lo que sería nuestra “verdadverdaddesconocidadesconocida”
Esto, por supuesto,implica que la informaciónque obtenemos denuestras observacionesdebe ser representativarepresentativadel particular aspecto de la población.
V.E.Rohen
Es importante notar que no siempre coincide lainformación que hemos observado con lainformación real de la población.
Sin embargo, es una buena aproximación y lapodemos utilizar para la estimación de lascaracterísticas propias de dicha población.
V.E.Rohen
!
x
!
x
µ
Podemos entonces dar unamedida de dichaincertidumbre:
(Esta medida nos ayudará a crearestimadores por intervalo para medias yproporciones muestrales)
solo meequivoco el5% de lasveces
!
" = # $ ˆ #
V.E.Rohen
La distribución de la muestra y de las“estadísticas” juega un papel crítico en lainferencia estadística porque la bondad delos estimadores se mide en base a la mediay varianza de éstas.
Muestra
Estadística
Estimador
Distribución
V.E.Rohen
Las muestras son tomadas para Estimarparámetros y para Probar Hipótesis acercade los parámetros
Un parámetro es una medida numérica de algúnaspecto de la población
Cuando no tenemos la información sobre toda lapoblación es necesario estimar el valor delparámetro en base a la información de la muestrasobre dicho aspecto de interés y tenemos lo que sellama “estadística”
V.E.Rohen
Supongamos que tomamos una muestra de unapoblación y obtenemos la media muestral.Si tomamos otra muestra obtendremos otrovalor de la media muestral, y así sucesivamente.
Todas estas medias serán variables aleatoriasque tienen asociada una función de densidad.
Lo mismo sucede con las varianzas muestralesque cambian su valor de muestra a muestra ycon las proporciones muestrales.
V.E.Rohen
Pero el promedio de todas las medias muestrales posiblescon o sin reemplazo (cada una del mismo tamaño n) esigual a la media poblacional µ.
La fluctuación en el número que representa a estas mediasmuestrales se ve en un histograma de todos los posiblesvalores de éstas. Estas fluctuaciones son menores que lasfluctuaciones de los valores en la población.
Estas variaciones entre las medias muestrales se conocecomo error estándar de la media y se obtiene como
!
"X
="
n
V.E.Rohen
Se puede observar que si el tamaño de la muestraaumenta, el error estándar disminuye.
¿Qué distribución sigue la media muestral?
Teorema Central del Límite
Consideremos muestras aleatorias de una poblacióncon media µ y varianza σ 2, conforme el tamaño de lamuestra crece, la distribución de las mediasmediasmuestralesmuestrales es aproximadamente NORMAL, sinimportar la forma de la distribución de la población.
V.E.Rohen
Recordemos que la media muestral Xobtenida de una muestra aleatoria detamaño n de una población con media µ yvarianza σ 2, tiene una distribución normalcon media µ y varianza σ 2/ n
DISTRIBUCIÓN DE LA MEDIAMUESTRAL
X
V.E.Rohen
Vamos a poder medir qué tanto se desvía lamedia muestral de la media poblacional através del valor ZZ, de la siguiente manera
!
Z =X "µ
#X
=X "µ
#
n
=X "µ( ) n
#
Es fácil ver que la ZZ, que es una estadarizaciónde la media muestral, sigue una distribuciónN(0,1)
V.E.Rohen
43210-1-2-3
0.5
0.4
0.3
0.2
0.1
0.0
C1
Density
V.E.Rohen
Con frecuencia estamos interesados endeterminar si la media de una población esdiferente de la media de otra poblacion.
Si la Población 1 tiene una media µ 1 y unadesviación estándar σ1 y la Población 2 tieneuna media µ 2 y una desviación estándar σ2 ,nos gustaría determinar si µ 1= µ 2 o si una esmayor que la otra (µ 1> µ 2 ó µ 1< µ 2 )
V.E.Rohen
para lo cual nos basamos en la evidencia quetenemos al considerar dos muestras aleatorias,una de cada una de las poblaciones y observarla diferencia de las medias muestrales .
Como son variables aleatoriasnormalmente distribuidas, entonces
es una variable aleatoria distribuidanormalmente con media
y con varianza .
!
X1 " X 2
!
X1 y X 2
21µµ !
!
"1
2
n1
+"2
2
n2!
X1 " X 2
V.E.Rohen
En muchas ocasiones no conocemos laprobabilidad de éxito en un experimentobinomial y tiene que ser estimado de lamuestra. Como p es la probabilidad de éxitosen cualquier prueba, en una población finita,p mide la proporción de éxitos en esapoblación.
V.E.Rohen
Entonces tiene una distribución
normal con media p y varianza p(1-p)/n
siempre y cuando np(1-p)>5 (Rosner)!
ˆ p =X
n
Así, si en una muestra de tamaño n de unapoblación, X es el número de éxitos,estimamos la proporción de éxitos en estamuestra:
!
X
n
V.E.Rohen
Muchos problemas están enfocados endeterminar si la proporción de gente o cosas enuna población que posee cierta característica esla misma que la proporción que posee dichacaracterística en otra población: p1 = p2, ó si esmayor: p1 > p2 ó menor: p1 < p2.
Cuando desconocemos estas proporciones esnecesario tomar una muestra de cada poblacióny estimar dichas proporciones
V.E.Rohen
Tomemos dos muestras de tamaño n1 y n2 delas dos poblaciones bajo estudio.
Encontremos el número (X1) de individuos enla muestra de la Población 1 que posee lacaracterística de interés y el número (X2) deindividuos en la muestra de la Población 2que poseen la misma característica, entonceslas proporciones muestrales
!
ˆ p 1 =X1
n1
y ˆ p 2 =X2
n2
serán los estimadores de p1 y p2 respectivamente
V.E.Rohen
La distribución de la variable aleatoria
es aproximadamente normal con media
y varianza
21 ˆˆ pp !
!
" ˆ p 1# ˆ p 2
2=
p1(1# p
1)
n1
+p
2(1# p
2)
n2
21pp !
siempre y cuando n1 p1(1- p1) > 5, n2 p2(1- p2) > 5(Rosner)
V.E.Rohen
Distribuciones de MuestreoDistribuciones de Muestreonxxx ,,,
21L
x
! 2
iz !" 2
z
22
11
!
!
w
w
V.E.Rohen
Algunas distribuciones que se derivan de ladistribución normal
Si entonces
!
Z2~ "
1
2)1,0(~ NZ
Si para i=1,...,n, entonces)1,0(~ NZi !
=
n
i
niZ
1
22~ "
V.E.Rohen
2~
nW !)1,0(~ NZ
!
Z
W
n
~ tn
Si y y W1 y W2 son
independientes, entonces
2
1~
nW ! 2
2~
mW !
!
W1
n
W2
m
~ Fn,m
V.E.Rohen
Si nuestro interés es sobre la medida devariación, tendremos que hacer uso de laexpresión
donde S 2 es la varianza muestral.
Esta estadística tiene una distribución
con n-1 grados de libertad
!
(n "1)S2
# 2
2
1!n"
V.E.Rohen
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100
x
f(x)
Distribución χ 2Sesgo derecho
Un solo parámetro (gradosde libertad)
Modela entre otras cosas aespacios continuos entreeventos discretos
Modela la distribución dela varianza muestral
V.E.Rohen
Cuando desconocemos la varianza poblacional, espreciso estimarla.
La expresión
tiene que ser sustituida por
Esta estadística tiene una distribución t con n-1grados de libertad
!
Z =X "µ
#
n
!
T =X "µ
s
n
V.E.Rohen
Distribución t- Student
Simétrica conrespecto al cero
Un solo parámetro(grados de libertad)
Cuando los grados delibertad aumentanconverge a una normalestánadar
Tiene las colas máspesadas que la normal
-0.09
-0.04
0.01
0.06
0.11
0.16
0.21
0.26
0.31
0.36
-5.3 -3.3 -1.3 0.7 2.7 4.7
V.E.Rohen
La comparación de dos varianzas poblacionales serealiza por medio del cociente de las mismas.
La estadística de prueba que involucra estecociente incluye las varianzas muestrales de lasiguiente manera:
!
F =
(n1"1)S
1
2
#1
2
$
% &
'
( ) n
1"1( )
(n2"1)S
2
2
#2
2
$
% &
'
( ) n
2"1( )
que tiene una distribución F con (n1-1) y (n2-1)grados de libertad
V.E.Rohen
Distribución F
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97
Tiene una pareja de grados delibertad
Tiene sesgo derecho y tomasolo valores positivos
Se usa para contrastar varianzas
V.E.Rohen
Existen dos tipos principales de estimadores:
Estimadores puntuales que consisten en un sólovalor o estadística muestral que se usa para estimarel verdadero valor del parámetro poblacional
!
X = 1n
Xi" µ
!
S2 =
X " X( )2
#n "1
2!
!
X
n
p
V.E.Rohen
Estimadores por Intervalo que consiste en dosvalores entre los cuales esperamos que seencuente el verdadero valor del parámetro
!
ˆ " 1
< " < ˆ " 2
1!̂
2!̂donde y son función del estimador
puntual de θ
V.E.Rohen
Algunas propiedades deseables de los estimadoresson las siguientes:
Que en promedio los estimadores sean igual alparámetro poblacional que estiman. Es decir, queel estimador sea Insesgado
Que tenga varianza mas pequeña que otrosestimadores. A esta propiedad se le llama eficiencia.
Consistencia cuando la diferencia entre elestimador y el parámetro se hace mas pequeñaconforme el tamaño de muestra crece.
V.E.Rohen
donde k es un factor que especifica los límites deconfianza en la distribución de (porcentiles dela Normal o de la t-Student: zα/2 ó tα /2 )
Cuando tratamos de evaluar la bondad de unestimador, tratamos de poner alguna cota en elerror de estimación que pudiera ocurrir. Esteerror de estimación es , y debe ser menor a
!
ˆ " !
ˆ " #"
!
k "ˆ # ( )
Si tiene una distribución Normal con mediay varianza , entonces k toma el valor 1.96para un nivel de confianza (1−α) de 0.95 (ó 95%)
!
"ˆ #
2
!
!
ˆ "
V.E.Rohen
La amplitud de un intervalo de confianzapara la media poblacional depende de tresfactores:
- el nivel de confianza
- la desviación estándar poblacional
- el tamaño de muestra.
V.E.Rohen
V.E.Rohen
Propiedades que satisface un intervalo de confianza.
1. Mientras mayor sea el nivel de confianza (1-α) ,mayor será el valor de zα /2 y más amplio será elintervalo de confianza, manteniendo constantes lavarianza y el tamaño de muestra.
2. Mientras mas pequeña sea la desviación estándar,el intervalo será mas angosto.
3. Conforme el tamaño de muestra se incrementa, laamplitud del intervalo de confianza será menor.
V.E.Rohen
El valor α indica la proporción de veces quesupondremos incorrectamente que el intervalocontiene el parámetro poblacional.
La interpretación del intervalo de confianza paraµ es como sigue:
de una gran cantidad de intervalos que seconstruyan para el parámetro poblacional µ ,100(1−α)% contendrán a µ dentro de los límitesencontrados.
V.E.Rohen
(Intervalos de Confianza)(Intervalos de Confianza)
!
µ
.. .. ..... .
.
V.E.Rohen
Intervalos de confianza del 95% para el parámetrode una exponencial con media β=1
V.E.Rohen
Aclaremos que aunque no conozcamos el valorreal de µ, éste es una cantidad fija y constante.
Puede suceder que µ se encuentre entre ypero también puede suceder que NO se encuentreentre esos dos valores, y sería incorrecto asignaruna probabilidad a cualquiera de estasposibilidades, aún cuando µ permanezcadesconocida
!
ˆ µ 1
!
ˆ µ 2
V.E.Rohen
Así, un intervalo de confianza para µ del 100(1−α)%está dado por
!
X " Z# / 2
$
n,X + Z# / 2
$
n
%
& '
(
) *
cuando σ es conocida, pero si ésta es desconocida(casi siempre), se sustituye por su estimadorpuntual y el intervalo queda de la forma
!
X " t(# / 2),n"1
s
n,X + t
(# / 2),n"1
s
n
$
% &
'
( )
si si nn es muy grande se puede aproximar la es muy grande se puede aproximar la ttpor medio de la normalpor medio de la normal
V.E.Rohen
Similarmente, un intervalo de confianza del100(1−α)% para la proporción p de unapoblación estará dado por
!
ˆ p " Z# / 2
ˆ p (1" ˆ p )
n, ˆ p + Z# / 2
ˆ p (1" ˆ p )
n
$
% &
'
( )
donde
!
ˆ p =X
n
Siempre y cuando cuando np > 5 y n(1-p) > 5
V.E.Rohen
De manera similar podemos construirintervalos de confianza para la varianzapoblacional
Usaremos el hecho de que tiene unadistribución χ2
ν,
de donde es fácilmente verificable que elintervalo de confianza tiene la forma!
(n "1)S2
# 2
!
(n "1)S2
#(1"$ / 2),n"12
,(n "1)S2
#($ / 2),n"12
%
& '
(
) *
V.E.Rohen
Tamaño de Muestra
Si queremos que nuestro error de estimación seaa lo más ε , entonces
!
" = Z# / 2$
n
%
& '
(
) *
!
n = Z" / 22 # 2
$2
Para un nivel de cofianza fijo, un tamaño deerror pequeño incrementará el tamaño demuestra.
V.E.Rohen
Aumento del tamaño de muestra para un nivelde confianza del 95%, y una varianza de 1,cuando el error de estimación disminuye.
V.E.Rohen
Referencias:
http://www.hrc.es/bioest/M_docente.html
Zar, Jerrold H.- Biostatistical Analysis.- 4rd ed.- PrenticeHall, Inc
Rosner, B.- Fundamentals of Biostatistics. 6th Ed.Brooks/Cole Publishing Co., 2006
V.E.Rohen