estimaciÓn puntual y por intervalo -...

ESTIMACIÓNESTIMACIÓN

puntual y por intervalo

( )

V.E.Rohen

¿Podemos conocer el comportamiento del ser humano?

V.E.Rohen

Podemos usar la información contenida enla muestra para tratar de “adivinaradivinar” algúnaspecto de la población bajo estudio ysustituirla en lo que sería nuestra “verdadverdaddesconocidadesconocida”

Esto, por supuesto,implica que la informaciónque obtenemos denuestras observacionesdebe ser representativarepresentativadel particular aspecto de la población.

V.E.Rohen

Es importante notar que no siempre coincide lainformación que hemos observado con lainformación real de la población.

Sin embargo, es una buena aproximación y lapodemos utilizar para la estimación de lascaracterísticas propias de dicha población.

V.E.Rohen

!

x

!

x

µ

Podemos entonces dar unamedida de dichaincertidumbre:

(Esta medida nos ayudará a crearestimadores por intervalo para medias yproporciones muestrales)

solo meequivoco el5% de lasveces

!

" = # $ ˆ #

V.E.Rohen

La distribución de la muestra y de las“estadísticas” juega un papel crítico en lainferencia estadística porque la bondad delos estimadores se mide en base a la mediay varianza de éstas.

Muestra

Estadística

Estimador

Distribución

V.E.Rohen

Las muestras son tomadas para Estimarparámetros y para Probar Hipótesis acercade los parámetros

Un parámetro es una medida numérica de algúnaspecto de la población

Cuando no tenemos la información sobre toda lapoblación es necesario estimar el valor delparámetro en base a la información de la muestrasobre dicho aspecto de interés y tenemos lo que sellama “estadística”

V.E.Rohen

Supongamos que tomamos una muestra de unapoblación y obtenemos la media muestral.Si tomamos otra muestra obtendremos otrovalor de la media muestral, y así sucesivamente.

Todas estas medias serán variables aleatoriasque tienen asociada una función de densidad.

Lo mismo sucede con las varianzas muestralesque cambian su valor de muestra a muestra ycon las proporciones muestrales.

V.E.Rohen

Pero el promedio de todas las medias muestrales posiblescon o sin reemplazo (cada una del mismo tamaño n) esigual a la media poblacional µ.

La fluctuación en el número que representa a estas mediasmuestrales se ve en un histograma de todos los posiblesvalores de éstas. Estas fluctuaciones son menores que lasfluctuaciones de los valores en la población.

Estas variaciones entre las medias muestrales se conocecomo error estándar de la media y se obtiene como

!

"X

="

n

V.E.Rohen

Se puede observar que si el tamaño de la muestraaumenta, el error estándar disminuye.

¿Qué distribución sigue la media muestral?

Teorema Central del Límite

Consideremos muestras aleatorias de una poblacióncon media µ y varianza σ 2, conforme el tamaño de lamuestra crece, la distribución de las mediasmediasmuestralesmuestrales es aproximadamente NORMAL, sinimportar la forma de la distribución de la población.

V.E.Rohen

Recordemos que la media muestral Xobtenida de una muestra aleatoria detamaño n de una población con media µ yvarianza σ 2, tiene una distribución normalcon media µ y varianza σ 2/ n

DISTRIBUCIÓN DE LA MEDIAMUESTRAL

X

V.E.Rohen

Vamos a poder medir qué tanto se desvía lamedia muestral de la media poblacional através del valor ZZ, de la siguiente manera

!

Z =X "µ

#X

=X "µ

#

n

=X "µ( ) n

#

Es fácil ver que la ZZ, que es una estadarizaciónde la media muestral, sigue una distribuciónN(0,1)

V.E.Rohen

43210-1-2-3

0.5

0.4

0.3

0.2

0.1

0.0

C1

Density

V.E.Rohen

Con frecuencia estamos interesados endeterminar si la media de una población esdiferente de la media de otra poblacion.

Si la Población 1 tiene una media µ 1 y unadesviación estándar σ1 y la Población 2 tieneuna media µ 2 y una desviación estándar σ2 ,nos gustaría determinar si µ 1= µ 2 o si una esmayor que la otra (µ 1> µ 2 ó µ 1< µ 2 )

V.E.Rohen

para lo cual nos basamos en la evidencia quetenemos al considerar dos muestras aleatorias,una de cada una de las poblaciones y observarla diferencia de las medias muestrales .

Como son variables aleatoriasnormalmente distribuidas, entonces

es una variable aleatoria distribuidanormalmente con media

y con varianza .

!

X1 " X 2

!

X1 y X 2

21µµ !

!

"1

2

n1

+"2

2

n2!

X1 " X 2

V.E.Rohen

En muchas ocasiones no conocemos laprobabilidad de éxito en un experimentobinomial y tiene que ser estimado de lamuestra. Como p es la probabilidad de éxitosen cualquier prueba, en una población finita,p mide la proporción de éxitos en esapoblación.

V.E.Rohen

Entonces tiene una distribución

normal con media p y varianza p(1-p)/n

siempre y cuando np(1-p)>5 (Rosner)!

ˆ p =X

n

Así, si en una muestra de tamaño n de unapoblación, X es el número de éxitos,estimamos la proporción de éxitos en estamuestra:

!

X

n

V.E.Rohen

Muchos problemas están enfocados endeterminar si la proporción de gente o cosas enuna población que posee cierta característica esla misma que la proporción que posee dichacaracterística en otra población: p1 = p2, ó si esmayor: p1 > p2 ó menor: p1 < p2.

Cuando desconocemos estas proporciones esnecesario tomar una muestra de cada poblacióny estimar dichas proporciones

V.E.Rohen

Tomemos dos muestras de tamaño n1 y n2 delas dos poblaciones bajo estudio.

Encontremos el número (X1) de individuos enla muestra de la Población 1 que posee lacaracterística de interés y el número (X2) deindividuos en la muestra de la Población 2que poseen la misma característica, entonceslas proporciones muestrales

!

ˆ p 1 =X1

n1

y ˆ p 2 =X2

n2

serán los estimadores de p1 y p2 respectivamente

V.E.Rohen

La distribución de la variable aleatoria

es aproximadamente normal con media

y varianza

21 ˆˆ pp !

!

" ˆ p 1# ˆ p 2

2=

p1(1# p

1)

n1

+p

2(1# p

2)

n2

21pp !

siempre y cuando n1 p1(1- p1) > 5, n2 p2(1- p2) > 5(Rosner)

V.E.Rohen

Distribuciones de MuestreoDistribuciones de Muestreonxxx ,,,

21L

x

! 2

iz !" 2

z

22

11

!

!

w

w

V.E.Rohen

Algunas distribuciones que se derivan de ladistribución normal

Si entonces

!

Z2~ "

1

2)1,0(~ NZ

Si para i=1,...,n, entonces)1,0(~ NZi !

=

n

i

niZ

1

22~ "

V.E.Rohen

2~

nW !)1,0(~ NZ

!

Z

W

n

~ tn

Si y y W1 y W2 son

independientes, entonces

2

1~

nW ! 2

2~

mW !

!

W1

n

W2

m

~ Fn,m

V.E.Rohen

Si nuestro interés es sobre la medida devariación, tendremos que hacer uso de laexpresión

donde S 2 es la varianza muestral.

Esta estadística tiene una distribución

con n-1 grados de libertad

!

(n "1)S2

# 2

2

1!n"

V.E.Rohen

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100

x

f(x)

Distribución χ 2Sesgo derecho

Un solo parámetro (gradosde libertad)

Modela entre otras cosas aespacios continuos entreeventos discretos

Modela la distribución dela varianza muestral

V.E.Rohen

Cuando desconocemos la varianza poblacional, espreciso estimarla.

La expresión

tiene que ser sustituida por

Esta estadística tiene una distribución t con n-1grados de libertad

!

Z =X "µ

#

n

!

T =X "µ

s

n

V.E.Rohen

Distribución t- Student

Simétrica conrespecto al cero

Un solo parámetro(grados de libertad)

Cuando los grados delibertad aumentanconverge a una normalestánadar

Tiene las colas máspesadas que la normal

-0.09

-0.04

0.01

0.06

0.11

0.16

0.21

0.26

0.31

0.36

-5.3 -3.3 -1.3 0.7 2.7 4.7

V.E.Rohen

La comparación de dos varianzas poblacionales serealiza por medio del cociente de las mismas.

La estadística de prueba que involucra estecociente incluye las varianzas muestrales de lasiguiente manera:

!

F =

(n1"1)S

1

2

#1

2

$

% &

'

( ) n

1"1( )

(n2"1)S

2

2

#2

2

$

% &

'

( ) n

2"1( )

que tiene una distribución F con (n1-1) y (n2-1)grados de libertad

V.E.Rohen

Distribución F

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97

Tiene una pareja de grados delibertad

Tiene sesgo derecho y tomasolo valores positivos

Se usa para contrastar varianzas

V.E.Rohen

Existen dos tipos principales de estimadores:

Estimadores puntuales que consisten en un sólovalor o estadística muestral que se usa para estimarel verdadero valor del parámetro poblacional

!

X = 1n

Xi" µ

!

S2 =

X " X( )2

#n "1

2!

!

X

n

p

V.E.Rohen

Estimadores por Intervalo que consiste en dosvalores entre los cuales esperamos que seencuente el verdadero valor del parámetro

!

ˆ " 1

< " < ˆ " 2

1!̂

2!̂donde y son función del estimador

puntual de θ

V.E.Rohen

Algunas propiedades deseables de los estimadoresson las siguientes:

Que en promedio los estimadores sean igual alparámetro poblacional que estiman. Es decir, queel estimador sea Insesgado

Que tenga varianza mas pequeña que otrosestimadores. A esta propiedad se le llama eficiencia.

Consistencia cuando la diferencia entre elestimador y el parámetro se hace mas pequeñaconforme el tamaño de muestra crece.

V.E.Rohen

donde k es un factor que especifica los límites deconfianza en la distribución de (porcentiles dela Normal o de la t-Student: zα/2 ó tα /2 )

Cuando tratamos de evaluar la bondad de unestimador, tratamos de poner alguna cota en elerror de estimación que pudiera ocurrir. Esteerror de estimación es , y debe ser menor a

!

ˆ " !

ˆ " #"

!

k "ˆ # ( )

Si tiene una distribución Normal con mediay varianza , entonces k toma el valor 1.96para un nivel de confianza (1−α) de 0.95 (ó 95%)

!

"ˆ #

2

!

!

ˆ "

V.E.Rohen

La amplitud de un intervalo de confianzapara la media poblacional depende de tresfactores:

- el nivel de confianza

- la desviación estándar poblacional

- el tamaño de muestra.

V.E.Rohen

V.E.Rohen

Propiedades que satisface un intervalo de confianza.

1. Mientras mayor sea el nivel de confianza (1-α) ,mayor será el valor de zα /2 y más amplio será elintervalo de confianza, manteniendo constantes lavarianza y el tamaño de muestra.

2. Mientras mas pequeña sea la desviación estándar,el intervalo será mas angosto.

3. Conforme el tamaño de muestra se incrementa, laamplitud del intervalo de confianza será menor.

V.E.Rohen

El valor α indica la proporción de veces quesupondremos incorrectamente que el intervalocontiene el parámetro poblacional.

La interpretación del intervalo de confianza paraµ es como sigue:

de una gran cantidad de intervalos que seconstruyan para el parámetro poblacional µ ,100(1−α)% contendrán a µ dentro de los límitesencontrados.

V.E.Rohen

(Intervalos de Confianza)(Intervalos de Confianza)

!

µ

.. .. ..... .

.

V.E.Rohen

Intervalos de confianza del 95% para el parámetrode una exponencial con media β=1

V.E.Rohen

Aclaremos que aunque no conozcamos el valorreal de µ, éste es una cantidad fija y constante.

Puede suceder que µ se encuentre entre ypero también puede suceder que NO se encuentreentre esos dos valores, y sería incorrecto asignaruna probabilidad a cualquiera de estasposibilidades, aún cuando µ permanezcadesconocida

!

ˆ µ 1

!

ˆ µ 2

V.E.Rohen

Así, un intervalo de confianza para µ del 100(1−α)%está dado por

!

X " Z# / 2

$

n,X + Z# / 2

$

n

%

& '

(

) *

cuando σ es conocida, pero si ésta es desconocida(casi siempre), se sustituye por su estimadorpuntual y el intervalo queda de la forma

!

X " t(# / 2),n"1

s

n,X + t

(# / 2),n"1

s

n

$

% &

'

( )

si si nn es muy grande se puede aproximar la es muy grande se puede aproximar la ttpor medio de la normalpor medio de la normal

V.E.Rohen

Similarmente, un intervalo de confianza del100(1−α)% para la proporción p de unapoblación estará dado por

!

ˆ p " Z# / 2

ˆ p (1" ˆ p )

n, ˆ p + Z# / 2

ˆ p (1" ˆ p )

n

$

% &

'

( )

donde

!

ˆ p =X

n

Siempre y cuando cuando np > 5 y n(1-p) > 5

V.E.Rohen

De manera similar podemos construirintervalos de confianza para la varianzapoblacional

Usaremos el hecho de que tiene unadistribución χ2

ν,

de donde es fácilmente verificable que elintervalo de confianza tiene la forma!

(n "1)S2

# 2

!

(n "1)S2

#(1"$ / 2),n"12

,(n "1)S2

#($ / 2),n"12

%

& '

(

) *

V.E.Rohen

Tamaño de Muestra

Si queremos que nuestro error de estimación seaa lo más ε , entonces

!

" = Z# / 2$

n

%

& '

(

) *

!

n = Z" / 22 # 2

$2

Para un nivel de cofianza fijo, un tamaño deerror pequeño incrementará el tamaño demuestra.

V.E.Rohen

Aumento del tamaño de muestra para un nivelde confianza del 95%, y una varianza de 1,cuando el error de estimación disminuye.

V.E.Rohen

Referencias:

http://www.hrc.es/bioest/M_docente.html

Zar, Jerrold H.- Biostatistical Analysis.- 4rd ed.- PrenticeHall, Inc

Rosner, B.- Fundamentals of Biostatistics. 6th Ed.Brooks/Cole Publishing Co., 2006

V.E.Rohen

estimaciÓn puntual y por intervalo -...

Documents