estimaciÓn puntual y por intervalo -...

46
ESTIMACIÓN ESTIMACIÓN puntual y por intervalo ( ) V.E.Rohen

Upload: duongtuyen

Post on 04-Feb-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

ESTIMACIÓNESTIMACIÓN

puntual y por intervalo

( )

V.E.Rohen

Page 2: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

¿Podemos conocer el comportamiento del ser humano?

V.E.Rohen

Page 3: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Podemos usar la información contenida enla muestra para tratar de “adivinaradivinar” algúnaspecto de la población bajo estudio ysustituirla en lo que sería nuestra “verdadverdaddesconocidadesconocida”

Esto, por supuesto,implica que la informaciónque obtenemos denuestras observacionesdebe ser representativarepresentativadel particular aspecto de la población.

V.E.Rohen

Page 4: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Es importante notar que no siempre coincide lainformación que hemos observado con lainformación real de la población.

Sin embargo, es una buena aproximación y lapodemos utilizar para la estimación de lascaracterísticas propias de dicha población.

V.E.Rohen

!

x

!

x

µ

Page 5: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Podemos entonces dar unamedida de dichaincertidumbre:

(Esta medida nos ayudará a crearestimadores por intervalo para medias yproporciones muestrales)

solo meequivoco el5% de lasveces

!

" = # $ ˆ #

V.E.Rohen

Page 6: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

La distribución de la muestra y de las“estadísticas” juega un papel crítico en lainferencia estadística porque la bondad delos estimadores se mide en base a la mediay varianza de éstas.

Muestra

Estadística

Estimador

Distribución

V.E.Rohen

Page 7: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Las muestras son tomadas para Estimarparámetros y para Probar Hipótesis acercade los parámetros

Un parámetro es una medida numérica de algúnaspecto de la población

Cuando no tenemos la información sobre toda lapoblación es necesario estimar el valor delparámetro en base a la información de la muestrasobre dicho aspecto de interés y tenemos lo que sellama “estadística”

V.E.Rohen

Page 8: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Supongamos que tomamos una muestra de unapoblación y obtenemos la media muestral.Si tomamos otra muestra obtendremos otrovalor de la media muestral, y así sucesivamente.

Todas estas medias serán variables aleatoriasque tienen asociada una función de densidad.

Lo mismo sucede con las varianzas muestralesque cambian su valor de muestra a muestra ycon las proporciones muestrales.

V.E.Rohen

Page 9: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Pero el promedio de todas las medias muestrales posiblescon o sin reemplazo (cada una del mismo tamaño n) esigual a la media poblacional µ.

La fluctuación en el número que representa a estas mediasmuestrales se ve en un histograma de todos los posiblesvalores de éstas. Estas fluctuaciones son menores que lasfluctuaciones de los valores en la población.

Estas variaciones entre las medias muestrales se conocecomo error estándar de la media y se obtiene como

!

"X

="

n

V.E.Rohen

Page 10: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Se puede observar que si el tamaño de la muestraaumenta, el error estándar disminuye.

¿Qué distribución sigue la media muestral?

Teorema Central del Límite

Consideremos muestras aleatorias de una poblacióncon media µ y varianza σ 2, conforme el tamaño de lamuestra crece, la distribución de las mediasmediasmuestralesmuestrales es aproximadamente NORMAL, sinimportar la forma de la distribución de la población.

V.E.Rohen

Page 11: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Recordemos que la media muestral Xobtenida de una muestra aleatoria detamaño n de una población con media µ yvarianza σ 2, tiene una distribución normalcon media µ y varianza σ 2/ n

DISTRIBUCIÓN DE LA MEDIAMUESTRAL

X

V.E.Rohen

Page 12: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Vamos a poder medir qué tanto se desvía lamedia muestral de la media poblacional através del valor ZZ, de la siguiente manera

!

Z =X "µ

#X

=X "µ

#

n

=X "µ( ) n

#

Es fácil ver que la ZZ, que es una estadarizaciónde la media muestral, sigue una distribuciónN(0,1)

V.E.Rohen

Page 13: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

43210-1-2-3

0.5

0.4

0.3

0.2

0.1

0.0

C1

Density

V.E.Rohen

Page 14: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Con frecuencia estamos interesados endeterminar si la media de una población esdiferente de la media de otra poblacion.

Si la Población 1 tiene una media µ 1 y unadesviación estándar σ1 y la Población 2 tieneuna media µ 2 y una desviación estándar σ2 ,nos gustaría determinar si µ 1= µ 2 o si una esmayor que la otra (µ 1> µ 2 ó µ 1< µ 2 )

V.E.Rohen

Page 15: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

para lo cual nos basamos en la evidencia quetenemos al considerar dos muestras aleatorias,una de cada una de las poblaciones y observarla diferencia de las medias muestrales .

Como son variables aleatoriasnormalmente distribuidas, entonces

es una variable aleatoria distribuidanormalmente con media

y con varianza .

!

X1 " X 2

!

X1 y X 2

21µµ !

!

"1

2

n1

+"2

2

n2!

X1 " X 2

V.E.Rohen

Page 16: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

En muchas ocasiones no conocemos laprobabilidad de éxito en un experimentobinomial y tiene que ser estimado de lamuestra. Como p es la probabilidad de éxitosen cualquier prueba, en una población finita,p mide la proporción de éxitos en esapoblación.

V.E.Rohen

Page 17: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Entonces tiene una distribución

normal con media p y varianza p(1-p)/n

siempre y cuando np(1-p)>5 (Rosner)!

ˆ p =X

n

Así, si en una muestra de tamaño n de unapoblación, X es el número de éxitos,estimamos la proporción de éxitos en estamuestra:

!

X

n

V.E.Rohen

Page 18: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Muchos problemas están enfocados endeterminar si la proporción de gente o cosas enuna población que posee cierta característica esla misma que la proporción que posee dichacaracterística en otra población: p1 = p2, ó si esmayor: p1 > p2 ó menor: p1 < p2.

Cuando desconocemos estas proporciones esnecesario tomar una muestra de cada poblacióny estimar dichas proporciones

V.E.Rohen

Page 19: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Tomemos dos muestras de tamaño n1 y n2 delas dos poblaciones bajo estudio.

Encontremos el número (X1) de individuos enla muestra de la Población 1 que posee lacaracterística de interés y el número (X2) deindividuos en la muestra de la Población 2que poseen la misma característica, entonceslas proporciones muestrales

!

ˆ p 1 =X1

n1

y ˆ p 2 =X2

n2

serán los estimadores de p1 y p2 respectivamente

V.E.Rohen

Page 20: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

La distribución de la variable aleatoria

es aproximadamente normal con media

y varianza

21 ˆˆ pp !

!

" ˆ p 1# ˆ p 2

2=

p1(1# p

1)

n1

+p

2(1# p

2)

n2

21pp !

siempre y cuando n1 p1(1- p1) > 5, n2 p2(1- p2) > 5(Rosner)

V.E.Rohen

Page 21: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Distribuciones de MuestreoDistribuciones de Muestreonxxx ,,,

21L

x

! 2

iz !" 2

z

22

11

!

!

w

w

V.E.Rohen

Page 22: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Algunas distribuciones que se derivan de ladistribución normal

Si entonces

!

Z2~ "

1

2)1,0(~ NZ

Si para i=1,...,n, entonces)1,0(~ NZi !

=

n

i

niZ

1

22~ "

V.E.Rohen

Page 23: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

2~

nW !)1,0(~ NZ

!

Z

W

n

~ tn

Si y y W1 y W2 son

independientes, entonces

2

1~

nW ! 2

2~

mW !

!

W1

n

W2

m

~ Fn,m

V.E.Rohen

Page 24: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Si nuestro interés es sobre la medida devariación, tendremos que hacer uso de laexpresión

donde S 2 es la varianza muestral.

Esta estadística tiene una distribución

con n-1 grados de libertad

!

(n "1)S2

# 2

2

1!n"

V.E.Rohen

Page 25: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100

x

f(x)

Distribución χ 2Sesgo derecho

Un solo parámetro (gradosde libertad)

Modela entre otras cosas aespacios continuos entreeventos discretos

Modela la distribución dela varianza muestral

V.E.Rohen

Page 26: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Cuando desconocemos la varianza poblacional, espreciso estimarla.

La expresión

tiene que ser sustituida por

Esta estadística tiene una distribución t con n-1grados de libertad

!

Z =X "µ

#

n

!

T =X "µ

s

n

V.E.Rohen

Page 27: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Distribución t- Student

Simétrica conrespecto al cero

Un solo parámetro(grados de libertad)

Cuando los grados delibertad aumentanconverge a una normalestánadar

Tiene las colas máspesadas que la normal

-0.09

-0.04

0.01

0.06

0.11

0.16

0.21

0.26

0.31

0.36

-5.3 -3.3 -1.3 0.7 2.7 4.7

V.E.Rohen

Page 28: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

La comparación de dos varianzas poblacionales serealiza por medio del cociente de las mismas.

La estadística de prueba que involucra estecociente incluye las varianzas muestrales de lasiguiente manera:

!

F =

(n1"1)S

1

2

#1

2

$

% &

'

( ) n

1"1( )

(n2"1)S

2

2

#2

2

$

% &

'

( ) n

2"1( )

que tiene una distribución F con (n1-1) y (n2-1)grados de libertad

V.E.Rohen

Page 29: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Distribución F

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97

Tiene una pareja de grados delibertad

Tiene sesgo derecho y tomasolo valores positivos

Se usa para contrastar varianzas

V.E.Rohen

Page 30: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Existen dos tipos principales de estimadores:

Estimadores puntuales que consisten en un sólovalor o estadística muestral que se usa para estimarel verdadero valor del parámetro poblacional

!

X = 1n

Xi" µ

!

S2 =

X " X( )2

#n "1

2!

!

X

n

p

V.E.Rohen

Page 31: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Estimadores por Intervalo que consiste en dosvalores entre los cuales esperamos que seencuente el verdadero valor del parámetro

!

ˆ " 1

< " < ˆ " 2

1!̂

2!̂donde y son función del estimador

puntual de θ

V.E.Rohen

Page 32: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Algunas propiedades deseables de los estimadoresson las siguientes:

Que en promedio los estimadores sean igual alparámetro poblacional que estiman. Es decir, queel estimador sea Insesgado

Que tenga varianza mas pequeña que otrosestimadores. A esta propiedad se le llama eficiencia.

Consistencia cuando la diferencia entre elestimador y el parámetro se hace mas pequeñaconforme el tamaño de muestra crece.

V.E.Rohen

Page 33: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

donde k es un factor que especifica los límites deconfianza en la distribución de (porcentiles dela Normal o de la t-Student: zα/2 ó tα /2 )

Cuando tratamos de evaluar la bondad de unestimador, tratamos de poner alguna cota en elerror de estimación que pudiera ocurrir. Esteerror de estimación es , y debe ser menor a

!

ˆ " !

ˆ " #"

!

k "ˆ # ( )

Si tiene una distribución Normal con mediay varianza , entonces k toma el valor 1.96para un nivel de confianza (1−α) de 0.95 (ó 95%)

!

"ˆ #

2

!

!

ˆ "

V.E.Rohen

Page 34: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

La amplitud de un intervalo de confianzapara la media poblacional depende de tresfactores:

- el nivel de confianza

- la desviación estándar poblacional

- el tamaño de muestra.

V.E.Rohen

Page 35: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

V.E.Rohen

Page 36: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Propiedades que satisface un intervalo de confianza.

1. Mientras mayor sea el nivel de confianza (1-α) ,mayor será el valor de zα /2 y más amplio será elintervalo de confianza, manteniendo constantes lavarianza y el tamaño de muestra.

2. Mientras mas pequeña sea la desviación estándar,el intervalo será mas angosto.

3. Conforme el tamaño de muestra se incrementa, laamplitud del intervalo de confianza será menor.

V.E.Rohen

Page 37: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

El valor α indica la proporción de veces quesupondremos incorrectamente que el intervalocontiene el parámetro poblacional.

La interpretación del intervalo de confianza paraµ es como sigue:

de una gran cantidad de intervalos que seconstruyan para el parámetro poblacional µ ,100(1−α)% contendrán a µ dentro de los límitesencontrados.

V.E.Rohen

Page 38: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

(Intervalos de Confianza)(Intervalos de Confianza)

!

µ

.. .. ..... .

.

V.E.Rohen

Page 39: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Intervalos de confianza del 95% para el parámetrode una exponencial con media β=1

V.E.Rohen

Page 40: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Aclaremos que aunque no conozcamos el valorreal de µ, éste es una cantidad fija y constante.

Puede suceder que µ se encuentre entre ypero también puede suceder que NO se encuentreentre esos dos valores, y sería incorrecto asignaruna probabilidad a cualquiera de estasposibilidades, aún cuando µ permanezcadesconocida

!

ˆ µ 1

!

ˆ µ 2

V.E.Rohen

Page 41: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Así, un intervalo de confianza para µ del 100(1−α)%está dado por

!

X " Z# / 2

$

n,X + Z# / 2

$

n

%

& '

(

) *

cuando σ es conocida, pero si ésta es desconocida(casi siempre), se sustituye por su estimadorpuntual y el intervalo queda de la forma

!

X " t(# / 2),n"1

s

n,X + t

(# / 2),n"1

s

n

$

% &

'

( )

si si nn es muy grande se puede aproximar la es muy grande se puede aproximar la ttpor medio de la normalpor medio de la normal

V.E.Rohen

Page 42: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Similarmente, un intervalo de confianza del100(1−α)% para la proporción p de unapoblación estará dado por

!

ˆ p " Z# / 2

ˆ p (1" ˆ p )

n, ˆ p + Z# / 2

ˆ p (1" ˆ p )

n

$

% &

'

( )

donde

!

ˆ p =X

n

Siempre y cuando cuando np > 5 y n(1-p) > 5

V.E.Rohen

Page 43: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

De manera similar podemos construirintervalos de confianza para la varianzapoblacional

Usaremos el hecho de que tiene unadistribución χ2

ν,

de donde es fácilmente verificable que elintervalo de confianza tiene la forma!

(n "1)S2

# 2

!

(n "1)S2

#(1"$ / 2),n"12

,(n "1)S2

#($ / 2),n"12

%

& '

(

) *

V.E.Rohen

Page 44: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Tamaño de Muestra

Si queremos que nuestro error de estimación seaa lo más ε , entonces

!

" = Z# / 2$

n

%

& '

(

) *

!

n = Z" / 22 # 2

$2

Para un nivel de cofianza fijo, un tamaño deerror pequeño incrementará el tamaño demuestra.

V.E.Rohen

Page 45: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Aumento del tamaño de muestra para un nivelde confianza del 95%, y una varianza de 1,cuando el error de estimación disminuye.

V.E.Rohen

Page 46: ESTIMACIÓN puntual y por intervalo - lcolladotor.github.iolcolladotor.github.io/courses/Courses/MEyAdDG/day2/Estimación.pdf · parámetro en base a la información de la muestra

Referencias:

http://www.hrc.es/bioest/M_docente.html

Zar, Jerrold H.- Biostatistical Analysis.- 4rd ed.- PrenticeHall, Inc

Rosner, B.- Fundamentals of Biostatistics. 6th Ed.Brooks/Cole Publishing Co., 2006

V.E.Rohen