tema 3: estimación estadística de modelos probabilistas. (segunda...

37
Tema 3: Estimaci´ on estad´ ıstica de modelos probabilistas. (segunda parte) Estructura de este tema: 1 ecnicas de muestreo y estimaci´ on puntual. 2 Estimaci´ on por intervalos de confianza. 3 Contrastes de hip´ otesis. Probabilidad y Estad´ ıstica. Profesora: Eva Tour´ ıs Estimaci´ on por intervalos de confianza

Upload: others

Post on 26-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Tema 3: Estimacion estadıstica de modelosprobabilistas.

(segunda parte)

Estructura de este tema:

1 Tecnicas de muestreo y estimacion puntual.

2 Estimacion por intervalos de confianza.

3 Contrastes de hipotesis.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 1

Page 2: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Planteamiento del problema

Sea X1, . . . ,Xn una m.a. de una poblacion X con funcion dedistribucion Fθ, siendo θ un parametro desconocido: X ∼ Fθ.

La estimacion puntual nos proporciona un valor concreto comoaproximacion de un parametro desconocido: θ. Sin embargo, engeneral no se precisa la incertidumbre existente en dichaestimacion.

La estimacion por intervalos de confianza nos proporciona unintervalo de valores donde el parametro θ se puede encontrar,especificando ademas el grado de fiabilidad de la estimacion.

Observacion: Cuando decimos que el estimador de µ es, p.e., 7.15, lo que

estamos diciendo en realidad es que es, aproximadamente, 7, 15. Para

cuantificar este “aproximadamente” lo hacemos con los Intervalos de Confianza.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 2

Page 3: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza: Definiciones

Un intervalo de confianza, IC, para el parametro θ es unintervalo, calculado a partir de la muestra , que contiene a θ conun alto grado de fiabilidad.

La formula general de los intervalos que vamos a estudiar es:

IC (θ) = (θ ∓Margen de error)

El margen de error (o error maximo) depende

• de la precision del estimador utilizado,

• del grado de fiabilidad con el que queremos que el intervalocontenga al parametro.

El grado de fiabilidad de que el verdadero valor del parametro seencuentre en el IC construido, se denomina nivel de confianza yse denota por 1− α, donde α es un valor entre 0 y 1 fijadopreviamente.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 3

Page 4: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

El nivel de confianza 1− α es la probabilidad de que θ seencuentre en el intervalo construido (IC):

1− α = P{θ ∈ IC (θ)} = P{θ ∈ (θ ∓Margen de error)}

El nivel de significancia α es la probabilidad de equivocarnos alafirmar que el parametro se encuentra en el IC obtenido:

α = P{θ /∈ IC (θ)} = P{θ /∈ (θ ∓Margen de error)}

Obs: Habitualmente se trabaja con niveles de confianza del 90%(α = 0.1), del 95% (α = 0.05) y del 99% (α = 0.01).

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 4

Page 5: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

¿Como construir Intervalos de Confianza?

Ejemplo “ilustrativo”: IC para la media de una poblacionnormal (con varianza σ2 conocida)

La resistencia de ciertos componentes electricos fabricados en unproceso es una v.a. que sigue una distribucion Normal con mediadesconocida (en ohmios) y desviacion tıpica conocida σ = 0.25ohmios2: X ∼ N(µ, 0.25).

Queremos estimar la concentracion media, µ, con un nivel deconfianza del 95%.

Primer paso: De una muestra de 12 observaciones obtenemos quela concentracion media es x = 24.93. Esto significa que µ ≈ 24.93.

Obs: Por supuesto, µ 6= 24.93. Si tomaramos otras 12 piezas distintas nos

habrıa resultado una estimacion de µ diferente. Un IC es una forma de precisar

que significa µ ≈ 24.93.

Segundo paso: Queremos construir un IC de la forma (x ∓ C )que contenga al verdadero valor µ. ¿Como sera C?...

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 5

Page 6: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Teniendo en cuenta que si X ∼ N(µ, σ), entonces X ∼ N(µ, σ√

n

),

buscamos un numero C tal que:

P{X − C < µ < X + C} = 1− α ⇐⇒P{µ− C < X < µ+ C} = 1− α ⇐⇒

Z= X−µσ/√n∼N(0,1)

P{ −Cσ/√n< Z <

C

σ/√n} = 1− α ⇐⇒

P{Z ≥ C

σ/√n︸ ︷︷ ︸

zα/2

} =α

2=⇒ C = zα/2

σ√n

Por tanto

IC1−α(µ) =(x − zα/2

σ√n, x + zα/2

σ√n

)=(x ∓ zα/2

σ√n︸ ︷︷ ︸

error maximo

)

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 6

Page 7: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Si particularizamos a un nivel de confianza del 95% y tamanomuestral 12, se cumple:

IC95%(µ) = (x ∓ 1.96 · 0.072)

es decir: x − 1.96 · 0.072 < µ < x + 1.96 · 0.072.

Podemos afirmar que, aproximadamente para el 95% de lasmuestras de tamano 12, se cumple que µ ∈ (X ∓ 0.1411).

Decimos que (24.93∓ 0.1411) es un IC para µ a un nivel deconfianza del 95%.

Cuestiones:

• Con los mismos datos del ejemplo anterior calcula los IC cuyosnivel de confianza sean 90% y 99%.

• Si x = 24.93 pero la muestra era de 36 observaciones en lugarde 12. Calcula un IC de nivel 95%.

• Si x = 24.93 con una muestra de 36 observaciones pero σ = 1en lugar de σ = 0.25. Calcula un IC de nivel 95%.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 7

Page 8: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Formula general: Un IC con nivel de confianza 1− α para lamedia de una poblacion normal con σ conocida viene dado por:

IC1−α(µ) =

(x ∓ zα/2

σ√n

)Aparecen tres cantidades variables: la confianza, 1− α; eltamano muestral, n; el error maximo, zα/2

σ√n

.

• A mayor tamano muestral, n, se reduce el intervalo deconfianza (se reduce el error).

• A mayor confianza exigida, 1− α, aumenta el intervalo deconfianza (aumenta el error).

Cualesquiera dos de estas tres cantidades permiten determinar la otra tercera.

Fijado un nivel de confianza, podemos encontrar el tamano de la muestra

necesario para que el error de la estimacion sea tan pequeno como queramos.

Esto ocurre en el resto de los intervalos de confianza que veremos.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 8

Page 9: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Interpretacion del nivel de confianza

• Si para estimar un parametro hemos recogido muchasmuestras, con cada muestra obtendremos distintos intervalosde confianza. Entre estos algunos contendran el verdaderovalor del parametro y otros no.

• Al tomar muchos intervalos, la proporcion de ellos quecontiene al parametro sera aproximadamente el (1− α)100%.

Ejemplo: Se extraen 100 muestras de tamano n = 20 de unapoblacion normal con media µ = 0 y σ = 1.

Para cada muestra se calcula x y el intervalo de confianza para µde nivel 95% (suponemos varianza poblacional conocida) es:

IC95%(µ) =(x ∓ z0.025

σ√n

)=(x ∓ 1.96

1√20

).

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 9

Page 10: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

x(1)1 , . . . , x

(1)20 → IC

(1)95%(µ) =

(x (1) ∓ 1.96/

√20).

x(2)1 , . . . , x

(2)20 → IC

(2)95%(µ) =

(x (2) ∓ 1.96/

√20).

...

x(100)1 , . . . , x

(100)20 → IC

(100)95% (µ) =

(x (100) ∓ 1.96/

√20).

Se representa un histograma de las 100 medias obtenidas, ası como los100 intervalos (en verde si contienen el valor 0 y en rojo si no).

Medias

Frec

uenc

ias

−0.4 −0.2 0.0 0.2 0.4 0.6

05

1015

2025

−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5

−3−2

−10

12

3

Intervalos

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 10

Page 11: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Ejemplo 3.4: Con el fin de determinar las imprecisiones en la velocidadde transmision en un servidor de la universidad, se descarga un fichero de2Mb de el y se anota el tiempo necesario para la descarga. Suponemosque la variable “Tiempo de descarga de ficheros de 2 Mg” sigue unadistribucion Normal con desviacion tıpica de 0, 12 seg2. En el dıa de hoyse extrae una muestra aleatoria de 60 cuyo tiempo medio es de 4, 07 seg.

(a) Hallar un IC del 99% para el tiempo medio de descarga del servidor eldıa de hoy.

(b) Sin realizar los calculos, determinar si un IC del 95% para la mediapoblacional tendrıa mayor, menor o la misma longitud que el de (a).

(c) Se decide que manana se tomara una muestra de 20. Sin realizar loscalculos, determinar si un IC del 99% para el tiempo medio de descargamanana tendrıa mayor, menor o la misma longitud que el de (a).

(d) Se sabe que la desviacion tıpica poblacional para la descarga de hoy

es de 0,15 seg2. Sin realizar los calculos, determinar si un IC del 99%

para el tiempo medio de descarga hoy tendrıa mayor, menor o la misma

longitud que el de (a).

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 11

Page 12: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Siguiente objetivo:

Acabamos de ver como se deduce el IC para el parametro µ de unav.a. X ∼ N(µ, σ), con σ un dato conocido:

IC (µ) =(x − zα/2

σ√n, x + zα/2

σ√n

)=(x ∓ zα/2

σ√n

)La idea es ver como son los IC de los distintos parametrosasociados a las distribuciones que hemos estudiado en clase:

• IC(µ) si X ∼N(µ, σ), con σ un dato desconocido,

• IC(σ) si X ∼N(µ, σ), con µ un dato conocido o desconocido,

• IC(µ) e IC(σ) si X ∼N(µ, σ) con ambos parametros desconocidos.

• IC(p) si X ∼Bernoulli(p)

• IC(λ) si X ∼Poisson(λ)

Todas estos intervalos se “basan” en el intervalo anterior, peronecesitamos estudiar unas “variantes” de la distribucion normal.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 12

Page 13: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Distribuciones asociadas a la normal

Las siguientes distribuciones de probabilidad aparecen de modonatural a partir de muestras de distribuciones normales.

La distribucion χ2 de Pearson

Sean X1, . . . ,Xn v.a. independientes identicamente distribuidas(i.i.d.) con distribucion N(0, 1). La variable aleatoria

∑ni=1 X

2i

sigue una distribucion χ2 de Pearson con n grados de libertad:

n∑i=1

X 2i ∼ χ2

n;α

n→∞⇒ χ2n;α → zα ∼ N(0, 1)

0 2 4 6 80

0.2

0.4

0.6

0.8

1

Densidad de la χ2n

χ21

χ22

χ23

χ24

χ25

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 13

Page 14: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

La distribucion t de Student

Sean Y ,X1, . . . ,Xn v.a.i.i.d. con distribucion N(0, 1). La variable

aleatoriaY√

1n

∑ni=1 X

2i

sigue una distribucion t de Student con n

grados de libertad:

Y√1n

∑ni=1 X

2i

∼ tn;α

n→∞⇒ tn;α → zα ∼ N(0, 1)

−5 0 50

0.1

0.2

0.3

0.4

Densidad de la t

N(0,1)t5

t2

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 14

Page 15: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 15

Page 16: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

La distribucion F de Fisher

Sean X1, . . . ,Xm,Y1, . . . ,Yn v.a.i.i.d. con distribucion N(0, 1). Lav.a.

1m

∑mi=1 X

2i

1n

∑nj=1 Y

2j

sigue una distribucion F de Fisher con m y n grados de libertad:

1m

∑mi=1 X

2i

1n

∑nj=1 Y

2j

∼ Fm,n;α

m, n→∞⇒ Fm,n;α → zα ∼ N(0, 1)

0 1 2 3 4 5 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7Densidad de la F

F5,3

F4,6

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 16

Page 17: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Tablas de la distribucion Fn1,n2

Normal (α = 0.05) y negrita (α = 0.01).

n1 grados de libertad: primer subındice.n2: grados de libertad: segundo subındice.

5

TABLA 4: DISTRIBUCIÓN F DE FISHER

Puntos de Porcentaje de la distr ibución F

5 % (normal) y 1 % (negritas) puntos para la distribución de Fn1 grados delibertad (para el mayor cuadrado medio)

1 2 3 4 5 6 7 8 9 10 11 12 14 16 20 24 30 40 50 75 100 200 5001 161 199 216 225 230 234 237 239 241 242 243 244 245 246 248 249 250 251 252 253 253 254 254 254 1

4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107 6143 6170 6209 6234 6260 6286 6302 6324 6334 6350 6360 63662 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.43 19.45 19.45 19.46 19.47 19.48 19.48 19.49 19.49 19.49 19.50 2

98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.41 99.42 99.43 99.44 99.45 99.46 99.47 99.48 99.48 99.48 99.49 99.49 99.50 99.503 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.71 8.69 8.66 8.64 8.62 8.59 8.58 8.56 8.55 8.54 8.53 8.53 3

34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.13 27.05 26.92 26.83 26.69 26.60 26.50 26.41 26.35 26.28 26.24 26.18 26.15 26.134 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.87 5.84 5.80 5.77 5.75 5.72 5.70 5.68 5.66 5.65 5.64 5.63 4

21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.25 14.15 14.02 13.93 13.84 13.75 13.69 13.61 13.58 13.52 13.49 13.465 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.64 4.60 4.56 4.53 4.50 4.46 4.44 4.42 4.41 4.39 4.37 4.37 5

16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.77 9.68 9.55 9.47 9.38 9.29 9.24 9.17 9.13 9.08 9.04 9.026 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.96 3.92 3.87 3.84 3.81 3.77 3.75 3.73 3.71 3.69 3.68 3.67 6

13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.60 7.52 7.40 7.31 7.23 7.14 7.09 7.02 6.99 6.93 6.90 6.887 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.53 3.49 3.44 3.41 3.38 3.34 3.32 3.29 3.27 3.25 3.24 3.23 7

12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.36 6.28 6.16 6.07 5.99 5.91 5.86 5.79 5.75 5.70 5.67 5.658 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.24 3.20 3.15 3.12 3.08 3.04 3.02 2.99 2.97 2.95 2.94 2.93 8

11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.56 5.48 5.36 5.28 5.20 5.12 5.07 5.00 4.96 4.91 4.88 4.869 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.03 2.99 2.94 2.90 2.86 2.83 2.80 2.77 2.76 2.73 2.72 2.71 9

10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.01 4.92 4.81 4.73 4.65 4.57 4.52 4.45 4.41 4.36 4.33 4.3110 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.86 2.83 2.77 2.74 2.70 2.66 2.64 2.60 2.59 2.56 2.55 2.54 10

10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.60 4.52 4.41 4.33 4.25 4.17 4.12 4.05 4.01 3.96 3.93 3.91

Ejemplo: Para n1 = 9, n2 = 12 grados de libertad: P[ F > 2.80 ] = 0.05 P [ F > 4.39 ] = 0.01

n2 n2 �

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 17

Page 18: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza en poblaciones normales:X ∼ N(µ, σ)

Propiedad: Sea X1, . . . ,Xn una muestra aleatoria de una v.a. X ,tal que X ∼ N(µ, σ). Entonces, los estimadores insesgados µ = Xy σ2 = S2

x son v.a. independientes que verifican:

X ∼ N

(µ,

σ√n

)⇔ X − µ

σ√n

∼ N(0, 1)

X − µSx√n

∼ tn−1

(n − 1) S2x

σ2∼ χ2

n−1

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 18

Page 19: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza en poblaciones normales:X ∼ N(µ, σ)

Intervalos de confianza para la media µ al nivel de confianza1− α:

• Si σ es conocido: recordemos que µ = X y usamos zα/2

IC1−α(µ) =

(x − zα/2

σ√n, x + zα/2

σ√n

)=

(x ∓ zα/2

σ√n

).

• Si σ es desconocido: recordemos ademas que σ = Sx y en lugarde buscar zα/2 en las tablas buscamos tn−1,α/2

IC1−α(µ) =

(x ∓ tn−1;α/2

s√n

)si n ≤ 30

IC1−α(µ) =

(x ∓ zα/2

s√n

)si n > 30

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 19

Page 20: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Ejemplo 3.5: En el estudio de la temperatura maxima que puedealcanzar una resistencia, consideremos la v.a. “tiempo que tardaen alcanzarla”. Se obtiene la siguiente muestra:

1.7 1.6 1.8 1.9 (en segundos)

Asumiendo normalidad en los datos:

(a) Estima el tiempo medio µ para toda la poblacion deresistencias.

La estimacion de µ es la media muestral: µ ≈ µ = x

x =1.7 + 1.6 + 1.8 + 1.9

4= 1.75.

(b) Halla el error tıpico de la estimacion anterior: E.T.(x)=sx√n

s2x =

(1.7− 1.75)2 + (1.6− 1.75)2 + (1.8− 1.75)2 + (1.9− 1.75)2

3= 0.017

Por tanto sx =√

0.017 ≈ 0.13 y E.T.(x)=sx√n

=0.13

2= 0.065.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 20

Page 21: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

(c) Calcula un intervalo de confianza para µ al 90%.

Como t3;0.05 = 2.353

IC90%(µ) = (1.75∓ 2.353× 0.065) = (1.597 , 1.903).

Podemos afirmar que 1.597 < µ < 1.903 con un nivel deconfianza del 90%.

(d) Calcula otro intervalo, pero ahora con un nivel del 95%.

Como t3;0.025 = 3.182, un I.C. con nivel de confianza1− α = 0.95 es

IC95%(µ) = (1.75∓ 3.182× 0.065) = (1.543 , 1.957).

Podemos afirmar que 1.543 < µ < 1.957 con un nivel deconfianza del 95%.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 21

Page 22: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza en poblaciones normales:X ∼ N(µ, σ)

IC para la varianza σ2 al nivel de confianza 1− α:

Recordemos que n−1σ2 S2

x ∼ χ2n−1 y

Pσ2

{χ2n−1;1−α/2 <

(n − 1)S2x

σ2< χ2

n−1;α/2

}= 1− α ⇐⇒

Pσ2

{(n − 1)S2x

χ2n−1;α/2

< σ2 <(n − 1)S2

x

χ2n−1;1−α/2

}= 1− α

Por tanto,

IC1−α(σ2) =

((n − 1)s2

x

χ2n−1;α/2

,(n − 1)s2

x

χ2n−1;1−α/2

)

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 22

Page 23: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Ejemplo 3.2 (cont.): Se contabiliza el tiempo (en milisegundos)de acceso a un registro de una base de datos. Debido aimprecisiones en los aparatos, las medidas tienen distribucionnormal. Se toma una muestra aleatoria de siete tiempos

1, 5 2, 1 1, 9 2, 3 2, 5 3, 2 3, 0 (ms)

Utilizando estos datos (asumiendo normalidad) construye un IC al90% para la desviacion tıpica.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 23

Page 24: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza en poblaciones normales

IC para la diferencia de medias de dos poblaciones normalesindependientes, X ∼ N(µ1, σ) e Y ∼ N(µ2, σ), al nivel deconfianza 1− α:

• Si σ es desconocido: Recordemos que σ = Sx y X−µSx/√n∼ tn−1.

Por lo tanto

IC1−α(µ1 − µ2) =

(x − y ∓ tm+n−2;α/2 sp

√1

m+

1

n

),

donde

s2p =

(m − 1)s21 + (n − 1)s2

2

m + n − 2

es una media ponderada de las cuasivarianzas muestrales

s21 =

1

m − 1

m∑i=1

(xi − x)2 y s22 =

1

n − 1

n∑i=1

(yi − y)2.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 24

Page 25: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Ejemplo 3.6: La resistencia de ciertos componentes electricosfabricados en un proceso es una v.a. que sigue una distribucionNormal. Un sistema acopla 2 componentes en serie, A y B, y serealizo un experimento para comparar la resistencia promedio paracada componente (X e Y respectivamente).Se realizaron 24 observaciones del proceso (doce de ellas para el Ay las otras doce para el B) y se obtuvieron los siguientes datos:

Para A: x = 26.8 ohmios, s2x = 15.57 ohmios2;

Para B: y = 32.6 ohmios, s2y = 17.54 ohmios2.

Queremos saber si estos datos muestrales proporcionan evidenciade que B realmente tiene mayor resistencia o es fruto del azar.Para ello contesta a los siguientes apartados:(a) Calcular un intervalo de confianza del 95% para la diferencia.(Suponer varianzas iguales).(b) Teniendo en cuenta el resultado anterior ¿cual de los doscomponentes tiene mayor resistencia?

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 25

Page 26: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza en poblaciones normales

IC para la diferencia de medias de dos poblaciones normalesindependientes, X ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2), al nivel deconfianza 1− α:

• Si σ1 y σ2 son conocidas

IC1−α(µ1 − µ2) =

(x − y ∓ zα/2

√σ2

1

m+σ2

2

n

).

• Si σ1 y σ2 son desconocidas

IC1−α(µ1 − µ2) =

(x − y ∓ tf ;α/2

√s2

1

m+

s22

n

)

donde f es el entero mas proximo a

(s21m

+s22n

)2

(s21/m)2

m−1+

(s22/n)2

n−1

.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 26

Page 27: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza en poblaciones normales

IC para el cociente de las varianzas de dos poblacionesnormales independientes, X ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2), alnivel de confianza 1− α:

IC1−α

(σ2

1

σ22

)=

(s2

1/s22

Fm−1;n−1;α/2,

s21/s

22

Fm−1;n−1;1−α/2

).

Observacion: Fn1;n2;1−C =1

Fn2;n1;C

Ejemplo 3.4 (cont.): En el estudio sobre la velocidad de transmi-sion en los servidores de la universidad, se quieren comparar dos deellos: Servidor I y Servidor II; para lo que se estudia el “Tiempo dedescarga de ficheros de 2 Mg” en cada uno (asumimos normalidaden los datos). Se realizan 56 observaciones: 31 con el Servidor I y25 con el Servidor II; y se obtienen unas cuasivarianzas de 50 y 35respectivamente. ¿Podemos afirmar, al nivel 90%, que el Servidor Itiene mayor varianza?

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 27

Page 28: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Datos emparejados:

Sea (X1,Y1), . . . , (Xn,Yn) una muestra aleatoria de (X ,Y ) dondeX e Y no son independientes, pero los pares (Xi ,Yi ) sonindependientes entre sı.

Denotemos E (X ) = µ1 y E (Y ) = µ2 y supongamos queD = X − Y ∼ N(µ = µ1 − µ2, σ). EntoncesD1 = X1 − Y1, . . . ,Dn = Xn − Yn es una muestra aleatoria de D.

Podemos construir intervalos de confianza para µ = µ1 − µ2 y paraσ como mostramos en las transparencias correspondientes a unav.a con distribucion: D ∼ N(µ, σ).

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 28

Page 29: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Ejemplo “ilustrativo”: Para comparar la eficiencia de doscompiladores de cierta marca conocida, se consideraron lasvariables:

X =“tiempo de ejecucion (en seg.) para el Compilador A”Y =“tiempo de ejecucion (en seg.) para el Compilador B”.

A continuacion se seleccionaron al azar 14 programas y seejecutaron con cada uno de los compiladores. Los resultadosaparcen en la siguiente tabla:

1 2 3 4 5 6 7 8 9 10 11 12 13 14X 2.9 4.0 3.4 3.2 3.8 5.2 3.9 3.9 2.5 6.5 5.5 4.0 5.3 4.3Y 3.9 3.9 3.3 4.3 3.2 3.5 2.7 2.4 3.6 2.1 4.0 3.9 4.0 2.0

Se desea estudiar si estos datos muestrales permiten concluir queel Compilador B es mas eficiente que el Compilador A.Resolver este apartado suponiendo que la distribucion de lostiempos de ejecucion son Normales

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 29

Page 30: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

El problema se ha reducido a trabajar con una v.a.: D ∼ N(µ, σ);donde µ = µX − µY y σ desconocido, por lo tanto hallamosdi = xi − yi

1 2 3 4 5 6 7 8 9 10 11 12 13 142.9 4.0 3.4 3.2 3.8 5.2 3.9 3.9 2.5 6.5 5.5 4.0 5.3 4.33.9 3.9 3.3 4.3 3.2 3.5 2.7 2.4 3.6 2.1 4.0 3.9 4.0 2.0−1.0 0.1 0.1 −1.1 0.6 1.7 1.2 1.5 −1.1 4.4 1.5 0.1 1.3 2.3

IC90%(µ) =(d ∓ tn−1;α/2 ·

sd√n

)=(d ∓ t13;0.05 ·

sd√14

)donde

d =1

14

14∑i=1

di = 0.83

t13;0.05 = 1.771

sd =

√∑14i=1(di − d)2

13= 1.39

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 30

Page 31: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza para otras distribuciones

Teorema Central del Lımite: Sea X1, . . . ,Xn una muestraaleatoria de una v.a. X (discreta o continua) y n grande. Entonces

X ∼ N(E (X ),

√Var(X )

n

)≡ X − E (X )√

Var(X )n

∼ N(0, 1)

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 31

Page 32: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza para otras distribuciones

Intervalo de confianza al 1− α para el parametro p de unaBernoulli

Sea X1, . . . ,Xn una m.a. de X∼Bernoulli(p). Recordemos queE (X ) = p, V (X ) = p(1− p) y p = X . Entonces

IC1−α(p) =

(x ∓ zα/2

√x(1− x)

n

)(para n grande)

Intervalo para diferencia de proporciones de Bernoullis

Sean X1, . . . ,Xm e Y1, . . . ,Yn m.a.i. de X ∼ Bernoulli(p1) eY ∼ Bernoulli(p2) respectivamente, tal que p1 = X y p2 = Y .Utilizando los intervalos construidos en seccion “correspondiente”obtenemos

IC1−α(p1−p2) =

(x − y ∓ zα/2

√x(1− x)

m+

y(1− y)

n

)(para m yn grandes)

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 32

Page 33: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Ejemplo 3.7: Se van a celebrar unas elecciones y el presidente deun cierto partido polıtico quiere hacer un sondeo de opinion.Despues de extraer una muestra aletoria simple de tamano 1000, seobservo que 550 personas pensaban votarle a el. ¿Podemos afirmarcon un confianza del 99% que dicho presidente sera reelegido?.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 33

Page 34: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Intervalos de confianza para otras distribuciones

Intervalo de confianza al 1− α para el parametro λ de unaPoisson

Sea X1, . . . ,Xn una muestra de X ∼ Pois(λ). Recordemos queE (X ) = V (X ) = λ y λ = X . Entonces

IC1−α(λ) =

(x ∓ zα/2

√x

n

)(para n grande)

Intervalo para diferencia de proporciones de Poissones

Sean X1, . . . ,Xm e Y1, . . . ,Yn m.a.i. de X ∼ Pois(λ1) eY ∼ Pois(λ2) respectivamente, tal que λ1 = X y λ2 = Y .Utilizando los intervalos construidos en seccion “correspondiente”obtenemos

IC1−α(λ1−λ2) =

(x − y ∓ zα/2

√x

m+

y

n

)(para m y n grandes)

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 34

Page 35: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Ejemplo 3.8: Admitiendo que el numero de erratas por pagina decierto libro sigue una distribucion de Poisson, determinar unintervalo de confianza al 95% del numero medio de erratas porpagina que contiene dicho libro, teniendo en cuenta que seeligieron al azar y con reemplazamiento 100 paginas en las que seobservo una media muestral de 0.04 erratas por pagina.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 35

Page 36: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Mınimo tamano muestral

El error cometido al estimar un parametro θ mediante un intervalode confianza IC1−α(θ) es la semilongitud del intervalo.

Observacion: Esta definicion tiene sentido principalmente enintervalos del tipo IC1−α(θ) = (θ ∓ semilongitud).

Objetivo: Determinar el mınimo tamano muestral n necesario paraque el error cometido al estimar θ mediante un intervalo deconfianza sea menor que una cierta cantidad.

Queremos que la estimacion por intervalo de confianza tenga unadeterminada precision.

El valor de n obtenido debe tomarse como orientativo,especialmente cuando la semilongitud del intervalo dependa de lamuestra observada.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 36

Page 37: Tema 3: Estimación estadística de modelos probabilistas. (segunda parte)verso.mat.uam.es/~pablo.fernandez/PREST-15-16-Tema32.pdf · 2018-05-26 · Tema 3: Estimaci on estad stica

Ejemplo 3.9: Supongamos que la altura de los individuos decierta poblacion sigue una distribucion N(µ, 7.5). Hallar el mınimotamano muestral necesario para estimar la altura media con unmargen de error inferior a 2 y con una confianza del 90%.Determinar el error tıpico.

Probabilidad y Estadıstica. Profesora: Eva Tourıs Estimacion por intervalos de confianza 37