estimacion ic

19
Estimación puntual y estimación por intervalos de confianza Proyecto e-Math Financiado por la Secretaría de Estado de Educación y Universidades (MECD) 1 ESTIMACIÓN PUNTUAL Y ESTIMACIÓN POR INTERVALOS DE CONFIANZA Autores: Ángel A. Juan ( a j uan p @ u o c .edu ), Máximo Sedano ( m s edano h@ uo c .e d u ), Alicia Vila ( a v i l a g@ u o c . e d u ). ESQUEMA DE CONTENIDOS Definición Propiedades Estimació n Puntua l Definici ón Estimación por Interva lo Tipos de estimaciones por intervalo Casos prácticos Por la definición Con Minitab INTRODUCCIÓN En este math-block, se pretende conocer y saber calcular las estimaciones puntuales y por intervalo para la media –ya sea conocida o no la

Upload: poolbreak

Post on 21-Nov-2015

287 views

Category:

Documents


0 download

DESCRIPTION

free

TRANSCRIPT

Microsoft Word - Estimacion_IC.doc

ESTIMACIN PUNTUAL Y ESTIMACIN POR INTERVALOS DE CONFIANZAAutores: ngel A. Juan ([email protected]), Mximo Sedano ([email protected]), Alicia Vila([email protected]).ESQUEMA DE CONTENIDOSDefinicin PropiedadesEstimacinPuntualDefinicin

Estimacin porIntervalo

Tipos de estimaciones por intervalo

Casos prcticosPor la definicinCon MinitabINTRODUCCINEn este math-block, se pretende conocer y saber calcular las estimaciones puntuales y por intervalo para la media ya sea conocida o no la desviacin estndar poblacional-, as como las estimaciones para la probabilidad de xito en una binomial.

En el caso en que conozcamos todos los elementos de una poblacin, es sencillo calcular todos los parmetros asociados; sin embargo, en la mayora de casos no ser as, y necesitaremos estimar algunos de ellos a partir de los parmetros de la muestra.

OBJETIVOS Entender los conceptos de estimacin puntual y estimacin por intervalos.Calcular las estimaciones para la media poblacional, tanto en el caso en que la desviacin estndar poblacional sea conocida como en el caso de que sea desconocida.

Calcular las estimaciones (puntuales y por intervalos) para la probabilidad de xito de una binomial. Saber interpretar correctamente los resultados de las estimaciones por intervalos.

CONOCIMIENTOS PREVIOSEs recomendable haber ledo, previamente los math-blocks: Estadstica Descriptiva con Minitab, La distribucin binomial y La distribucin normal.

CONCEPTOS FUNDAMENTALES Qu es una estimacin?Cuando queremos realizar un estudio de una poblacin cualquiera de la que desconocemos sus parmetros, por ejemplo su media poblacional o la probabilidad de xito si la poblacin sigue una distribucin binomial, debemos tomar una muestra aleatoria de dicha poblacin a travs de la cual calcular una aproximacin a dichos parmetros que desconocemos y queremos estimar. Bien, pues esa aproximacin se llama estimacin.

Adems, junto a esa estimacin, y dado que muy probablemente no coincida con el valor real del parmetro, acompaaremos el error aproximado que se comete al realizarla.

Estimacin puntualUna estimacin puntual del valor de un parmetro poblacional desconocido (como puede ser la media , o la desviacin estndar ), es un nmero que se utiliza para aproximar el verdadero

valor de dicho parmetro poblacional. A fin de realizar tal estimacin, tomaremos una muestra de la poblacin y calcularemos el parmetro muestral asociado ( x para la media, s para ladesviacin estndar, etc.). El valor de este parmetro muestral ser la estimacin puntual del parmetro poblacional.

Por ejemplo, supongamos que la compaa Sonytron desea estimar la edad media de los compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y calculan la media de esta muestra, este valor ser un estimador puntual de la media de la poblacin.

Qu propiedades debe cumplir todo buen estimador?

Insesgado: Un estimador es insesgado cuando la media de su distribucin muestralasociada coincide con la media de la poblacin. Esto ocurre, por ejemplo, con el

estimador x , ya que x =

y con estimador p ya que p = p De varianza mnima: La variabilidad de un estimador viene determinada por elcuadrado de su desviacin estndar. En el caso del estimador x , su desviacin estndar

es x =

, tambin llamada error estndar de .nEn el caso del error estndar de p, p =

p*(1 p)nObservar que cuanto mayor sea el tamao de la muestra n , menor ser la variabilidad del estimador x y de p, por tanto, mejor sern nuestras estimaciones.

Estimacin por intervaloDada una poblacin X, que sigue una distribucin cualquiera con media y desviacin estndar .1. Sabemos (por el TCL) que, para valores grandes de n , la media muestral x sigueuna distribucin aproximadamente normal con media

x =

y desviacin estndar

x = .n2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin normal, aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos desviaciones estndar de la media.

De lo anterior se deduce que:

P( 2 x

< x < + 2 x ) = 0,95 ,0,95 = P( x < + 2 x ) P( x < 2 x ) = P( > x 2 x ) P( > x + 2 x )P( x 2 x < < x + 2 x ) = 0,95Por tanto, sta ltima frmula nos da un intervalo de valores tal que la probabilidad de que la media de la poblacin est contenida en l es de 0,95.

Este tipo de intervalos se llaman intervalos de confianza de un parmetro poblacional. El nivel de confianza (1 - ) del intervalo es la probabilidad de que ste contenga al parmetro poblacional. En el ejemplo anterior, el nivel de confianza era del 95% ( = 0,05).

Intervalos de confianza.1. Intervalo de confianza para con conocida.Un vendedor mayorista de partes automotrices necesita una estimacin de la vida media que puede esperar de los limpiaparabrisas en condiciones normales de manejo. La administracin de la empresa ya ha determinado que la desviacin estndar de la vida til de la poblacin es de seis meses. Supongamos que se selecciona una sola muestra aleatoria de 100 limpiaparabrisas, y obtenemos que la vida media de estos 100 limpiaparabrisas es de 21 meses. Se pide calcular un intervalo de confianza del 95% para la vida media de la poblacin de los limpiaparabrisas.

Tenemos X como la distribucin de la vida til en meses de la poblacin de limpiaparabrisas, no sabemos qu distribucin tiene, al igual que desconocemos su media. En este caso s conocemos la desviacin estndar poblacional.

X (, = 6)La media muestral X por el teorema central del lmite se va a aproximar la distribucin normal:

X N ( x

= , x

= / n )Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de toda la poblacin de limpiaparabrisas, es decir para X Z

0,05

= 21 1,96 6 = 21 1,176 = [19,824 ; 22,176]2 n 100

Z = Z 0,052 2

= Z 0,025 = 1,96 , es decir que el valor Z de la tabla de la normal estndar quedeja un rea de 0,9 entre Z Y +Z es Z=1,96. O de otro modo, como el nivel de confianzaes 0,9,

= 0,05 , entonces el valor Z que deja su derecha un rea de

= 0,05 = 0,025 y a la izquierda de Z un rea de = 0,05 = 0,025 es Z=1,96El error mximo de estimacin es la mitad de la longitud del intervalo, E = z(/2) *nCon una confianza del 95%, la vida media de la poblacin de limpiaparabrisas que vende este mayorista est entre 19,824 meses y 22,176 meses.

Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para cada muestra, el 95% de todos los intervalos van a incluir a la vida media poblacional en meses de todos los parabrisas que vende este mayorista.

2. Intervalo de confianza para con desconocida.El administrador de una planta industrial generadora de energa desea estimar, por intervalo, la cantidad de carbn que se consumi por termino medio semanalmente durante ao pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue de 11.400 toneladas, la desviacin estndar muestral 700 toneladas. Cul ser el intervalo de confianza del 95% para el consumo medio semanal durante el ao pasado?. (supongamos normalidad).

Tenemos X como la distribucin de toneladas de carbn consumidas cada semana del ao pasado por la planta de energa y su media y su desviacin estndar desconocidas

X (, )Aunque n < 30, suponemos que la media muestral, X , sigue una distribucin normalX N(x = , Sx = S / n )Para estimar la desviacin estndar poblacional vamos a utilizar la desviacinestndar muestral S que es 700 toneladas.

Por lo tanto, el intervalo de confianza del 95% para el consumo promedio de toneladas de carbn en cada semana del ao pasado, es decir para , ser:

X t(n 1,

) S = 11.400 2,262 700 = 11.400 500,76 = (10.899 ; 11.901)2 n 10Utilizamos la t-Student porque la desviacin estndar poblacional es desconocida. Enlas tablas,

t(10 1, 0,05 2 ) = 2,262 , una t-Student con 10 1 = 9 grados de libertad quedeja su derecha un rea de 0,025.

1 = 0,95

= 0,05

porque el nivel de confianza es deCon una confianza del 95%, el consumo promedio semanal de carbn durante el ao pasado por esta planta de energa estar entre 10.899 toneladas y 11.901 toneladas.

Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para cada muestra, el 95% de todos los intervalos van a incluir al consumo promedio poblacional de toneladas de carbn por semana durante el ao pasado por la planta de energa.

3. Intervalo de confianza para la probabilidad de xito p en una binomial.Durante un ao y medio las ventas han estado disminuyendo de manera coherente en los 1.500 establecimientos de una cadena de comida rpida. Un empresa de consultora ha determinado que el 30% de una muestra de 95 sucursales tiene claros signos de una mala administracin. Construir un intervalo de confianza del 95% para esta porcin.

A la poblacin de todos los establecimientos de sta cadena de comida rpida le vamos a llamar X que seguir una binomial con probabilidad de xito, probabilidad de tener signo de mala administracin, p desconocida. A fin de estimar dicho parmetro, se

toma una muestra de tamao n = 95 y definimos p como la proporcin de xitos en lamuestra. En este caso p es 0,3 y 1- p = 0,7.Como n > 20,

n p 5 y

n (1 p) 5 , entonces la distribucin X esaproximadamente normal, i.e.:

X N(np,

np(1 p) )Como p es desconocida, la aproximaremos por p que es la estimacin puntual de p.Entonces, la proporcin muestral de xitos, que la hemos utilizado para estimar la proporcin de la poblacin tendr la siguiente distribucin:

p N(p,

p(1 p) )n

con:

= p (1 p ) =

0,3 0,7 = 0,047 P n 95Por lo tanto la estimacin del error estndar de la proporcin de establecimientos que tiene claros signos de mala ser 0,057.

El intervalo de confianza del 95% para la probabilidad de xito poblacional p viene dado por:

p Z 2

P = 0,3 1,96 0,047 = 0,3 0,0921 =

[0,20788; 0,39212]

donde Z 2

= Z 0,052

= 1,96 es el valor z*, de manera que el 95% del rea bajo la curvanormal se incluye entre 1,96 y 1,96.

Por lo tanto, con un nivel de confianza del 95%, la proporcin de establecimientos de esta cadena de comida rpida que tiene mala administracin estar entre 0,20788 y

0,39212.

Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de establecimientos con mala administracin

CASOS PRCTICOS CON SOFTWARE1. Imaginemos que trabajamos para una multinacional que se dedica a la venta de pantallas LCD.

El departamento de ingeniera ha realizado pruebas de duracin sobre una muestra aleatoria de 15 pantallas LCD, obteniendo los siguientes resultados (en horas de duracin):

10014,8 8056,2 9166,1 8363,2 8869,7 8680,0 8930,4

8426,8 9488,3 8426,3 8924,6 7911,9 9667,2 8914,2

9220,2

Supondremos que la duracin (en horas de funcionamiento) de estas pantallas es una variable aleatoria que se distribuye de forma normal con desviacin tpica = 500 horas.

a) Hallar un intervalo de confianza, a nivel del 95% para la media poblacional (duracin media de una pantalla LCD).

Seleccionamos Stat > Basic Statistics > 1-Sample Z

Z Confidence IntervalsThe assumed sigma = 500

VariableNMeanStDev SE Mean95,0 % CI

C1158871586 129( 8618;9124)

b) Suponiendo ahora que no conoces la desviacin tpica, halla un intervalo de confianza, a nivel del 95%, para . Compara este nuevo intervalo con el anterior.

Seleccionamos Stat > Basic Statistics > 1-Sample t:

T Confidence Intervals% CI

9195)

Observar que el primer intervalo est contenido en el segundo, i.e.: el segundo intervalo es menos preciso que el primero. Ello es lgico si tenemos en cuenta que para hallar el primer intervalo disponamos de mayor informacin (conocamos el valor de la desviacin tpica), por lo que el resultado es ms preciso.

c) Suponiendo que no conoces la desviacin tpica, halla un intervalo de confianza, a nivel del

90%, para . Compara este intervalo con el obtenido en b).T Confidence IntervalsVariableNMeanStDev SE Mean90,0 % CI

C1158871586 151 (8604;9137)

Ahora, como somos menos exigentes por lo que al nivel de confianza se refiere (hemos pasado del 95 al 90%), lo que cabra esperar es que el intervalo obtenido est contenido dentro del hallado en b). Observar que, en efecto, se cumple esta previsin.

2.Se quiere analizar el ndice de productividad de los trabajadores de una empresa industrial, y se ha tomado una muestra aleatoria de 200 empleados y se ha observado que el 5% de ellos no alcanzan el nivel mnimo productivo que se quiere conseguir de cada uno de ellos. Calcular un intervalo de confianza del 95% para la proporcin de empleados que no llegan al nivel de productividad fijado.

Nos interesa calcular un intervalo de confianza del 95% para la probabilidad p, de no alcanzar el nivel mnimo requerido.

Adems, comprobamos que efectivamente se cumplen las hiptesis de normalidad:

n=200 >>30, n*p= 200*0.09 > 5 y n*p*(1-p) > 5X N(np,

np(1 p) )Como p es desconocida, la aproximaremos por p que es la estimacin puntual de p.Entonces, la proporcin muestral de xitos, que la hemos utilizado para estimar la proporcin de la poblacin tendr la siguiente distribucin:

p N(p,

p(1 p) )nPara calcular el intervalo de confianza, seleccionamos: Stat > Basic Statistics > 1 Proportion:

Seleccionamos Options, con las siguientes condiciones:

Ponemos el nivel de confianza del intervalo, la proporcin del contraste que en este caso no nos interesa porque slo queremos calcular el intervalo de confianza, por lo que en esta opcin pondremos, o por omisin nos pondr, 0,5.

En la alternativa ponemos lo que aparece como estndar, no igual y activamos la casilla de utilizar la normal para calcular el intervalo de confianza.

Confidence Interval for One ProportionTest of p = 0,5 vs p not = 0,5

Sample X N Sample p 95,0 % CI Z-Value P-Value

1 10 200 0,050000 (0,019795; 0,080205) -12,73 0,000

Observamos que el intervalo de confianza est entre 0,0198 y 0,080. Por tanto, podemos concluir que con una confianza del 95%, la proporcin de trabajadores de esta empresa que no alcanzan el nivel mnimo de productividad requerido estar entre el 2% y el 8%.

Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de trabajadores que no alcanzan el nivel mnimo de productividad requerido.

BIBLIOGRAFA[1] Lind, D.; Mason, R.; Marchal, W. (2001): Estadstica para Administracin y Economa. Ed.

Irwin McGraw-Hill.F.

[2] Kvanli, A. (2000) Introduction to Business Statistics South-Western. [3] Johnson, R. (1996): Elementary Statistics. Ed. Duxbury.

[4] Levin, R.; Rubin, D. (1996): Estadstica para Administradores. Ed. Prentice Hall. [5] Farber, E. (1995): A Guide to Minitab. Ed. McGraw-Hill

ENLACES http://oak.cats.ohiou.edu/~wallacd1/shyp.htmlDefinicin y ejemplos de contraste de hiptesis de una poblacin conocida la media y la desviacin estndar de la poblacin.

http://www.unalmed.edu.co/~estadist/C.L.T/T_C_L.htmCaractersticas y applet del Teorema Central del lmite.

http://www.unalmed.edu.co/~estadist/confinterval/intervalconf.htmCaractersticas y applet del concepto de Intervalo de confianza.

http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos_applet.htmlCaractersticas y applet del concepto de Intervalo de confianza.

http://e-stadistica.bio.ucm.es/mod_contraste/contraste_applet.htmlApplet sobre contraste de hiptesis para muestras independientes.

http://oak.cats.ohiou.edu/~wallacd1/ssample.htmlTeoria y ejemplos sobre distribuciones muestrales

http://kitchen.stat.vt.edu/~sundar/java/applets/ Aplicaciones estadsticas con JAVA

http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos_applet.htmlApplets sobre estimacin por intervalos

2 2 2 2

VariableNMeanStDev SE Mean95,0C1158871586 151 (8546;