analisis de replicas (1)

25
1 Recordando la Estadística

Upload: litow810

Post on 31-Jul-2015

42 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Analisis de Replicas (1)

1

Recordando la Estadística

Page 2: Analisis de Replicas (1)

2

Recordando la EstadísticaPoblación:• Es la recolección completa de todas las observaciones

de interés para el investigadorParámetro:• Es una medida descriptiva de la población total de todas

las observaciones de interés para el investigador.Muestra:• Es una parte representativa de la población que se

selecciona para ser estudiadaEstadístico:• Elemento que describe una muestra y sirve como una

estimación del parámetro de la poblaciónVariable:• Es una característica de la población que se esta

analizando en un estudio estadístico.

Page 3: Analisis de Replicas (1)

3

Medidas de Tendencia Central

La media:• Es la medida de tendencia central que normalmente es

considerada como el promedio.• Si tenemos 56, 67, 52, 45, 67, la media se calcula así:

4.575

6745526756__

X

Page 4: Analisis de Replicas (1)

4

Medidas de Tendencia Central

La mediana:• La mitad de las observaciones estará por debajo de ella

y la otra mitad por encima.

• Posición de la mediana = =

• Para los datos ordenados, la mediana es 56 (la tercera posición).

• Si tenemos: 35, 45, 52, 56, 67 y 67. (n es par), promediamos los dos valores medios (52 + 56)/2 = 54

2

1n3

2

15

Page 5: Analisis de Replicas (1)

5

Medidas de Tendencia Central

La moda:• Observación que ocurre con mayor frecuencia.• Si tenemos 35, 45, 52, 56, 67, 67, la moda es 67• Si agregáramos una observación adicional de 56, el

conjunto de datos seria bimodal, con modas 56 y 67.

Page 6: Analisis de Replicas (1)

6

Medidas de Dispersión

• Miden que tanto se dispersan las observaciones alrededor de su media.

El rango:• Es la diferencia entre la observación mas alta y mas baja. • Su desventaja es que considera solo dos observaciones

del total de observaciones.

Page 7: Analisis de Replicas (1)

7

Medidas de Dispersión

La Varianza:• Es el promedio de las desviaciones respecto a su media

elevadas al cuadradoVarianza poblacional:

Varianza de una muestra:

N

x

N

xxxx iN

2223

22

212 ...

11

...2__2__2__

3

2__

2

2__

12

n

Xx

n

XxXxXxXxS

in

Page 8: Analisis de Replicas (1)

8

Medidas de Dispersión

La Varianza:Si tenemos: 87, 120, 54, 92, 73, 80 y 63

La media de los valores observados es de 81.29, contendencia a variar por arriba o debajo de dicha media en21.58

29.81__

X

9.46517

)29.8163(...)29.81120()29.8187( 2222

S

58.219.465 S

Page 9: Analisis de Replicas (1)

9

Intervalos de Confianza

• El teorema del limite central asume que el resultado de tendrá una distribución normal.

• Supongamos que la simulación se esta utilizando para analizar las demoras en un proceso de producción.

• Cada replica independiente del modelo produce una respuesta potencial de la distribución de todas las posibles demoras. Una sola salida, produce solo una muestra de la distribución.

__

X

Page 10: Analisis de Replicas (1)

10

Intervalos de Confianza

• Asumamos 100 puntos estimados del promedio de demora en un proceso esta normalmente distribuido con una media de 40 y una desviación estándar de 12.

• Cien muestras de esta distribución pueden ser distribuidas como siguen

Page 11: Analisis de Replicas (1)

11

Intervalos de Confianza

39 4335 39 43 47 Distribución Normal35 39 43 47 µ = 4035 39 43 47 δ = 12

31 35 38 42 47 5131 34 38 42 46 51

27 31 34 38 42 46 51 5527 30 34 38 42 46 50 5527 30 34 37 41 46 50 55

23 26 30 33 37 41 45 50 54 5819 22 26 29 33 37 41 45 49 54 58 63

14 19 21 25 29 33 37 41 45 49 53 57 63 6912 17 21 25 29 33 37 41 45 49 53 57 61 66

16-20< 16 20-24 24-28 28-32 32-36 36-40 40-44 44-48 48-52 52-56 56-60 60-64 > 64

Page 12: Analisis de Replicas (1)

12

Intervalos de Confianza

• Los principios de inferencia estadística, nos permiten hacer estimaciones de una media verdadera y una varianza 2

• Suponga que los siguientes valores son aleatoriamente seleccionados de la distribución mostrada en el gráfico anterior: 26, 31, 38, 49, 50 y 58.

• Un punto estimado de es designado como:

426

585049383126)6(

__

X

4.15216

])6([)6(

6

1

2__

2

XXi

S

• La varianza de la distribución es aproximada como:

Page 13: Analisis de Replicas (1)

13

Intervalos de Confianza

n

nStnX n

)()(

2

2/1,1

__

6

4.152015.242

16.5284.31

• Como la cantidad de datos (n=6) es menor que 30, usamos un valor t de una distribución t, para construir el intervalo de confianza para el punto estimado ,

• un intervalo de confianza nos dice con que certeza (90%), el parámetro de la media verdadera esta contenida dentro de nuestro intervalo calculado.

Usamos α = 10%

Un 90% de certeza

Page 14: Analisis de Replicas (1)

14

Media Muestral vs. Verdadera

μ= 40

MediaMuestral

MediaPoblacional

_X = 42

Page 15: Analisis de Replicas (1)

15

Intervalos de Confianza

• Que son?– Un intervalo, expresado en el formato (min,

max), el cual provee un estimado realista del valor verdadero de un parámetro del sistema particular tal como el ciclo de tiempo o el promedio diario de atenciones.

• La longitud del intervalo depende del tamaño “n” de la muestra.

• Los niveles típicos son: 90%, 95% y 99%.

Page 16: Analisis de Replicas (1)

16

Intervalos de Confianza

MediaMuestral

MediaVerdadera

95%

90%

u = 40_X = 42

Page 17: Analisis de Replicas (1)

17

Intervalos de Confianza

• El principio del intervalo de confianza puede ser demostrado utilizando los números descritos en la distribución normal anterior.

• El siguiente ejercicio ilustra esta explicación.1) Coloque los números de la distribución normal en 100 papeles

pequeños.2) Ponga los papeles en un contenedor.3) Busque en el contenedor y extraiga seis papeles.4) Registre el número mostrado en cada papel seleccionado.5) Calcule un intervalo de confianza a un 90%, para los seis

valores obtenidos.6) Retorne todos los papeles al contenedor.

Page 18: Analisis de Replicas (1)

18

Intervalos de Confianza

• Si ejecutamos los pasos tres al seis, 100 veces, podemos esperar que 90 de los intervalos de confianza calculados, contienen el parámetro de la media verdadera ( = 40 en este ejemplo).

• Desarrollar el siguiente ejemplo y verifique los resultados para 10 repeticiones.

Page 19: Analisis de Replicas (1)

19

Intervalos de Confianza

)6(__

X )6(2SExp.Valores

SeleccionadosIntervalo

¿Intervalo contiene a = 40?

1

2

3

4

5

6

7

8

9

10

Page 20: Analisis de Replicas (1)

20

Número de Réplicas

• Un método esencial para mejorar la confiabilidad de los resultados es ejecutar múltiples replicas independientes de la simulación.

• Los resultados de múltiples réplicas del modelo deben ser analizados con principios de inferencia estadística para realizar conclusiones validas.

• El ejm. anterior puede ser usado para demostrar el nivel de confianza asociado al numero de replicas necesarias para asegurar la exactitud de (un punto estimado de ) con respecto a la media verdadera de la distribución

Page 21: Analisis de Replicas (1)

21

Número de Réplicas

RandomInput

RandomOutput

La simulación usa el principio RIRO

Page 22: Analisis de Replicas (1)

22

Número de Réplicas

La ecuación para conocer el numero de replicas necesarias es:

2

2/1,1

e

StN n

Donde:N: Numero de replicas necesarias para lograr un nivel de exactitud deseadoS(n): Es un punto estimado de , basado en n replicas del modelo.e: Denota la cantidad de error entre la media estimada y t: Valor critico de la tabla t

Page 23: Analisis de Replicas (1)

23

Número de Réplicas

• Deseamos conocer cuantas replicas del modelo deben ser realizadas para tener un 90% de confianza que nuestra media estimada no varia de la media verdadera por mas de 9 días.

MediaMuestral

MediaVerdadera

e = 9

Page 24: Analisis de Replicas (1)

24

Número de Réplicas

• Estimamos el valor de , seleccionando aleatoriamente seis valores de la distribución (en la simulación esto equivale a realizar 6 replicas independientes del modelo)

• Si los valores seleccionados son 26, 31, 38, 49, 50 y 58• El estimado de la desviación estándar es 12.3• Insertando estos valores en la ecuación anterior, esto nos da N=8.• Implica que si aleatoriamente seleccionamos 8 muestras de la

distribución y calculamos un valor de • Podemos esperar que aproximadamente 90 veces de un total de

100, el valor de no variara de la media verdadera = 40, por mas de 9 días, verificar estos resultados en la siguiente tabla.

2

2/1,1

e

StN n

858.79

)3.12)(015.2(2

N

__

X__

X

Page 25: Analisis de Replicas (1)

25

Número de Réplicas

)8(__

Xexp. Valores

SeleccionadosDentro del limite ± 9?

( = 40)

1

2

3

4

5

6

7

8

9

10

verificar los resultados anteriores en la siguiente tabla: