curso de estadística a distancia el profesor se va por las ramas… los alumnos parecen ausentes…

Post on 25-Jan-2016

218 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Curso de Estadísticaa Distancia

El Profesor se va por las ramas…Los alumnos parecen ausentes…

Contraste de Ajuste

• Se efectúan sobre la forma de la distribución supuestamente generadora de los datos.

• Contrástes Básicos– Chi2 de Pearson– Kolmogorov-Smirnov

• Bases:– Cálculo de un estadístico que posee una distribución conocida, sobre la base de una muestra.

– Verificación de probabilidades. Región Crítica.

Cont. Ajuste Chi2

• Sea una muestra x1, ..,xn, de una variable discreta que se puede acomodar en frecuencias (O1,…,Ok).

• Bajo hipótesis nula cada valor de la variable X poseerá una frecuencia esperada.

• Si la probabilidad de Xi es pi, la frecuencia esperada será npi

Cont. Ajuste Chi2

Cont. Ajuste Chi2

• El estadistico es

• y posee distribución 2 con m grados de libertad, donde:

• m= k-1 si las probabilidades pi son especificadas a priori de la muestra.

• m= k-r-1 si el modelo es especificado sobre la base de estimar por MV r parámetros a partir de la muestra.

k

i EiEiOi

X1

22 )(

Cont. Ajuste Chi2

• Si X2 > 2crítico se rechaza la hipótesis

nula.

Cont. Ajuste Chi2

Cont. KS

• Se aplica únicamente a variables continuas.

• Se ordena la muestra X de menor a mayor

• x(1) <= x(2) <= x(3) <=…<= x(n)

• se construye la función empírica de la muestra

)(

)1()(

)1(

1

/

0

)(

n

rr

xx

xxxnr

xx

xFn

Cont. KS

0.00 10.00 20.00 30.00 40.00 50.00

Valores observados

0.00

0.25

0.50

0.75

1.00

Dis

trib

uci

ón

em

pír

ica

Distribución empírica

Cont. KS

• Sea H0=F(x)=Fn(x)

F(x) modelo propuestoFn(x) distribución empírica

• Se calculaDn=máx|Fn(x)-F(x)|

• La distribución de Dn, bajo H0 es conocida (tabulada).

• Si Dn>Dcrítico la H0 se rechaza.

Cont. KS

Cont.Shapiro y Wilks

• Mide el ajuste de la muestra a una recta al dibujar la distribución empírica en un papel de probabilidad normal

Contrastes de Ajuste

Chi2 para Independencia

Análisis de Tablas de Contingencia

• Interrogantes:• Es posible modelar la generación de viajes solo por tamaño de familia, o debe incluirse los ingresos?

IngresosTamaño de la Familia

menos de 400

400 a 1000

mas de 1000

1 y 2 15 62 123 y 4 47 174 31mas de cuatro 22 112 25

Cantidad de viajes

Probabilidad Conjunta

Viajes realizados al área central por díaNinguno 1 2 3 o más

Posesión de Vehiculos 0 1 2 3Si 1 6 26 34 18No 2 6 25 20 15

Total 150Si 40%No 60%

01

23

1

2

0

10

20

30

40

Viajes al Area Central

1

2

Funciones de Probabilidad Conjunta

Cont. Chi2 Independencia

• Dada una tabla de contingencia (en una visión de probabilidad conjunta), bajo la hipótesis de independencia la probabilidad de cada celda es la multiplicación de las probabilidades marginales.

• Ejemplo:

Cont. Chi2 Independencia

Y1 Y2 Total P marginalX1 10 30 40 0.2X2 110 50 160 0.8Total 120 80 200P marginal 0.6 0.4

Probabilidades bajo independenciaY1 Y2

X1 0.6 * 0.2=0.12 0.4 * 0.2=0.08X2 0.6 * 0.8=0.48 0.4 * 0.8=0.32

EstimadasY1 Y2

X1 24 16X2 96 64

Cont. Chi2 Independencia

X2= (10-24)2/24+(30-16)2/16+(110-96)2/96+(50-64)2/64 = 25,5

2(r-1)x(c-1), 5% = 3,84

X2> 2critico, se rechaza la hipótesis de

independencia.ProbabilidadesY1 Y2

X1 25.0% 75.0% 100%X2 68.8% 31.3% 100%

ChancesY1

X1 0.333 De 0,333 a 1X2 2.200 De 2,2 a 1

Otros Test de Análisis de Tablas de Contingencia

• Test Chi2 de Fisher (distribución exacta)

• Test de Mantel-Haenszel• MH con corrección de Yates• etc

• Test para variables nominales (datos categóricos)

• Test para (datos ordinales)

Tablas de Contingencia 2x2

• Relación de Chances (Odds Ratio)• Producto cruzado

• Interrogante:• ¿Se puede decir que la probabilidades de obtener “esquina” o “Centro” son distintas en Modelo 1 que en modelo”?¿o es sólo producto del azar?

Ejemplo 1 Ejemplo 2VAR 2 VAR 4

VAR 1 Gris Blanco VAR3 Esquina CentroRojo 60 20 Modelo Uno 800 200Verde 45 15 Modelo Dos 450 150

top related