curso de estadística a distancia el profesor se va por las ramas… los alumnos parecen ausentes…

22

Upload: angela-lara-acuna

Post on 25-Jan-2016

218 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…
Page 2: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Curso de Estadísticaa Distancia

El Profesor se va por las ramas…Los alumnos parecen ausentes…

Page 3: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Contraste de Ajuste

• Se efectúan sobre la forma de la distribución supuestamente generadora de los datos.

• Contrástes Básicos– Chi2 de Pearson– Kolmogorov-Smirnov

• Bases:– Cálculo de un estadístico que posee una distribución conocida, sobre la base de una muestra.

– Verificación de probabilidades. Región Crítica.

Page 4: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. Ajuste Chi2

• Sea una muestra x1, ..,xn, de una variable discreta que se puede acomodar en frecuencias (O1,…,Ok).

• Bajo hipótesis nula cada valor de la variable X poseerá una frecuencia esperada.

• Si la probabilidad de Xi es pi, la frecuencia esperada será npi

Page 5: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. Ajuste Chi2

Page 6: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. Ajuste Chi2

• El estadistico es

• y posee distribución 2 con m grados de libertad, donde:

• m= k-1 si las probabilidades pi son especificadas a priori de la muestra.

• m= k-r-1 si el modelo es especificado sobre la base de estimar por MV r parámetros a partir de la muestra.

k

i EiEiOi

X1

22 )(

Page 7: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. Ajuste Chi2

• Si X2 > 2crítico se rechaza la hipótesis

nula.

Page 8: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. Ajuste Chi2

Page 9: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. KS

• Se aplica únicamente a variables continuas.

• Se ordena la muestra X de menor a mayor

• x(1) <= x(2) <= x(3) <=…<= x(n)

• se construye la función empírica de la muestra

)(

)1()(

)1(

1

/

0

)(

n

rr

xx

xxxnr

xx

xFn

Page 10: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. KS

0.00 10.00 20.00 30.00 40.00 50.00

Valores observados

0.00

0.25

0.50

0.75

1.00

Dis

trib

uci

ón

em

pír

ica

Distribución empírica

Page 11: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. KS

• Sea H0=F(x)=Fn(x)

F(x) modelo propuestoFn(x) distribución empírica

• Se calculaDn=máx|Fn(x)-F(x)|

• La distribución de Dn, bajo H0 es conocida (tabulada).

• Si Dn>Dcrítico la H0 se rechaza.

Page 12: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. KS

Page 13: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont.Shapiro y Wilks

• Mide el ajuste de la muestra a una recta al dibujar la distribución empírica en un papel de probabilidad normal

Page 14: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Contrastes de Ajuste

Chi2 para Independencia

Page 15: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Análisis de Tablas de Contingencia

• Interrogantes:• Es posible modelar la generación de viajes solo por tamaño de familia, o debe incluirse los ingresos?

IngresosTamaño de la Familia

menos de 400

400 a 1000

mas de 1000

1 y 2 15 62 123 y 4 47 174 31mas de cuatro 22 112 25

Cantidad de viajes

Page 16: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Probabilidad Conjunta

Viajes realizados al área central por díaNinguno 1 2 3 o más

Posesión de Vehiculos 0 1 2 3Si 1 6 26 34 18No 2 6 25 20 15

Total 150Si 40%No 60%

01

23

1

2

0

10

20

30

40

Viajes al Area Central

1

2

Page 17: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Funciones de Probabilidad Conjunta

Page 18: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. Chi2 Independencia

• Dada una tabla de contingencia (en una visión de probabilidad conjunta), bajo la hipótesis de independencia la probabilidad de cada celda es la multiplicación de las probabilidades marginales.

• Ejemplo:

Page 19: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. Chi2 Independencia

Y1 Y2 Total P marginalX1 10 30 40 0.2X2 110 50 160 0.8Total 120 80 200P marginal 0.6 0.4

Probabilidades bajo independenciaY1 Y2

X1 0.6 * 0.2=0.12 0.4 * 0.2=0.08X2 0.6 * 0.8=0.48 0.4 * 0.8=0.32

EstimadasY1 Y2

X1 24 16X2 96 64

Page 20: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Cont. Chi2 Independencia

X2= (10-24)2/24+(30-16)2/16+(110-96)2/96+(50-64)2/64 = 25,5

2(r-1)x(c-1), 5% = 3,84

X2> 2critico, se rechaza la hipótesis de

independencia.ProbabilidadesY1 Y2

X1 25.0% 75.0% 100%X2 68.8% 31.3% 100%

ChancesY1

X1 0.333 De 0,333 a 1X2 2.200 De 2,2 a 1

Page 21: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Otros Test de Análisis de Tablas de Contingencia

• Test Chi2 de Fisher (distribución exacta)

• Test de Mantel-Haenszel• MH con corrección de Yates• etc

• Test para variables nominales (datos categóricos)

• Test para (datos ordinales)

Page 22: Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…

Tablas de Contingencia 2x2

• Relación de Chances (Odds Ratio)• Producto cruzado

• Interrogante:• ¿Se puede decir que la probabilidades de obtener “esquina” o “Centro” son distintas en Modelo 1 que en modelo”?¿o es sólo producto del azar?

Ejemplo 1 Ejemplo 2VAR 2 VAR 4

VAR 1 Gris Blanco VAR3 Esquina CentroRojo 60 20 Modelo Uno 800 200Verde 45 15 Modelo Dos 450 150