capÍtulo 4 introducción a la estadística. modelos de regresión

37
CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Upload: prudencia-viana

Post on 13-Feb-2015

37 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

CAPÍTULO 4

Introducción a la Estadística.Modelos de regresión

Page 2: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Distribuciones Bidimensionales

Se estudian 2 caracteres estadísticos de la población.

Por ejemplo: Las tallas y pesos de un grupo de personas.

Page 3: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Distribuciones Bidimensionales

¿Qué relación puede haber entre las tallas y los pesos de un grupo de personas?

NO ESTRICTAMENTE FUNCIONAL

Page 4: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Distribuciones Bidimensionales

Francis Galton (1822-1911)

Relación entre las estaturas de padres e hijos.

La estatura de los hijos “regresaba” a la media general.

De aquí el término REGRESIÓN.

Page 5: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Modelos de regresión PROBLEMA

Obtener un modelo matemático que relacione dos o más variables a partir de un número limitado de observaciones.

x x1 x2 … xn

y y1 y2 … yn

Page 6: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Nubes de puntos

-0.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5

-4

-2

2

4

6

8

10

12

14

16

18

x

y

x y

x1 y1

x2 y2

… …

xn yn

Page 7: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Tipos de dependencia

Dependencia funcional exacta

Dependencia estadística o correlación

Independencia

Page 8: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Dependencia funcional Las variables x e y están

relacionadas mediante una fórmula.

A un valor de x le corresponde exactamente un valor de y.

Ejemplo: Altura desde la que cae un cuerpo y tiempo que tarda en llegar al suelo.

( )y f x

Page 9: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Dependencia funcional

-0.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5

-4

-2

2

4

6

8

10

12

14

16

18

x

y

Page 10: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Dependencia funcional

-0.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5

-4

-2

2

4

6

8

10

12

14

16

18

x

y

Page 11: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Dependencia EstadísticaCorrelación Los valores de x e y siguen

pautas similares, pero su relación no es exacta.

Ejemplos: Estatura y peso. Edad del marido y de la mujer. Nivel de lluvias y cosechas.

Page 12: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Dependencia Estadística Positiva Función de regresión: RECTA

-0.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5

-4

-2

2

4

6

8

10

12

14

16

18

x

y

Page 13: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Dependencia Estadística Negativa Función de regresión: RECTA

-9 -8 -7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 8 9

-14

-12

-10

-8

-6

-4

-2

2

4

6

8

10

12

14

x

y

Page 14: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Dependencia Estadística Positiva Función de regresión: Parábola

-0.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5

-4

-2

2

4

6

8

10

12

14

16

18

x

y

Page 15: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Independencia Las variables x e y no tienen

ninguna relación o pauta entre ellas.

Ejemplo: Estatura de los alumnos y calificación en Matemáticas.

Page 16: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Independencia

-8 -6 -4 -2 2 4 6 8 10

-14

-12

-10

-8

-6

-4

-2

2

4

6

8

10

12

14

x

y

Page 17: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Modelos de regresión Problemas Fundamentales:

1. Determinar la función de regresión: recta, parábola, exponencial, potencial, …

2. Medir el nivel de aproximación de dicha función a los puntos.

Page 18: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Parámetros marginales

Partimos de n observaciones efectuadas para las variables x e y.

Calculamos las medias y varianzas marginales.

x x1 x2 … xn

y y1 y2 … yn

Page 19: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Parámetros marginales

Medias:

Varianzas:

1 2 1 1...n n

i in i ix yx x x

x yn n n

2 22 2 2 21 1

n n

i ii ix y

x yS x S y

n n

Page 20: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Covarianza Nos indica si hay (o no)

dependencia lineal entre las variables x e y.

1 1

n n

i i i ii ixy

x x y y x yS x y

n n

Page 21: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Covarianza Si existe dependencia lineal

entre x e y.

Dependencia Directa:

Dependencia Inversa:

Si x e y son independientes.

0xyS

0xyS

0xyS

0xyS

Page 22: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Covarianza

Se expresa en las mismas unidades que las variables.

Ejemplo: x es el peso (en kg) y es la estatura (en cm)

Covarianza se expresa en kg por cm.

Page 23: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Covarianza

Un problema que presenta es que es una magnitud absoluta

No indica si el grado de dependencia entre las variables es elevado.

Sólo nos dice si existe dependencia (o no) y su tipo (directa o inversa)

Page 24: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Coeficiente de correlación lineal

Es una medida del grado de dependencia entre las variables x e y.

xy

x y

SrS S

Page 25: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Coeficiente de correlación lineal

No tiene unidad de medida. Es sólo un número.

Tiene el mismo signo que la covarianza (Sxy).

Porque las desviaciones típicas son positivas:

Sx>0 y Sy>0

xy

x y

SrS S

Page 26: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Coeficiente de correlación lineal

-1 r 1

Cuanto más se aproxime r a 1 o -1 mayor es la dependencia entre x e y.

En tal caso, una recta aproximará casi de forma perfecta la nube de puntos.

xy

x y

SrS S

Page 27: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Coeficiente de correlación lineal

-1 r 1

Si r es próximo a 0, no existirá dependencia lineal.

Aunque puede existir otro tipo de dependencia: polinómica, potencial, exponencial, etc.

xy

x y

SrS S

Page 28: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Función de regresión Función f que aproxime los datos

observados para las variables x e y.

Nube de puntos Tipo de función más adecuada para el ajuste.

( )y f x

Page 29: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Tipos de funciones de regresión

Lineal: f(x) = a + bx

Polinómica: f(x) = ao + a1x + … + anxn

Exponencial: f(x) = aebx

Potencial: f(x) = axb

Page 30: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Ajuste por mínimos cuadrados Se hace mínima la suma de los

cuadrados de las diferencias entre los valores observados (yi) y los valores teóricos f(xi):

2

1

( ( ))n

i ii

y f x

Page 31: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Ajuste por mínimos cuadrados

0.5 1 1.5 2 2.5 3 3.5 4 4.5

2

4

6

8

10

12

14

16

18

x

y

Page 32: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Regresiónexponencial

' ln

' ln

y y

a a

bxy ae

El problema se hace lineal tomando logaritmos: ln ln ln ln lnbx bxy ae a e a bx

' 'y a bx

ln lny a bx

'aa e

Page 33: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Regresiónlineal

y a bx

y a bx

La pendiente es:

La recta pasa por el centro de gravedad de la nube de puntos:

2

xy

x

Sb

S

( , )x y

a y bx

Page 34: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Error Típico o Error Estándar Mide la precisión (bondad) del

ajuste de una función de regresión:

2

1

( ( ))( )

n

i ii

y f xe f

n

Page 35: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Error Típico o Error Estándar Si tenemos varias funciones de ajuste,

se calcula el Error Típico de cada una, y el menor error será el que nos dará la mejor función de ajuste.

El número e(f) no es una medida absoluta de la bondad del ajuste, sino que es una medida para comparar entre varias funciones la mejor.

Page 36: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Regresiónpotencial

' ln

' ln

' ln

y y

a a

x x

by ax

El problema se hace lineal tomando logaritmos: ln ln ln ln ln lnb by ax a x a b x

' ' 'y a bx

ln ln lny a b x

'aa e

Page 37: CAPÍTULO 4 Introducción a la Estadística. Modelos de regresión

Regresiónparabólica

21 2( ) of x a a x a x

21 2

1 1 1

2 31 2

1 1 1 1

2 3 4 21 2

1 1 1 1

n n n

o i i ii i i

n n n n

o i i i i ii i i i

n n n n

o i i i i ii i i i

na a x a x y

a x a x a x x y

a x a x a x x y