relación entre la capacidad vital forzada y el volumen espiratorio forzado en un segundo

18
Estudio de un modelo de regresión lineal simple Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo Jesús Armand Calejero Román Jesús Domingo Barrero

Upload: jesus-armand-calejero-roman

Post on 04-Jul-2015

2.908 views

Category:

Education


4 download

DESCRIPTION

Trabajo para la asignatura de modelos de regresión (3º estadística)

TRANSCRIPT

Page 1: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Estudio de un modelo de regresión lineal simple

Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Jesús Armand Calejero Román Jesús Domingo Barrero

Page 2: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

2

Introducción. El siguiente estudio tiene como finalidad estudia la relación entre la capacidad vital forzada y el volumen espiratorio forzado en un segundo.

• Volumen Espiratorio Forzado (VE1): es la cantidad de aire expulsado durante el primer segundo de la espiración máxima, realizada tras una inspiración máxima.

• Capacidad Vital Forzada (FVC): similar a la capacidad vital (VC), pero la maniobra es forzada y con la máxima rapidez que el paciente pueda producir. Se emplea esta capacidad debido a que en ciertas patologías, es posible que la capacidad de aire forzada de los pulmones puede ser menor a la capacidad vital durante una exhalación más lenta.

El siguiente estudio tiene la finalidad de comprobar si existe algún tipo de relación entre estas dos medidas a fin de poder crear un modelo.

Page 3: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

3

Estudio En primer lugar vamos a ver el comportamiento de los datos usando el diagrama

de puntos:

Se observa relación entre las dos variables de tipo lineal de forma clara.

Page 4: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

4

Continuamos con el estudio de regresión. El coeficiente de correlación de Pearson próximo a 1 nos ofrece una alta relación (positiva) entre las variables. El valor de la R^2 nos informa de la proporción de la varianza de Y que viene explicada por la varianza de X. Obtenemos una VNE por el modelo de 9.193, un R^2 igual a 0.866 con el que podemos explicar en un 86.6% la variabilidad del FVC con nuestro modelo.

Con esta F y su p-valor podemos rechazar la hipótesis nula que dice que el coeficiente B1= 0.

El valor de B1 es 1,139, además al tener un p-valor < 0.05 rechazamos Ho (B0 = 0). Por el contrario observamos que el término independiente tiene un p-valor superior a 0.05 con lo que podríamos aceptar la hipótesis de que Bo= 0. En este caso podríamos más adelante analizar como se comportaría el modelo y=b1x prescindiendo del término independiente.

Page 5: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

5

Diagnosis del modelo. Estudio de la homocedasticidad con el siguiente gráfico.

Se puede observar cierta forma cuadrática en el modelo. Más adelante procederemos al estudio de este posible aspecto en nuestros datos.

Page 6: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

6

En lo referente a la normalidad, el gráfico muestra que sí hay algún valor que están comprendido entre -2 y 2.

Page 7: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

7

Nos queda estudiar los valores atípicos e influyentes. En el gráfico de dispersión

no había ningún dato que destacara. Realizamos un estudio de la Distancia de Cook, obteniendo los siguientes resultados:

Observamos que hay algún valor con un Residuo eliminado estudentizado

elevado. Se podría estudiar el modelo sin dicho valor.

No hay ningún valor próximo a 1 lo que implica que no hay valores atípicos.

Realizamos un estudio P-P de los residuos para asegurarnos. El gráfico no

muestra ningún valor que se salga de la normalidad.

Page 8: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

8

Page 9: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

9

Estudio de un modelo cuadrático. Para ello vamos a crear la variable Z que será el resultado de elevar al cuadrado FEV_1. Con ello obtendremos una parte cuadrática que añadir al modelo.

Page 10: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

10

Veamos el resumen del análisis de la regresión. Vamos a intentar modelizar un modelo de la forma: FVC= Bo + B1FEV_1 + B2Z

En este modelo se obtiene un R^2 = 0.875 y un R^2 corregido = 0.871. Estos datos son mejores que los obtenidos en el modelo lineal. Con este modelo podemos explicar en un 87.5% la variabilidad del FVC. También observamos una VNE=8.569 (también menor que en el modelo anterior).

Veamos los coeficientes.

Obtenemos un p-valor = 0.471 >0.05 en B1 con lo que se acepta la hipótesis de

que B1=0. Este valor nos reforzaría la teoría de que estamos frente a un modelo cuadrático.

Page 11: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

11

Diagnosis del modelo.

Estudio de la homocedasticidad con el siguiente gráfico.

Ya no es tan clara la forma cuadrática, por lo demás se comporta bien. Es

posible que exista un valor un poco anómalo (el alejado por la parte derecha).

Page 12: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

12

En el histograma podemos ver que por la cola derecha algunos valores se

escapan del 2.

Page 13: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

13

Valores atípicos e influyentes + Distancia de Cook.

Parece que los mínimos mejoran muy poco frente al modelo anterior y los

máximos empeoran sensiblemente. Podría ser provocado por ese valor que se ve en el diagrama de puntos un poco alejado.

En el gráfico de puntos para la distancia de Cook sí observamos un valor que,

aunque no es superior a 1 sí está alejado del resto de valores.

Page 14: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

14

Estudio del modelo cuadrático corregido. Como en el estudio anterior se podía aceptar la hipótesis de que B1=0 vamos a

proceder al estudio del siguiente modelo. FVC = Bo + B1FVE_1

Resumen del modelo.

Con este modelo podemos explicar el 87,4% del a variabilidad del FVC frente al

87,5% del caso anterior. En los dos sí se observa una mejoría frente al modelo lineal “puro”. El R^2 corregido es algo superior al anterior.

Page 15: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

15

Se acepta la hipótesis de que todos los Bi <> 0 con i>0.

Se tiene una VNE = 8.655, mejor que en los casos anteriores.

Si observamos el p-valor de los dos coeficientes se puede rechazar la hipótesis Bo=0, B1=0.

Page 16: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

16

Diagnosis del modelo. Homocedasticidad.

El gráfico es mejor que en el caso lineal y similar al caso anterior.

Page 17: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

17

La cola derecha sigue siento un tanto peculiar.

Page 18: Relación entre la Capacidad Vital Forzada y el Volumen Espiratorio Forzado en un segundo

Modelos lineales: Regresión lineal simple

18

Valores atípicos e influyentes + Distancia de Cook.

Los residuos no son muy mejores que en el caso anterior. Por ahora los valores de residuos más convincentes son los del modelo lineal.

En la distancia de Cook es muy buena pero se observa un valor un tanto alejado del resto de valores.