selección de un modelo de ajuste de datos ybg

10
TAREA NM TIPO II Por: Yohana Bonilla Gutiérrez I. Alturas ganadoras de medalla de oro. La siguiente tabla muestra la altura ganadora (cm) alcanzada por los medallistas de oro en diversos Juegos Olímpicos: Año 1932 1936 1948 1952 1956 1960 1964 1968 1972 1976 1980 Altura (cm) 197 203 198 204 212 216 218 224 223 225 236 Tabla 1 1. Para graficar los puntos de la Tabla 1, utilzaremos el programa Microsoft Office Excel. Nuestras variables serán: Variable independiente: Año Variable dependiente: Altura (cm) Los posibles parámetros o variables desconocidas, serian los datos de la Altura (cm), en años posteriores, por ejemplo 1984, 1988, etc; o en años previos 1928, 1924... Por lo tanto crearemos dos columnas A y B en una hoja de cálculo de Excel. En el eje X (columna A) pondremos la variable Año, y en el eje Y (columna B) la variable Altura (cm), como vemos en la Fig 1. Figura 1: Columnas en Excel Seleccionamos las dos columnas Año y Altura (cm) e insertamos un gráfico de Dispersión también conocido como gráfico XY. (Figura 2). Para esto vamos al menú: Insertar==>Gráficos==>Dispersión ==>Dispersión con líneas suavizadas y marcadores. (Figura 2) 1

Upload: yohana-bonilla-gutierrez

Post on 26-Jul-2015

1.992 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Selección de un modelo de ajuste de datos ybg

TAREA NM TIPO II

Por: Yohana Bonilla Gutiérrez

I. Alturas ganadoras de medalla de oro.

La siguiente tabla muestra la altura ganadora (cm) alcanzada por los medallistas de oro en diversos JuegosOlímpicos:

Año 1932 1936 1948 1952 1956 1960 1964 1968 1972 1976 1980Altura (cm) 197 203 198 204 212 216 218 224 223 225 236

Tabla 1

1. Para graficar los puntos de la Tabla 1, utilzaremos el programa Microsoft Office Excel. Nuestras variablesserán:

Variable independiente: Año

Variable dependiente: Altura (cm)

Los posibles parámetros o variables desconocidas, serian los datos de la Altura (cm), en años posteriores, por ejemplo1984, 1988, etc; o en años previos 1928, 1924...

Por lo tanto crearemos dos columnas A y B en una hoja de cálculo de Excel. En el eje X (columna A) pondremosla variable Año, y en el eje Y (columna B) la variable Altura (cm), como vemos en la Fig 1.

Figura 1: Columnas en Excel

Seleccionamos las dos columnas Año y Altura (cm) e insertamos un gráfico de Dispersión también conocidocomo gráfico XY. (Figura 2). Para esto vamos al menú: Insertar==>Gráficos==>Dispersión

==>Dispersión con líneas suavizadas y marcadores. (Figura 2)

1

Page 2: Selección de un modelo de ajuste de datos ybg

Figura 2: Uso del estilo Dispersión para agregar un gráfico en Excel

2. Ahora trataremos de buscar una función que modele el comportamiento de la Gráfica que obtuvimos:

Figura 3: Gráfica con los datos de la Tabla 1.

El objetivo en este caso, es tratar de encontrar una función que al graficarla tenga aproximadamente la mismaforma de la curva de la Gráfica en la Fig.3 o que cuando reemplacemos los datos de los Años de la Tabla 1, en estafunción, podamos obtener alturas ganadoras cercanas a las reportadas en la Tabla 1.

i) Como en la Figura 3 vemos una curva, podriamos empezar tratando de aproximar nuestra función por unpolinomio:

y = a0 + a1x+ a2x2 + ... (1)

Pero tratar de encontrar manualmente esta función, es muy complicado, ya que necesitariamos idear una formapara calcular los coeficientes a0, a1, a2..etc de nuestro polinomio; usando los datos de la Tabla 1.

ii) Para evitarnos esta complicación de cálculo podemos empezar proponiendo, una función más simple, unafunción de potencias del tipo:

2

Page 3: Selección de un modelo de ajuste de datos ybg

y = bxa (2)

donde a y b son constantes, o parámetros que necesitamos determinar.Tenemos aplicando log10

logy = log(bxa) (3)

logy = alogx+ logb (4)

La Ec (4) tiene la forma de una función lineal cuya gráfica es una recta, donde a es la pendiente de la recta ylogb es el intercepto. Así, si graficamos log(Año) y log(Altura) en un plano XY podemos obtener a y b con los datosde la Tabla 1.

Excel nos ayudará a calcular estos logaritmos, y obtenemos la siguiente Tabla:

Figura 4: Tabla 2, logarítmica.

Hacemos nuevamente un gráfico de Dipersión en Excel y obtenemos:

Figura 5: Gráfica de log(Altura) vs. log(Año)

Recordemos que nuestro objetivo es la Ecuación 4 , por lo tanto buscamos la mejor línea recta que se ajuste ala Grafica de la Figura 5. En Excel nos paramos en el Gráfico y damos clic derecho en la opción: Agregar líneade tendencia.

3

Page 4: Selección de un modelo de ajuste de datos ybg

Figura 6: Agregar linea de tendencia

Y nos sale el menú: Formato línea de tendencia==>Opciones línea de tendencia. Elegimos Lineal==>Presentar ecuación en el gráfico, como veremos a continuación:

Figura 7: Formato de la linea de tendencia

Y finalmente obtenemos el gráfico con la ecuación de la recta que se ajusta a los nuevos datos logarítmicos:

4

Page 5: Selección de un modelo de ajuste de datos ybg

Figura 8: Recta de ajuste

Excel nos dio la siguiente Ecuación para esta recta:Y = 6, 9012X − 20, 388 y si comparamos con la ecuación:logy = alogx+ logb

a = 6, 9012logb = −20, 388b = 4, 09× 10−21

Finalmente nuestra función de potencias será:

Altura = 4, 09× 10−21Ano6,9012 (5)

3. En un nuevo sistema de ejes ponemos la función modelo (línea negra sólida)Altura = 4, 09× 10−21Ano6,9012

con la Gráfica original (puntos rojos):

Figura 9: Función modelo y datos originales.

Ahora vamos a calcular la Altura (cm) para cada Año, con esta función.

Por ejemplo, para el año1932 reemplazamos:Altura = 4, 09× 10−21(1932)6,9012 = 194.59Y así obtenemos la siguiente Tabla:

5

Page 6: Selección de un modelo de ajuste de datos ybg

Como los datos se alejan de los de la Tabla 1

Año 1932 1936 1948 1952 1956 1960 1964 1968 1972 1976 1980Altura (cm) 197 203 198 204 212 216 218 224 223 225 236

Tabla 1

, esto nos lleva a pensar que se debe hacer algún tipo de mejora en la función modelo.

4. Hallaremos otra función modelo, probaremos con un polinomio de grado 2:

Para hacer esto, estando en Excel, vamos a la Gráfica de la Figura 3. Usamos la opción de Excel Agregar líneade tendencia

==>Formato línea de tendencia==>Opciones línea de tendencia.Y en estas opciones, elegimos: Tipo de tendencia o regresión==>Polinómica==>Ordenación 2.

Figura 10: Curva de tendencia: polinomio de grado 2

6

Page 7: Selección de un modelo de ajuste de datos ybg

Y finalmente presentamos la Gráfica de los datos de la Tabla 1 y en negro el polinomio de Grado 2 obtenido conExcel:

Figura 11: Polinomio de grado 2 y Gráfica inicial

La ecuación del polinomio dada por Excel es:y = 0, 0113x2 − 43, 434x+ 41947 donde y=Altura, x=Año.

Altura = 0, 0113(Ano)2 − 43, 434(Ano) + 41947 (6)

Con esta Ecuación (6), obtenemos las Alturas ganadoras de los Años: 1940 y 1944 al reemplazar- 1940:213,7 cm- 1944:215,5 cmY están dentro del rango de los datos de la Tabla 1.

* Con este mismo modelo calculamos las Alturas para los Años 1984 y 2016- 1984:253,6 cm- 2016:310,1 cmEstos resultados están por fuera del rango de los datos disponibles, por lo tanto, dependen de la función que

elegimos para modelar nuestros datos, en este caso el polinomio de Grado 2.

5. Tabla de datos adicionales:

Año 1896 1904 1908 1912 1920 1928 1984 1988 1992 1996 2000 2004 2008Altura (cm) 190 180 191 193 193 194 235 238 234 239 235 236 236

Tabla 3. Datos adicionales

Para ver como se ajusta la función polinómica de grado 2 a estos datos adicionales, calcularemos las alturas deestos Años, con la función Ecuación (6):

Año 1896 1904 1908 1912 1920 1928 1984 1988 1992 1996 2000 2004 2008Altura (cm) 217,6 213,6 212,2 211,1 210,10 210,4 253,6 259,4 265,6 272,1 279,0 286,2 293,9

Tabla 4. Datos calculados

7

Page 8: Selección de un modelo de ajuste de datos ybg

Es claro que los datos que se obtuvieron calculados directamente del polinomio de grado 2, tienen diferenciascon los de la Tabla 3, porque las alturas siempre son muy grandes comparadas con los datos adicionales.

Esto nos puede llevar a pensar que quizá podamos probar con una función de un grado más bajo, para obtenerdatos de las Alturas más pequeños.

Para ver la tendencia general desde 1986 hasta 2008, llevamos los datos Adicionales, de la Tabla 3. Datosadicionales, a un gráfico de Excel, con el fin de ver el comportamiento de los datos:

Gráfica de los Datos Adicionales.

Las Alturas ganadoras van aumentando a medida que pasan los Años.Sin embargo hay algunos años donde las Alturas ganadoras no han seguido la tendencia de aumento, por ejemplo

el año 1904 la altura fue de 180 cm, es decir disminuyó respecto al año anterior reportado 1896, 190cm. Tambiéna partir de 1996 (Altura 239cm) todas las alturas siguientes fueron menores a 239cm. Esto indica la presencia defluctuaciones o cambios en la tendencia de aumento.

6. Vamos a cambiar el polinomio de Grado 2, por uno de orden 1 o sea una función lineal, porque como yavimos con el de orden 2 se obtienen Alturas (cm) que se alejan mucho de las esperadas, porque son muy grandes.Esta función la obtenemos en Excel y su gráfica.

i) Como punto de partida podemos intentar graficar una recta que pase por la mayor cantidad de puntos de laGráfica (Fig. 3), en este caso la función que buscariamos sería una función lineal.

Recordemos que: una función lineal es una función de la forma

y = mx+ b (7)

donde y y x son las variables dependiente e independiente, m y b son parámetros, y su gráfica es una línea recta.

m y b se conocen también como la pendiente de la recta, y el intercepto con el eje de las y, y son variablesdesconocidas.

En Excel seguimos la secuenciaAgregar línea de tendencia==>lineal, usada antes. Y finalmente obtenemosel gráfico

8

Page 9: Selección de un modelo de ajuste de datos ybg

Figura 12: Función lineal

Excel nos da la Ecuación:y = 0, 7551x− 1264, 6, donde y=Altura, x=Año, o sea:Altura = 0, 7551(Ano)− 1264, 6Así, reemplazamos por ejemplo el año 1984, en esta ecuación y obtenemosAltura = 0, 7551 ∗ 1984− 1264, 6=233,5 y si volvemos la Tabla 3 de los datos adicionales

Año 1896 1904 1908 1912 1920 1928 1984 1988 1992 1996 2000 2004 2008Altura (cm) 190 180 191 193 193 194 235 238 234 239 235 236 236

Tabla 3. Datos adicionales

podemos comparar y vemos que para ese Año (1984) la altura era de 235cm.Y también hacemos la tabla con la ecuación y = 0, 7551x− 1264, 6 para comparar

Finalmente introduciremos un cuadro comparativo de todas las funciones modelos utilizadas, donde se hancalculado con los Años dados en las Tablas las Alturas (cm).

9

Page 10: Selección de un modelo de ajuste de datos ybg

Figura 13: Cuadro comparativo.

10