matemáticas aplicadas en ingeniería química - palacio, l.a
DESCRIPTION
Matematicas Aplicadas a IQTRANSCRIPT
MMAATTEEMMÁÁTTIICCAASS AAPPLLIICCAADDAASS EENN
IINNGGEENNIIEERRÍÍAA QQUUÍÍMMIICCAA
Heberto Tapias García Luz Amparo Palacio Santos
Universidad de Antioquia
Medellín Marzo de 2009
MMAATTEEMMÁÁTTIICCAASS AAPPLLIICCAADDAASS EENN
IINNGGEENNIIEERRÍÍAA QQUUÍÍMMIICCAA
Por
Heberto Tapias García Profesor del Departamento en Ingeniería Química
Luz Amparo Palacio Santos
Profesora del Departamento en Ingeniería Química
Universidad de Antioquia
Medellín Marzo de 2009
i
PRÓLOGO
En su ejercicio profesional, un ingeniero tiene que resolver los problemas con los conocimientos existentes o sin ellos. Cuando se dispone de una aproximación teórica para dar cuenta de los fenómenos que subyacen en los sistemas que interviene el ingeniero, la matemática le ofrece un lenguaje simbólico para construir un modelo o sistema sustituto con el cual se puede obtener información sobre el comportamiento del sistema real. Pero también la matemática le provee al ingeniero herramientas y métodos para resolver los modelos matemáticos fenomenológicos y generar modelos matemáticos a partir de datos empíricos obtenidos directamente de la experimentación de prototipos o de la operación de sistemas reales. La matemática en ingeniería es un instrumento con el cual el profesional busca la solución a esos problemas cotidianos, es así como la matemática promueve lenguaje para construir modelos de los sistemas reales, nos da la posibilidad de organizar la realidad en un sistema abstracto, etc. Sin embargo, la matemática además de instrumental es también formal, es decir, el conocimiento de la matemática nos educa para hacer abstracción, nos ayuda a organizar, a ser rigurosos. Este libro presenta herramientas y estrategias matemáticas de gran aplicabilidad a problemas de ingeniería química. Los cinco capítulos que lo conforman tienen una sustentación teórica, algoritmos, fórmulas, ejemplos aplicados, en algunos casos ejercicios puramente matemáticos, problemas propuestos y bibliografía. Se necesita en algunos capítulos que el lector conozca suficientemente bien toda la fenomenología de los procesos químicos y el diseño de equipos. Por ejemplo, en el capítulo de modelación es preciso manejar los conceptos de fenómenos de transferencia de masa, transferencia de calor y cantidad de movimiento. Por otro lado, hay algunos requerimientos mínimos en el área de las matemáticas para que quien aborde el libro pueda comprenderlo, por ejemplo, el cálculo diferencial, cálculo integral y las ecuaciones diferenciales. Los temas abordados en cada capítulo se planearon teniendo en cuenta las necesidades matemáticas que un estudiante de ingeniería química de último semestre debe integrar para tener un buen desempeño laboral. El primer capítulo trata sobre la modelación de procesos, la estrategia a seguir para conseguir representar la realidad por medio de algoritmos matemáticos y datos de propiedades, condiciones iniciales, condiciones finales, etc. El segundo capítulo tiene que ver con la conceptualización de las diferencias finitas y ecuaciones en diferencias, las cuales son aplicadas principalmente en procesos químicos que se realizan en etapas, o sea, no continuos. El tercer capítulo comprende diferentes métodos numéricos para ser utilizados en casos donde los métodos analíticos no son aplicables; abordándose aquí temas como la solución
ii
de ecuaciones no lineales, de sistemas lineales y no lineales, interpolación y aproximaciones, diferenciación, integración y solución de ecuaciones diferenciales. La optimización no lineal con aplicaciones en ingeniería química es tratada en el cuarto capítulo; se trabaja con funciones objetivo univariable y multivariable, ambas con restricciones y sin ellas. En el capítulo final se aborda el tratamiento estadístico de datos experimentales, de gran importancia en ingeniería química, especialmente para conocer con determinada certeza la validez de los datos obtenidos experimentalmente.
1
CAPÍTULO I
MODELACIÓN MATEMÁTICA DE SISTEMAS EN INGENIERÍA
QUÍMICA
TABLA DE CONTENIDO
1.1. Análisis en Ingeniería Química ........................................................................ 2 1.2. Modelación de procesos y sistemas ................................................................ 5
1.2.1. Representación esquemática .................................................................... 6 1.2.2. Variables fundamentales ........................................................................... 6 1.2.3. Variables características ........................................................................... 8 1.2.4. Volumen de control .................................................................................... 8 1.2.5. Ecuaciones básicas ................................................................................... 9 1.2.6. Relaciones específicas o constitutivas..................................................... 10 1.2.7. Variables dependientes y parámetros ...................................................... 11
1.3. Problemas propuestos .................................................................................. 19 1.4. Bibliografía .................................................................................................... 21
2
CAPITULO I.
MODELACIÓN MATEMÁTICA DE SISTEMAS EN INGENIERÍA
QUÍMICA
1.1. Análisis en Ingeniería Química
En la solución de problemas y el desarrollo de sistemas de procesos químicos o bioquímicos, el ingeniero químico se ve enfrentado a tener que realizar algún tipo de análisis para la formulación de alternativas y selección de alguna propuesta de solución. Para llevar a cabo estos análisis es necesario que el ingeniero formule correctamente el problema u objeto de análisis y lo interprete con la ayuda de los conocimientos disponibles: leyes, principios, teorías, paradigmas, etc. Es decir, necesita identificar inequívocamente los fenómenos y procesos presentes en el sistema objeto de análisis, y utilizar las herramientas disponibles para generar la información requerida y aproximaciones a la solución de los problemas enfrentados. En el análisis moderno de los sistemas y procesos objetos de estudio de la ingeniería química, generalmente se recurre a la modelación matemática fenomenológica. Esta modelación es posible en aquellos sistemas y procesos en los que se tienen conocimientos sobre los fenómenos que intervienen y para los cuales se han elaborado teorías y generado relaciones matemáticas para describirlos. El modelo matemático generado, constituido por un conjunto de ecuaciones diferenciales, en diferencias finitas y algebraicas, en algunos casos puede resultar difícil de manipular; y aunque pueda resolverse fácilmente, en ocasiones es recomendable el uso de juicios ingenieriles y aproximaciones razonables para reducirlo a uno menos complejo, que para los propósitos prácticos suministre una solución de ingeniería confiable de acuerdo con los datos disponibles. Pero aún, habiéndose reducido la complejidad del modelo, la solución del problema matemático puede enfrentarse a la limitación de la existencia de técnicas analíticas para la manipulación del modelo, lo que conduciría a recurrir a transformaciones del sistema de ecuaciones para ajustarlo a las formas estandarizadas, o utilizar las técnicas numéricas como métodos de aproximación a la solución rigurosa. El análisis significa examinar un sistema para identificar sus elementos constitutivos, relaciones y estructura, con el propósito de conocer sus características y funcionamiento. El interés del análisis de sistemas en ingeniería química se enfoca en el entendimiento de cómo se comportan variables como presión, temperatura, composición y flujos, que caracterizan su comportamiento, en relación con los parámetros y variables de entrada del sistema que son controlables. Esa comprensión que se obtiene del sistema ofrece la posibilidad de usar modelos para simular su comportamiento, sin intervención en el sistema real, cambiando parámetros y condiciones de variables, para decidir sobre las
3
transformaciones que deben introducirse en los sistemas existentes para obtener un comportamiento deseado, o para diseñar y generar uno completamente nuevo. Es amplio el ámbito de problemas y variados los objetivos en donde resulta de utilidad el análisis en ingeniería química. La investigación y desarrollo de procesos, el diseño, mejoramiento y optimización de procesos, operaciones y equipos, son áreas en donde con mayor frecuencia se realizan estudios analíticos; y en cualquiera de ellas, los problemas objeto de análisis generalmente involucran fenómenos de transferencia de cantidad de movimiento, transferencia de calor, transferencia de masa y cinética química. Particularmente en el desarrollo y diseño de procesos, la evaluación de las alternativas y la toma de decisiones se realizan en forma sistemática, mediante un proceso lógico secuencial que involucra tres grandes fases: la síntesis del proceso, el análisis del proceso y la optimización. En la primera fase, la síntesis del proceso, se genera una propuesta de proceso, su diagrama de flujo y la selección del tipo de operaciones unitarias que lo conforman. El análisis del proceso se hace con base en esta configuración y en los cálculos de balance de masa y energía, la selección del tipo de equipo, y el dimensionamiento y el costeo de ellos. Finalmente se lleva a cabo la optimización para la decisión óptima sobre los valores de condiciones de operación del proceso y las especificaciones de los equipos. El análisis de sistemas en ingeniería química es un proceso sistemático que entre sus etapas involucra la descripción matemática del sistema, la manipulación del modelo matemático, la comparación de los resultados suministrados por el modelo con la situación real y el estudio cuidadoso de las limitaciones del modelo para efectos de la toma de decisiones de acuerdo con el objetivo último del análisis. Este proceso puede organizarse como una secuencia lógica de las siguientes etapas generales: 1. Definición del problema 2. Teoría 3. Modelo matemático 4. Algoritmo 5. Soluciones 6. Análisis de la solución La primera etapa, la definición del problema, es una de las más importantes porque es la que define el objetivo del análisis. Normalmente este objetivo está asociado a un requerimiento de información sobre el comportamiento del sistema para efectos de su diseño, transformación, control o cualquiera otra situación relacionada con el sistema. Son muchos los objetivos posibles del análisis, los cuales pueden estar asociados a problemas o necesidades como: ¿Qué proceso en particular debe usarse para producir un producto químico
específico?.
4
¿Qué tipo de equipo y qué tamaño es necesario para una operación unitaria?. ¿Cuáles son las condiciones de operación que maximizan la producción de un
producto? ¿Cómo deben manipularse las variables de control de un proceso o equipo para
mantenerlo en las condiciones de operación deseadas?. ¿Cuál es la operación de separación viable económicamente para recuperar una
sustancia de una mezcla conocida?. ¿Cuáles son los factores que controlan la distribución de productos y
rendimiento en un reactor?. En la solución de cualquiera de esos problemas señalados es conveniente especificar cuál es la información que se requiere sobre el sistema y para que se requiera esta información. La segunda etapa es una definición o búsqueda de la teoría que explica el fenómeno o conjunto de fenómenos presentes en el sistema bajo análisis. Generalmente esta teoría existe, pero en caso contrario, la solución del problema requiere inicialmente de una investigación, en la que deben formularse hipótesis o postularse una teoría y constatar su validez mediante la comparación de resultados experimentales con una solución obtenida con un modelo matemático construido con base en esta teoría. En el desarrollo de esta etapa se requiere una habilidad especial para identificar los fenómenos presentes en el sistema objeto de análisis y la forma como interactúan, para comprender el comportamiento global del sistema y poderlo expresar en términos matemáticos. Esta es la etapa crucial en el análisis en ingeniería química. Una vez conocida la teoría, el problema se convierte en un problema matemático mediante la definición de variables y parámetros y la construcción de un modelo matemático ensamblado con el conjunto de relaciones o ecuaciones entre parámetros y variables asociadas a características del sistema objeto de análisis. Las variables pueden clasificarse como variables de entrada al modelo y las variables de salida. Las variables de entrada son aquellas que deben ser normalmente especificadas antes de que pueda resolverse el modelo u operarse el proceso o sistema real. Estas variables típicamente involucran ratas de flujo de corrientes de entrada o salida del proceso, composiciones, temperaturas y presiones de estas corrientes. Las variables de salida son las variables realmente desconocidas - variables dependientes y parámetros - cuyos valores se obtienen como soluciones del modelo matemático. El algoritmo de solución o procedimiento de solución del problema matemático está constituido por el conjunto de etapas secuenciales de operación sobre el modelo
5
para obtener los valores de las variables desconocidas. La ejecución de las operaciones especificas y detalladas en el algoritmo proveen una solución del problema. Esta solución es posible obtenerla mediante técnicas analíticas, cuando existen estos procedimientos y los modelos no son ni muy extensos ni muy complejos, o a través de métodos numéricos para modelos extensos y complejos o para los cuales no existen las técnicas analíticas de solución. Ambos procedimientos se pueden desarrollar manualmente, pero hoy es posible generar la solución del problema matemático con el uso del computador como herramienta y con aplicaciones como MATLAB, POLYMATH o mediante la traducción del algoritmo en un programa utilizando un lenguaje especifico de programación como FORTRAN, PASCAL, BASIC, C++ u otro. En otros casos, la solución se obtiene directamente, sin necesidad de la elaboración del modelo matemático, recurriendo a simuladores comerciales como: UNIOPT, CHEMCAD, SUPERPRO DESIGNER, entre otros.
1.2. Modelación de procesos y sistemas El análisis teórico y la elaboración del modelo matemático constituyen el corazón del análisis en ingeniería química. Los modelos matemáticos como representación simbólica del sistema real permiten, a través de su manipulación, interactuar virtualmente con los sistemas reales para comprender y predecir su comportamiento. Ellos no sólo se utilizan para el diseño, operación y control de procesos y equipos, sino que también se usan en el análisis de problemas y fallas, en la optimización de sistemas y equipos, y en el entrenamiento de personal de operación cuando se incorporan en simuladores. Los modelos matemáticos permiten describir el comportamiento de los sistemas en estado estacionario o en su dinámica, y sólo aquellos sistemas que puedan ser analizados teóricamente y modelados matemáticamente son susceptibles de solucionar con aproximaciones analíticas y racionales para obtener información de una manera expedita y económica. Esta es la ventaja y el poder del análisis en ingeniería química. Y aquellos sistemas que no puedan ser objeto de estas aproximaciones deben estudiarse con modelos reales al nivel de laboratorio o planta piloto, ya sea para construir alguna teoría sobre su comportamiento o para obtener suficiente información experimental para simular su comportamiento con herramientas como las redes neuronales que no requieren de una comprensión de los fenómenos o procesos que subyacen en el comportamiento de los sistemas reales. Para el desarrollo del modelo matemático puede seguirse un procedimiento general constituido por las etapas secuenciales que se muestran en el diagrama de flujo de la figura 1.
6
1.2.1. Representación esquemática
La representación esquemática del sistema en un modelo gráfico se usa para mostrar los elementos constitutivos del sistema real, su estructura, las interrelaciones de dichos elementos y las relaciones o conexiones del sistema con su entorno. En esta representación las corrientes de entrada y salida de masa y energía al sistema suelen representarse con flechas, acompañadas de los símbolos que identificarán estas corrientes y las correspondientes variables de caracterización de la corriente (flujo, presión, temperatura y composición). Cuando el sistema objeto de análisis es un proceso químico o bioquímico, el sistema se representa mediante diagramas de bloques, o diagramas de flujo de proceso con símbolos convencionales para los equipos. En el caso de equipos u otro tipo de sistema, la representación debe ser lo más ilustrativa posible de la configuración real del sistema.
1.2.2. Variables fundamentales Las variables fundamentales son los atributos más generales de la materia que sufren cambios dentro del sistema, para los cuales existen principios de conservación. Los sistemas objeto de estudio de la ingeniería química involucran procesos en los que la materia sufre transformaciones físicas, químicas o bioquímicas para la modificación de su naturaleza, composición o contenido energético. Por lo tanto, los atributos que se usan como variables fundamentales para estos sistemas son la masa, la energía y la cantidad de movimiento; ya que los cambios de estas variables son los que informan sobre el comportamiento de dichos sistemas. Y son estos atributos generales los que permiten caracterizar los sistemas o informar sobre su estado y trayectorias evolutivas en su comportamiento. En un sistema en particular se utilizará una variable fundamental para su descripción matemática, si ese atributo o característica sufre cambio o transformación en los procesos que se presentan en el sistema, y si se está interesado en conocer el comportamiento especifico de esta variable o de una de sus variables características asociadas.
7
Figura 1. Etapas en la modelación de un sistema (tomado de Russell, T.W., Denn,
M.M., John Wiley & Sons, New York, 1972)
Representación
esquemática del sistema
Selección de las
variables fundamentales
Selección de las variables
dependientes de caracterización
Selección de un volumen
de control apropiado
Verificación del volumen de control
Hay un valor único para las variables
de caracterización en el volumen de
control?
Generación de las ecuaciones
básicas del modelo
Son suficientes
las ecuaciones?
Modelo matemático
completo
Se usan todos los
principios de
conservación?
Utilizar una relación
específica
si
si
no
no
si
no
Representación
esquemática del sistema
Selección de las
variables fundamentales
Selección de las variables
dependientes de caracterización
Selección de un volumen
de control apropiado
Verificación del volumen de control
Hay un valor único para las variables
de caracterización en el volumen de
control?
Generación de las ecuaciones
básicas del modelo
Son suficientes
las ecuaciones?
Modelo matemático
completo
Se usan todos los
principios de
conservación?
Utilizar una relación
específica
si
si
no
no
si
no
8
1.2.3. Variables características Normalmente los valores de las variables fundamentales no se pueden medir o conocer directamente sino indirectamente a través de otras variables. Son estas otras variables las que aparecerán en las ecuaciones y relaciones que conformarán el modelo matemático. Las variables características son las que realmente pueden medirse y agruparse para determinar el valor de las variables fundamentales. El valor de todas las variables características en cualquier momento y en cualquier punto del sistema determina el estado del sistema, y por lo tanto, se les conoce también como variables que determinan el estado del sistema y que son distintas de las variables de estado definidas en termodinámica. La masa, la energía y la cantidad de movimiento pueden cuantificarse o caracterizarse con variables como: densidad, concentración, presión, temperatura, velocidad, entre otras. En la selección de las variables de caracterización, que se van a utilizar para la formulación del modelo, conviene especificar cuáles se usarán para cuantificar cada una de las variables fundamentales seleccionadas en la descripción matemática del sistema.
1.2.4. Volumen de control El volumen de control es una región del sistema que se elige para hacer la contabilidad de las variables fundamentales mediante los principios de conservación y generar así las ecuaciones básicas del modelo. El volumen de control apropiado para la generación de ecuaciones puede ser todo el volumen del sistema, independientemente de las fases que lo integren y de los cambios de las variables características con la posición. Estos volúmenes macros se usan normalmente para establecer relaciones entre las entradas y salidas del sistema en estado estacionario. El volumen de control apropiado puede ser también una parte del sistema, o el volumen de una fase o una región finita o infinitesimal de ella, cuando se requiere obtener más ecuaciones básicas del modelo. Para efectos de la selección del volumen de control apropiado en una fase, es conveniente especificar cuál variable de caracterización -íntimamente asociada a cada variable fundamental- se va a usar para verificar si el volumen de control elegido es apropiado o no para efectos de la aplicación de los principios de conservación. Esta especificación se hace teniendo en cuenta que a cada variable fundamental está íntimamente ligada una variable o unas variables de caracterización. A la masa están íntimamente asociadas medidas de concentración como las fracciones molares o másicas, las concentraciones absolutas molares o másicas; a la energía, la temperatura, la presión, la velocidad; y a la cantidad de movimiento, la velocidad.
9
Un volumen de control apropiado en una fase puede elegirse por ensayo y error, cuando no se tiene experiencia en el proceso de modelación matemática. Se considera apropiado un volumen de control elegido, comprobando que efectivamente las variables características especificadas para esta verificación tengan, en un instante dado, el mismo valor en cualquier punto dentro del volumen de control. Cuando alguna de esas variables características no cumpla esta condición en el volumen de control, debe elegirse otro, hasta que se cumpla la condición de constancia en los valores de ellas. En la búsqueda de un volumen de control apropiado es conveniente iniciar con un volumen de control finito, el cual puede coincidir con el volumen total de la fase, continuar luego con volúmenes semifinitos, luego infinitesimales, y por último con un punto como opción final. Este procedimiento es aplicable en sistemas sólidos y fluidos en reposo o con flujo en régimen laminar. Un caso especial lo constituyen aquellos sistemas en los que se presenta flujo turbulento. En estos sistemas no se pueden usar volúmenes infinitesimales, sino semifinitos como mínimo, en virtud de que no es posible conocer valores puntuales de las variables características, por las fluctuaciones que tienen ellas con el tiempo, aún en estado estacionario. En estos casos la contabilidad de la masa, la energía y la cantidad de movimiento se realiza con valores promedios de las variables características asignados al volumen de control apropiado. En la elección del volumen de control apropiado debe tenerse en cuenta también que las superficies de control del volumen sean normales a las líneas de flujo de las entidades (masa, energía o cantidad de movimiento) que fluyen hacia o desde el volumen de control. Son volúmenes de control apropiados, por ejemplo, el volumen de la masa reaccionante en un reactor de tanque agitado perfectamente mezclado; un disco de espesor diferencial y el mismo diámetro del reactor en un reactor tubular con flujo turbulento; y un anillo coaxial con el reactor, de espesor y altura infinitesimal, en un reactor tubular real con flujo laminar. En la figura 2 se muestran ejemplos de volúmenes de control.
1.2.5. Ecuaciones básicas Una vez se tenga un volumen de control apropiado se pueden escribir las ecuaciones básicas del modelo. Ellas son relaciones que involucran las variables características y parámetros con las variables independientes que denotan tiempo y posición espacial en el sistema. Las ecuaciones básicas resultan de la aplicación de los principios de conservación de masa, conservación de energía y de conservación de cantidad de movimiento. Esta contabilidad podrá hacerse para todas las variables fundamentales que se usarán en la descripción del sistema y en todos los volúmenes de control que puedan elegirse. En principio, pueden elegirse tantos volúmenes de control como fases haya presentes en el sistema.
10
Figura 2. Ejemplos de volúmenes de control: (a) Finito en un tanque agitado, (b) semifinito en un reactor tubular con flujo turbulento, (c) infinitesimal en un reactor tubular con flujo laminar y (d) en la masa de líquido retenido sobre un plato de contacto gas-líquido
1.2.6. Relaciones específicas o constitutivas Si las ecuaciones básicas no son suficientes para completar el modelo matemático, porque existen más variables dependientes y parámetros desconocidos que
F, c, T
F + dF,
c + dc,
T + dT
z dz
R
F, c, T
F + dF,
c + dc,
T + dT
z dz
R
z dz
r
dr
R
nA,z n
A,z+dz
nA,r
nA,r+dr
z dz
r
dr
R
nA,z n
A,z+dz
nA,r
nA,r+dr
x dx
y
dy
nA,x n
A,x+dx
nA,y
nA,y+dy
x dx
y
dy
nA,x n
A,x+dx
nA,y
nA,y+dy
(a) (d)
(b)
(c)
F1, z
1, T
1
F2, z
2, T
2
F1, z
1, T
1
F2, z
2, T
2
11
ecuaciones, entonces se recurre a las relaciones específicas o constitutivas para completar el modelo. Las relaciones específicas o constitutivas son ecuaciones empíricas que relacionan variables características, o ecuaciones derivadas de teorías o leyes aplicables a los fenómenos que se presentan en el sistema. Pueden tener una forma sugerida por una teoría, pero también tendrán parámetros experimentales. Se pueden obtener empíricamente o totalmente sobre bases teóricas, por ejemplo, aplicando las leyes de la conservación a escala molecular y utilizando la mecánica cuántica y la estadística. O bien, obtenerse por una combinación lógica de cualquiera de los métodos anteriores. Estas relaciones son específicas para los sistemas. Entre estas relaciones se tienen, por ejemplo, una ecuación de estado, relaciones termodinámicas, una ecuación que relaciona una propiedad como la conductividad térmica o la viscosidad con variables características como la concentración y la temperatura, una ecuación de velocidades de reacción, o ecuaciones para la densidad de transferencia de masa, de transferencia de energía en forma de calor, o de transferencia de cantidad de movimiento. Hay que tener precaución en la elaboración del modelo de que sólo aparezcan sistemas de ecuaciones linealmente independientes.
1.2.7. Variables dependientes y parámetros Para la contabilidad de variables en el modelo matemático deben diferenciarse las variables independientes de las variables dependientes. En esta contabilidad, para determinar si el modelo está completo, sólo se tienen en cuenta el número de variables dependientes que sean desconocidas. El tiempo y las variables que denotan posición en el espacio, constituyen las variables independientes del modelo. Los flujos de masa, de energía y de cantidad de movimiento, las medidas de concentración, las temperaturas, las presiones y las velocidades, entre otras, son denominadas variables dependientes, en virtud de que sus valores pueden depender de la posición y el tiempo y sólo se conocerán cuando se resuelva el modelo. Dentro de estas variables dependientes algunas suelen denominarse parámetros, porque hacen referencia a propiedades fisicoquímicas, a características de las configuraciones geométricas de los sistemas o a otros atributos. Algunos parámetros están predeterminados por la naturaleza química del sistema y por otras condiciones de los procesos como el régimen de flujo y la geometría. Son parámetros: las constantes de velocidad de reacción, los coeficientes de transferencia de masa y calor, los factores de fricción, la conductividad térmica, la viscosidad, la difusividad, los calores de vaporización y otras propiedades fisicoquímicas. Unos son geométricos como una longitud, un área o un volumen y otros son parámetros empíricos que aparecen en relaciones específicas que
12
describen el comportamiento de dispositivos, de componentes de los sistemas o equipos como los coeficientes de una válvula, la altura equivalente de plato teórico, la eficiencia de plato, la relación de reflujo mínimo o el número mínimo de etapas de separación. Ejemplo 1: Formule un modelo matemático para un vaporizador de un líquido puro. Representación esquemática y condiciones de operación En la gráfica se ilustra un sistema vaporizador de forma cilíndrica. El calentamiento se hace con vapor de H2O saturado a la presión Ps. El recipiente tiene un volumen total Vo y diámetro D. Se asumirá que el líquido y el vapor se mantienen en equilibrio y que el calentamiento se hace esencialmente a través de la fase líquida.
Variables dependientes fundamentales
Las variables fundamentales para la descripción del comportamiento del sistema son la masa y la energía en virtud de que se presentan fenómenos de transferencia de masa y de calor.
Especificación de las variables características
Control presión
h
Fv
Po
Cv 2
m H2O F L
Vapor
de
agua
s
T s
Cv 1
m v
T
Pv
13
Para la masa las variables características son los flujos másicos, la densidad del líquido y la densidad del vapor; y para la energía la presión, la temperatura y el nivel del líquido.
Volúmenes de control Los volúmenes de control apropiado son tres (tantos como fases hay presentes en el sistema): el volumen de la fase líquida, el volumen de la fase de vapor del líquido y el volumen del vapor en la chaqueta de calentamiento. En los tres volúmenes de control se cumple la constancia de las variables características, densidad y temperatura; solo la presión tiene variación en la fase líquida, pero se considerará despreciable esta variación para efectos de la selección del volumen de control.
Ecuaciones básicas del modelo Aplicando los principios de conservación de masa y de energía en los tres volúmenes de control se obtienen las siguientes ecuaciones básicas. Conservación de masa
L v L
dF m m
dt Fase líquida (1)
GVv mdt
dFm Fase gaseosa (2)
Conservación de energía
L Lo v V TL
dq F H m H H
dt Fase líquida (3)
Ecuaciones específicas o constitutivas
Como existen nueve variables dependientes (FL, mV, mL, FV, mG, q, HLo, HV, HTL)
en las ecuaciones básicas y solo cuatro ecuaciones, el modelo debe completarse con ecuaciones específicas para el sistema:
2
4L l
Dm h
(4)
M
RTmVP G
GV (5)
14
hD
VV oG4
2 (6)
1L V LF C P P (7)
oVVV PPCF 2
(8)
ghPP LV (9)
( )LL P oH C T T (10)
( )LV P oH C T T (11)
TL L LH m H (12)
)( TTUAq sT (13)
DhAT (14)
os
o
osCT
BAP
ln (15)
)( 1 opLo TTCHLo
(16)
bTaCLP (17)
0
00
CT
BAPln V
(18)
LoP oC a bT (19)
380
1
.
Tc
Tk
(20)
38.0
2
221
OH
s
OHOHTc
Tk (21)
OHOHmq22
(22)
Con estas ecuaciones aparecen otras 11 variables dependientes: PV, VG, T, P, CPL,
, AT, Ts, CPlo, mH2O, H2O.
Definición de variables y parámetros
AT : Área de transferencia de calor, m2
Ao, Bo, Co,
A, B, C : Parámetros de la ecuación de Antoine
CPL, : Capacidades calóricas del líquido, Joule mol-1 K
-1
CPLo : Capacidad calórica del líquido alimentado, Joule mol-1
K-1
CV1, CV2 : Coeficientes de las válvulas de entrada del líquido y de
salida del vapor del líquido, mol s-1
Pa -0.5
15
FL : Flujo másico de entrada del líquido. mol s-1
FV : Flujo másico de salida de vapor, mol s-1
HLo : Entalpía del líquido de entrada a T0, Joule mol-1
HL : Entalpía del líquido en el recipiente a T, Joule mol-1
HV : Entalpía del vapor del líquido a T, Joule mol-1
h : Altura del nivel del líquido, m
mv : Rata másica de vaporización, mol h-1
mG : Masa de vapor en la fase gaseosa, mol
mH2O : Rata de condensado en la chaqueta, m3 s
-1
M : Peso molecular de la sustancia que se está vaporizando, g mol-1
Po : Presión en la descarga del vapor, Pa
PL : Presión del líquido de alimentación, Pa
P : Presión en el fondo del tanque, Pa
PV : Presión en la fase de vapor, Pa
R : Constante de los gases, Pa m3 mol
-1 K
-1
Ps : Presión en la chaqueta de calentamiento, Pa
q : Rata de transferencia de calor, Joule s-1
TL : Temperatura del líquido de alimentación, K
To : Temperatura de referencia, K
Ts : Temperatura en la chaqueta, K
Tc, TcH2O : Temperatura crítica del líquido y del agua, K
VG : Volumen de la fase gaseosa, m3
Vo : Volumen total del recipiente, m3
U : Coeficiente de transferencia de calor, Joule s-1
m-2
K-1
L : Densidad del líquido a T, g m-3
: Calor de vaporización del líquido, Joule mol-1
H2O : Calor de vaporización del agua a Ts, Joule mol-1
a, b : Parámetros de la ecuación para cálculo de la capacidad calórica
k, kH2O : Parámetros en la ecuación para el estimado de los calores de
vaporización del líquido y del agua, Joule mol-1
Ejemplo 2: Formule un modelo matemático de un destilador Batch, para una mezcla de tres componentes que va a ser parcialmente separada. Representación esquemática y condiciones de operación
16
El destilador se calienta por medio de una chaqueta y se mantiene a una
temperatura TJ controlando la presión. El flujo de calor de la chaqueta al destilador
será:
Q = 5000(TJ -T)
El destilador opera a presión atmosférica y se asumirá que los tres componentes forman una mezcla ideal. Variables dependientes fundamentales Las variables fundamentales para la descripción del comportamiento del sistema son la masa y la energía en virtud de que se presentan fenómenos de transferencia de masa y calor.
Especificaciones de las variables características Para la masa las variables características son la densidad, altura, diámetro y fracciones molares; y para la energía la presión, la temperatura y el nivel del líquido.
Volúmenes de Control Hay tres volúmenes de control: el volumen del líquido en el destilador, el volumen del gas en el destilador y el volumen del vapor en la chaqueta. Ecuaciones básicas del modelo Conservación de masa:
Control
presión
h
TJ T
V
Q xi
yi
Control
presión
h
TJ T
V
Q xi
yi
17
Vdt
dmt 0 Fase líquida (1)
AA Vymdt
d0 (2)
BB Vymdt
d0 (3)
No se plantea la ecuación de conservación de masa en la fase de vapor pues se asume que el vapor que se genera inmediatamente se retira o porque la masa de vapor retenida es prácticamente despreciable.
Conservación de energía:
TL V
dQ H VH
dt Fase líquida (4)
No se plantea una ecuación de conservación de energía en la fase gaseosa
porque se consideró que el vapor generado es inmediatamente retirado del vaporizador o porque la masa que permanece retenida es despreciable.
Ecuaciones específicas o constitutivas
Como existen 9 variables dependientes (V, mA, mB, mt, yA, yB, HTL, HV, Q) en las
ecuaciones básicas y sólo cuatro ecuaciones, el modelo debe completarse con ecuaciones específicas para el sistema:
M
hDmt
4
2
(5)
AtA xmm (6)
BtB xmm (7)
C
C
B
B
A
A www000
1
(8)
CCBBAA MxMxMxM (9)
M
Mxw AA
A (10)
M
Mxw BB
B (11)
M
Mxw CC
C (12)
18
1 CBA xxx (13)
TrTCyHipLiiV (14)
P
xPy
A
AA
0
(15)
P
xPy
B
BB
0
(16)
P
xPy
C
CC
0
(17)
1 CBA yyy (18)
A
AA
CT
AAPln
A 0 (19)
B
BB
CT
BAPln
B 0 (20)
C
CC
CT
BAP
C 0ln (21)
APL A AC a b T (22)
BPL B BC a b T (23)
CPL C CC a b T (24)
380
1
.
C
AA
AT
Tk
(25) 380
1
.
C
BB
BT
Tk
(26)
380
1
.
C
CC
CT
Tk
(27)
TL L LH m H (28)
L i Pi LH x C T Tr (29)
TTQ J 5000 (30)
Con estas ecuaciones aparecen otras 21 variables dependientes: , M, wA,
wB, wC, P0
A, P0
B, P0
C, xA, xB, xC, yC, A, B, C, CPLA, CPLB, CPLC, T, HL.
19
Definición de variables y parámetros
mt : Moles totales de líquido, mol
V : Flujo molar de vapor, mol s-1
xA, xB, xC : Fracción molar de A, B y C en el líquido
yA, yB, yC : Fracción molar de A, B y C en el gas
wA,wB, wC : Fracción peso de A, B y C en el líquido
HL : Entalpía del líquido, Joule mol-1
HV : Entalpía del gas, Joule mol-1
HTL : Entalpía total del líquido, Joule
Q : Flujo de calor transferido, Joule s-1
D : Diámetro del recipiente, m2
h : Nivel del líquido, m
: Densidad del líquido, gm-3
A, B, C : Densidad de los componentes A, B y C puros a la temperatura T
M : Peso molecular promedio del líquido, g mol-1
MA, MB, MC : Peso molecular de los componentes A, B y C, g/mol
P0
A, P0
B, 0
CP : Presión de vapor de A, B y C, Pa
AA, BA, CA : Constantes de Antoine para el componente A
AB, BB, CB : Constantes de Antoine para el componente B
AC, BC, CC : Constantes de Antoine para el componente C
Tr : Temperatura de Referencia, K
CPLA : Capacidad calórica del componente A líquido, Joule mol-1
K-1
CPLB : Capacidad calórica del componente B líquido, Joule mol-1
K-1
CPLC : Capacidad calórica del componente C líquido, Joule mol-1
K-1
aA, bA : Parámetros de la ecuación para el cálculo de la capacidad calórica
del componente A
aB, bB : Parámetros de la ecuación para el cálculo de la capacidad calórica
del componente B
aC, bC : Parámetros de la ecuación para el cálculo de la capacidad calórica
del componente C
A, B, C :Calor de vaporización del líquido para los componentes A, B y C, Joule mol
-1
kA, kB, kC : Parámetros en la ecuación para el estimado de los calores de
vaporización de los componentes A, B y C , Joule mol-1
TCA, TCB, TCC : Temperatura crítica de los componentes A, B y C, K
1.3. Problemas propuestos
1. Formule un modelo matemático para un intercambiador de calor líquido-líquido
en contracorriente (figura 3).
20
Figura 3. Intercambiador de calor
2. Formule un modelo matemático para una cámara roceadora para desorber
amoníaco (figura 4).
Figura 4. Cámara roceadora
3. Desarrolle un modelo matemático para un separador líquido-vapor (figura 5).
Antes de entrar al tanque el líquido pasa por un intercambiador de calor. La mezcla está compuesta por tres sustancias. Al sistema se le suministra una carga térmica constante.
Tso
Fs
TTi TTo
TSi
FT
Tso
Fs
TTi TTo
TSi
FT
21
Figura 5. Separador líquido-vapor
1.4. Bibliografía
Bequette , B. W., “Process dynamics: modeling, analysis and simulation”, Prentice Hall, New Jersey, 1998. Franks, R., "Modeling and simulation in Chemical Engineering", John Wiley & Sons, New York, 1972. Husain, A.,“Chemical process simulation”, John Wiley & Sons, New York, 1986. Rice, R., Duong, D., “ Applied mathematics and modeling for chemical engineers”, Wiley, New York, 1995. Russell, T.W., Denn, M.M., "Introduction to Chemical Engineering analysis", John Wiley & Sons, New York, 1972.
Smith, C., Pike, R., Murril, P., "Formulación and optimización of mathematical models", International texbook Company, Scranton,1970. Tapias, H., Palacio, L. A., “Modelación y análisis de sistemas en Ingeniería Química”, Ingeniería Química, Julio/Agosto, 2001.
h
Lo
mG
T
P
Vo
VL
q
F1
h
Lo
mG
T
P
Vo
VL
q
F1
CAPÍTULO II
DIFERENCIAS FINITAS Y ECUACIONES DE DIFERENCIA
TABLA DE CONTENIDO
2.1. Diferencias finitas ...........................................................................................23
2.1.1. El operador diferencia ..............................................................................23
2.1.2. Reglas generales del cálculo de diferencias ............................................25
2.2. Diferencias en funciones especiales ...............................................................26
2.3. Funciones factorial y polinomio factorial ........................................................27
2.3.1. Función factorial ......................................................................................27
2.3.2. Polinomio factorial ...................................................................................29
2.3.3. El operador traslación ..............................................................................30
2.3.4. Notación suscrita para una función ..........................................................32
2.4. Operaciones sumas .......................................................................................33
2.4.1. El operador suma.....................................................................................33
2.4.2. Reglas generales de sumatoria ................................................................33
2.4.3. Sumatoria de funciones especiales ..........................................................34
2.4.4. Teorema fundamental .............................................................................34
2.5. Ecuaciones de diferencias ..............................................................................35
2.5.1. Solución de la ecuación diferencia ..........................................................37
2.5.2. Ecuaciones de diferencias lineales .........................................................38
2.5.3. Ecuaciones de diferencias lineales homogéneas .....................................39
2.5.3.1. Soluciones linealmente independientes .............................................39
2.5.4. Ecuaciones de diferencias lineales homogéneas con coeficientes constantes .........................................................................................................40
2.5.4.1. Caso 1: Todas las raíces son reales y diferentes .............................41
2.5.4.2. Caso 2: Algunas de las raíces son números complejos ....................41
2.5.4.3. Caso 3: Algunas de las raíces son iguales ........................................43
2.5.5. Ecuaciones de diferencias lineales no - homogéneas ..............................47
2.5.6. Métodos para encontrar soluciones particulares ......................................48
2.5.6.1 Método de los Coeficientes Indeterminados .......................................48
2.5.6.2 Método de los Operadores Inversos ...................................................51
2.5.7. Ecuaciones de diferencia no lineales .......................................................62
2.5.7.1 Soluciones gráficas ............................................................................62
2.5.7.2 Soluciones analíticas .........................................................................66
2.6. Ecuaciones diferenciales - diferencias ............................................................74
2.6.1.Transformación de Laplace .......................................................................74
2.6.2. Transformadas elementales .....................................................................75
2.6.3. Transformadas inversas ..........................................................................76
2.6.3.1. Método de la Integral de Convolución ...............................................76
2.6.3.2. Método de los Residuos ...................................................................77
2.7. Problemas propuestos ...................................................................................86
2.8 Bibliografía ......................................................................................................87
23
CAPITULO II.
DIFERENCIAS FINITAS Y ECUACIONES DE DIFERENCIAS
Los procesos químicos que involucran separación, purificación y reacciones químicas, generalmente utilizan unidades que desarrollan su operación en una serie de etapas. Estos tipos de procesos se analizan mediante el cálculo etapa por etapa, por métodos gráficos y en algunos casos mediante la solución de ecuaciones de diferencias.
2.1. Diferencias finitas
2.1.1. El operador diferencia El operador diferencia denota la diferencia que experimenta una función cuando hay un cambio finito en la variable independiente. Dada una función xf definida en el conjunto de los números reales, se define un
operador , llamado operador diferencia, por:
xfhxfxf
h: Número positivo llamado desplazamiento
Ejercicio 1:
Encontrar la diferencia finita de 22 3x
hhxh
xxhxhxhx
xxhxhxxx
324
3233242
323232
2
222
222
El operador 2 es el operador diferencia de orden dos, y está definido como:
2 2 2f x f x h f x h f x
A esta fórmula puede llegarse aplicando el operador diferencia a la primera
diferencia de la función f x :
24
!rn!r
!n
r
n
xfhxfhxf
xfhxfhxfhxfxfhxf
xfhxfxfxf
22
2
2
En general, el operador diferencia de orden n, n, está definido por la fórmula:
xfxf nn 1
n
r
rhrnxf
r
n
0
1
xf...hnxfn
nhxfn
111
-
Coeficientes binomiales. Número de combinaciones de n objetos, tomados de r en r.
Esta receta puede obtenerse aplicando sucesivamente el operador diferencia n
veces a la función f x , o sea:
1 2
2 veces
n n nf x f x f x
n f x
Ejercicio 2:
Encontrar la diferencia de orden 3 a la función 4 1x
3
3 4 4
0
31 1 3 , 1
r
r
x f x r h f x xr
3 3 3 3
3 20 1 2 3
f x h f x h f x h f x
3 3! 3! 3!
3 23 0 2!1! 1!2! 0!3!
!f x h f x h f x h f x
! !
25
4
4 4 4 4
3 4
3 3 2 3
1
3 1 3 2 1 3 1 1
24 36
f x h f x h f x h f x
f x x
x h x h x h x
xh h
2.1.2. Reglas generales del cálculo de diferencias
1. f x g x f x g x
2. ; = cte f x f x
3.
=
=
f x g x f x g x g x h f x
g x f x f x h g x
f x g x g x f x f x g x
4. f x
g x
g x f x f x g x
g x g x h
Como d
dx
Lim
x xD
0 , se puede observar que si las relaciones anteriores
se dividen por x y se toma el límite cuando x 0 , se obtienen las reglas de
diferenciación homólogas. Ejercicio 3:
Encuentre la regla de la derivada para un producto de funciones f x g x a
partir de la regla 3.
0 0 0
f x g xLim Lim Limf x g x g x h f x
x x xx x x
0
Lim g x h f x= f x Dg x
h h
26
f x Dg x g x Df x
D f x g x
2.2. Diferencias en funciones especiales
1. 0 C
12 hxx bbb.
13 rhrxrx eee.
22
24 hxrcosrhsenrxsen.
22
25 hxrsenrhsenrxcos.
x
hlnxln. 16
x
hlogxlog. bb 17
Si se dividen estas relaciones por x h y se toma límite cuando x 0 se
obtienen las correspondientes derivadas.
Ejercicio 4:
Encuentre la regla para la derivada de la función rxe a partir de la regla 3 en la
sección 2.2. (diferencia de funciones especiales).
rxrx
rhrxHôpital'Lrh
rxrxrx
eDre
re.eh
Lim
h
ee
h
Lim
dx
de
x
e
x
Lim
=
0
1
00
Ejercicio 5:
Halle la diferencia del monomio factorial 3
10x
hxhxhx..x 3010310 23
27
Debido a la cercana relación del operador diferencia con el operador derivada, se podría pensar que es posible desarrollar un cálculo análogo al cálculo diferencial, así mismo es posible obtener las fórmulas del cálculo diferencial a partir del cálculo
análogo si h o x se aproximan a cero. Ya que h se toma como una constante
dada, con un valor finito, contrario a una variable que se puede aproximar a cero, hay que referirse a tal cálculo como cálculo de diferencias finitas.
2.3. Funciones factorial y polinomio factorial
2.3.1. Función factorial La función factorial generalizada está definida como:
f x f x f x h f x h f x m hm
2 1...
mhxfhxfhxfxf
m
...2
1
mm
mm
xfxf
xfxf:hcuando
xf
0
10
Ejercicio 6:
Expanda como productos de factores las funciones 2
2x x y 2
2x x
hxhxxxxx 2222
hxhxhxhxxx 221
2222
En el caso particular en que f(x) = x, entonces se obtiene el monomio factorial:
x x x h x h x m hm 2 1...
,...,,m
x
321
10
Se origina el nombre factorial, ya que en el caso especial en que x = m y h = 1 se
tiene que: !m....mmmm m 1221
28
m
m
mhxmhxhxhxx
1
...2
1
Las funciones factoriales se convierten en monomios cuando el desplazamiento se hace cero:
mm
mm
xx
xx:h
0
Ejercicio 7:
Exprese como un producto de factores 3 3
y x x
hxhxxx 23
hxhxhxx
32
13
La función factorial mx tiene un polinomio equivalente dado por la fórmula:
m
k
kmkmk
m hxsx1
donde:
mks : Son números Stirling de primera clase
Estos números pueden generarse mediante la siguiente fórmula recursiva:
mk
mk
mk msss
11
donde
01 mk
mm s;s para 010 m,mk,k
Ejercicio 8:
Encuentre el polinomio equivalente para 3
x
29
2233 23 xhhxxx
Si se intenta buscar una fórmula en diferencias finitas para un monomio mx
análoga a la derivada 1 mm mxDx se obtiene:
h
xhx
x
x mmm
. Una
comparación rápida nos conduce a establecer la poca semejanza que hay entre las
dos, por esto se introduce la función factorial mx para obtener una fórmula
análoga a la derivada: 1
mm
mxx
x, por lo tanto, una diferencia en funciones
especiales es:
hmxx mm 1
2.3.2. Polinomio factorial
Si p es un entero positivo, un polinomio factorial de grado p se define como:
a x a x a
p p
p0 1
1
...
donde a0 0 y pa...,,a,a 21 son constantes.
El monomio mx también tiene un polinomio factorial equivalente dada por la
fórmula:
m
k
kmkmk
m hxSx1
donde:
mkS : Son números Stirling de segunda clase
Estos números pueden generarse mediante la siguiente fórmula recursiva:
mk
mk
mk kSSS
11
donde
30
01 mk
mm S;S para 010 m,mk,k
Ejercicio 9:
Encuentre el polinomio factorial equivalente para 3x
21233 3 hxhxxx
2.3.3. El operador traslación
El operador traslación desplaza el valor de una función f(x) al valor de la función
en la variable independiente incrementada en un desplazamiento h.
Dada una función f(x), el operador traslación E se define como:
Ef x f x h
Ejercicio 10:
Encuentre el valor de 24E x x
22
22
244
44
hxhxhx
hxhxxxE
En general, el operador nE traslada el valor de una función f x al valor de la
función en la variable independiente incrementada en n desplazamientos h.
E f x f x nhn
Se puede demostrar que:
E 1
Se usa el número 1 en lugar de la letra I, para denotar el operador identidad u operador unidad.
Esta relación es extraordinariamente importante porque con frecuencia permite simplificar expresiones en función de un operador al escribirlas en función del otro, utilizando para ello manipulaciones algebraicas ordinarias.
31
También se puede demostrar que:
xEf xfehD=
a partir de la serie de Taylor
Serie de Taylor:
...!
axafaxafafxf
2
2
Si ...!
hxfhxfxfhxfhxa
2
2
Si se reemplaza
,xD d
'' ,)( 2
2
2
fdx
xfxfxDf
dx
xdfxf
xfD!
hxhDfxfhxf 2
2
2
xfeEf(x
...!
x
!
xxe
xf...!
Dh
!
DhhDxEf
hxfxEf
hD
x
=)
:lexponencia función la de Desarrollo
entonces,
:como
321
321
32
3322
Puede demostrarse la fórmula para el operador n aplicado a la función f(x), que
aparece en la página 30, a partir de la relación entre el operador y el operador
E.
n n n n n n nE E
nE
nE
nE
1
1 2 311 2 3 ...
xf...xfEn
xfE
xf...En
En
En
E)x(f
nnn
nnnnnn
11
1321
1
321
n
0r
hrnxfr
n-
xf...hnxfn
nhxfxf
r
nn
1
111
32
Ejercicio 11:
Realice el ejercicio 2 usando el operador traslación.
43
4444
423
4343
3624
11312313
1133
111
hxh
xhxhxhx
xEEE
xEx
2.3.4. Notación suscrita para una función
Si f x es una función discreta se puede hacer la transformación x a kh , con
a y h como constantes, donde la variable es k, entonces la notación
y f x equivale a:
y f a khk
k: número de desplazamientos desde el punto base ( ax ), a partir del cual se
empieza a medir el desplazamiento. En la figura 1 se representa esquemáticamente la transformación a la notación suscrita.
Figura 1. Representación esquemática de la notación suscrita.
xo x1 x2 x3 xn
a a+h a+2h a+3h a+nh
0 1 2 3 n
f(a) f(a+h) f(a+2h) f(a+3h) f(a+nh)
f(xo) f(x1) f(x2) f(x3) f(xn)
y0 y1 y2 y3 yn
x
k
f(x)
yk
xo x1 x2 x3 xn
a a+h a+2h a+3h a+nh
0 1 2 3 n
f(a) f(a+h) f(a+2h) f(a+3h) f(a+nh)
f(xo) f(x1) f(x2) f(x3) f(xn)
y0 y1 y2 y3 yn
x
k
f(x)
yk
33
De esta notación se sigue entonces que:
y y yk k k 1
y yk k 1
En general:
...yn
yn
yr
ny knkn
n
rrkn
r
kn
1
0 101
que se obtiene a partir de la fórmula de la página 30 reemplazando hrnxf
en notación suscrita, rnky , teniendo en cuenta que khax .
nkkn yyE
2.4. Operaciones sumas
2.4.1. El operador suma
Llamamos Σ el operador suma y Σf(x) la suma indefinida de xf . El operador Σ
es el operador inverso de que se representa como 1 , de forma análoga a
como lo es el operador D-1
(operador integral) del operador D (derivada). Por
definición 1 es un operador tal que:
xcxfxf
xchxfxhf
11
1
donde c(x) y c1(x) son constantes periódicas, tal que c(x+h) = c(x).
2.4.2. Reglas generales de sumatoria
1. xgxfxgxf
2. xfxf
3. xfhxgxgxfxgxf
34
Estas fórmulas se podrían escribir usando 1 en vez de Σ. Las dos primeras
indican que Σ o 1 es un operador lineal.
2.4.3. Sumatoria de funciones especiales
1. ,h
x
1 en notación suscrita k 1
2.
hm
xx
mm
1
1
;m 1 en notación suscrita
1
11
m
kk
mm
3.
phm
qpxqpx
mm
1
1
; m 1
4. 1
h
xx
b
bb
5. 1
rh
rxrx
e
ee
6.
22
2rhsen
hxrcossenrx
7.
22
2rhsen
hxsenrrxcos
Estas fórmulas también se pueden escribir con 1 en lugar de Σ. Es clara la
analogía de las anteriores fórmulas con las integrales correspondientes si se
multiplican las sumas por h = x.
La relación entre el cálculo de sumas y el cálculo integral se expresa con el siguiente teorema:
CdxxfxChxfLimh 0
2.4.4. Teorema fundamental
35
La suma definida de f(x) desde x = a hasta x = a+nh con desplazamientos de
valor h está denotada por:
hna
a
nha
a
xfnhaf...hafafxf1
1
en notación suscrita se expresa:
1
1
00
nn
k k
k
y y
Esta relación es denominada el teorema fundamental del cálculo de suma, de manera análoga a la existencia del teorema fundamental del cálculo integral. Este teorema establece que la suma es equivalente a la función obtenida de la
operación -1
f(x) evaluada en el límite superior de la sumatoria más un
desplazamiento, menos el valor de esa misma función evaluada en el límite inferior de la sumatoria. Ejercicio 12:
Resuelva la siguiente suma: 8
2
4 22 h,x
7685
3840
642022468105
1210
5
1
10
2
5
22 55
10
2
510
2
8
2
54
x
h
xx
Prueba:
768
24680246202442022
864222 44448
2
4
x
2.5. Ecuaciones de diferencias Por analogía con una ecuación diferencial, una ecuación diferencia es una relación de la forma
36
F x yy
x
y
x
y
x
n
n, , , ,...,
2
20
o también:
G x f x f x h f x nh, , ,..., 0
en notación suscrita:
01 nkkk y,...,y,y,kH
donde:
y f x ó y f a khk es una función conocida u objeto.
La ecuación diferencia escrita en notación suscrita puede escribirse también en
términos del operador E.
H k y y y yk k k
n
k, , , ,..., 2 0
Si la ecuación diferencia es una ecuación que sólo posee términos lineales de la variable dependiente y sus diferencias, se dice que es lineal. Es decir, si la relación
sólo involucra términos lineales de los elementos y y y yk k k
n
k, , ,..., 2 ó
y y y yk k k k n, , ,..., 1 2 . Si aparecen productos de la forma y yk k1 o sus
diferencias son de grados dos, se dice que la ecuación es de segundo grado. El grado de una ecuación en diferencias finitas es el máximo grado de la variable dependiente, o de cualquiera de sus términos en la ecuación. El orden de la ecuación diferencia es la sustracción entre el argumento más grande y el más pequeño para la función. Por ejemplo en la ecuación diferencia
nkkkk y,...,y,y,yH 21 el orden es nknk y en
nkkk y,...,y,yH 211 es 11 nknk .
Ejercicio 13:
Transforme la ecuación y y y yk k k k 3 2 15 6 3 0 en términos del operador E.
Esta ecuación se puede escribir como:
3 25 6 3 0 yk ó yk 0
37
donde:
3 25 6 3
2.5.1. Solución de la ecuación diferencia La solución de una ecuación diferencia es cualquier función que satisface la ecuación. Una solución general en una ecuación diferencia de orden n es una solución que tiene n constantes arbitrarias. Una solución particular es una solución obtenida a partir de la solución general mediante la asignación de constantes periódicas particulares.
Por ejemplo, la ecuación
2
2
23 2 4
y
x
y
xy x
ó
f x h h f x h h h f x h x 2 3 2 2 3 1 42 2 2
ó
22212 413223 xhyhhyhy kkk
tiene como solución general:
y f x C x h C x h x h xx
hx
h 1 2
21 2 1 2 6 2 7
y una solución particular se obtiene cuando:
h
xhsenxC
2421
h
xcoshxC
215 2
2
Para determinar las n constantes arbitrarias de una ecuación diferencia de orden n
se deben conocer n condiciones de fronteras independientes para la función
desconocida.
38
2.5.2. Ecuaciones de diferencias lineales Una clase importante de ecuaciones de diferencias son las ecuaciones de
diferencias lineales. Una ecuación diferencia lineal de orden n es una ecuación
diferencia que tiene la forma:
kRyka...ykayka knkn
kn 1
10
donde 00 ka
Esta ecuación también puede escribirse como
kRykakaka knnn ...1
10
ó
y R kk
donde el operador lineal está dado por:
kakaka nnn ...1
10
Un caso particular importante surge cuando los coeficientes
ka...,,ka,ka n 10 son constantes; es decir independientes de k. En dicho
caso, la ecuación es una ecuación diferencia lineal de orden n con coeficientes
constantes. Ejercicio 14: Determine qué tipo de ecuación diferencia es cada una de las siguientes:
0365 23 kyEEE
Esta es una ecuación diferencia lineal con coeficientes constantes
2 1 3 4 4 32 2k k y k kk
Esta es una ecuación diferencia lineal con coeficientes variables.
y y yk k k 1 1
2
39
Esta es una ecuación diferencia no - lineal.
2.5.3. Ecuaciones de diferencias lineales homogéneas Son ecuaciones de diferencias lineales donde
0
0
ky
kR
Aquellas ecuaciones donde R k 0 se clasifican como no - homogéneas
y R kk
2.5.3.1. Soluciones linealmente independientes
Un conjunto de n funciones kf...,,kf,kf n 21 son linealmente independientes
si y solo si el determinante:
f f f
f f f
f n f n f n
n
n
n
1 2
1 2
1 2
0 0 0
1 1 1
1 1 1
0
....
....
.... .... .... ....
....
Este determinante es conocido como el CASORATI y es análogo al WRONSKIANO para ecuaciones diferenciales. Si kf...,,kf,kf n 21
son soluciones linealmente independientes de la ecuación
diferencia homogénea de orden n, la solución general será:
y C f k C f k C f kk n n 1 1 2 2 ...
Ejercicio 15:
Determine si las funciones 2k y 4
k son linealmente independientes.
kk kf,kf 42 21
0224
42
11
11
00
21
21
ff
ff
40
Las funciones son linealmente independientes
2.5.4. Ecuaciones de diferencias lineales homogéneas con coeficientes
constantes
Si se asume que y rk
k es solución de la ecuación diferencia lineal homogénea
con coeficientes constantes:
a a a yn n
n k0 1
1 0 ...
al sustituirla en esta ecuación se obtiene:
a r a r a rn k n k
n
k
0 1
1 0 ...
que factorizando rk
se obtiene:
a r a r a rn n
n
k
0 1
1 0 ...
Esta última ecuación se satisface si r es una raíz del polinomio:
a r a r an n
n0 1
1 0 ...
que se llama la ecuación auxiliar y puede representarse como:
r 0
Esta ecuación tiene n raíces que pueden ser o no diferentes. De esta forma la
ecuación homogénea se puede escribir:
a r r r yn k0 1 2 0 ...
La solución de la ecuación homogénea depende entonces de las raíces
nr...,,r,r 21, es decir de su naturaleza.
41
2.5.4.1. Caso 1: Todas las raíces son reales y diferentes
En este caso r r rk k
n
k
1 2, ,..., son todas soluciones, múltiplos constantes de estas
soluciones serán también soluciones y combinaciones lineales de estas soluciones
también lo serán (pues es un operador lineal).
Entonces, la solución general de la ecuación homogénea lineal de coeficientes constantes será:
y c r c r c rk
k k
n n
k 1 1 2 2 ...
Ejercicio 16: Halle las soluciones linealmente independientes de la ecuación diferencia:
086 12 kkk yyy y escriba la solución general.
La ecuación diferencia puede expresarse en términos del operador E como:
0862 kyEE
y la ecuación auxiliar se obtiene a partir de la función 2 6 8E E E ,
reemplazando E por r, entonces se obtiene:
2 6 8 0r r
que factoriza como: 2 4 0r r
cuyas raíces son: 2, 4r r
Las dos soluciones linealmente independientes son: 2k y 4
k
y por lo tanto la solución general será:
kkk CCy 42 21
2.5.4.2. Caso 2: Algunas de las raíces son números complejos
Si na...,,a,a 10 son reales y existen raíces complejas de la ecuación auxiliar, ellas
deben ser números complejos conjugados. En este caso si ik
y ik
42
son soluciones, entonces K i K ik k
1 2 es una contribución a la
solución general por el par de raíces complejas.
Escogiendo valores apropiados de K1 y K2 la contribución en forma real está dada
por:
senkCkcosCy kk 21
donde:
2 2
arctanθ
Ejercicio 17:
Resolver R R R 2 12 5 0
E E R
2 2 5 0
La ecuación auxiliar es:
r r
ri
i
2 2 5 0
2 4 20
2
2 4
21 2
436310711
2
521 2222
.rad.arctanarctan
senRCRcosCRR 21
La solución general es:
R.senCR.cosC
R.senCR.cosC
R
R
R
R
107110715
107110715
212
21
43
2.5.4.3. Caso 3: Algunas de las raíces son iguales
Si se tienen tres raíces iguales r1 = r2 = r3, la contribución de estas tres raíces a la
solución general es:
C C k C k r k
1 2 3
2
1
Si se repiten m raíces reales, entonces la contribución a la solución general será:
C C k C k rm
m k
1 2
1
1 ...
donde m n
Si un par de raíces complejas se repite m veces, entonces la contribución a la
solución general será:
senkkC...kCCkcoskC...kCC mm
mm
k 121
121
Ejercicio 18:
Resolver R R R 2 14 4 0
E E
E E
R
R
2 4 4 0
2 2 0
Ecuación auxiliar:
RR
RRR
RRR
RCC
RCC
RrCrC
r;r
rr
2
22
22
022
21
21
2211
21
Ejemplo 1:
Gs lbmoles/h de gas seco que contiene YNp+1 lbmoles de soluto/lbmol de gas seco
son alimentadas a la base de una columna de absorción de platos, donde el soluto
44
va a ser despojado del gas por absorción con Ls lbmoles/h de un aceite que se
alimenta en el tope de la columna. Si el soluto en el aceite que entra es Xo
lbmol/lbmol de aceite, y el soluto en el gas es Y1 lbmol/lbmol de gas; demostrar que el comportamiento del absorbedor puede ser expresado en términos del factor de absorción y el número de etapas ideales está dada por la ecuación de Kremser - Brown:
A
AAYY
YY
N
Np
p
log
111log01
01
donde:
s
s
kGLA : Factor de absorción
k : constante o relación de equilibrio; kXY
Y,X : Razones molares del soluto en fase liquida y gaseosa
Balance de soluto en el plato m:
msmsmsms YGXLYGXL 11
mmsmms YYGXXL 11 (1)
Xm-1
Xm
Ym
Ym+1
m
1
Np
Ls, Xo Gs, Yi
Ls, XNp Gs, YNp+1
Xm-1
Xm
Ym
Ym+1
m
1
Np
Ls, Xo Gs, Yi
Ls, XNp Gs, YNp+1
45
como kYXkXY mmmm
kYXkXY mmmm 1111
Sustituyendo X en términos de Y, se obtiene:
mmsmms
YYGYYk
L 11
A
Y
A
YYY
mmmm
11
01 11 mmm AYYAY
La ecuación anterior es una ecuación diferencia lineal homogénea con coeficientes constantes, equivalente a:
01 1112 mmm AYEYAYE
factorizando 1mY :
01 12 mYAEAE
Esta ecuación es equivalente a:
012 mYAEAE
01 mYEAE
cuya solución general:
mm ACCY 21 ; para 1A
Para evaluar C1 y C2 se aplican las condiciones límites.
0 1 2Y C C
46
1
1 1 2
1
1 0 2 1
Np
Np
Np
Np
Y C C A
Y Y C A
Análogamente:
1 ; 21 AACCY mm
Condiciones límites:
ACCY
CCY
211
210
Resolviendo simultáneamente se obtiene:
A
AYYC
1
011
A
YYC
1
102
mm A
A
YY
A
AYYY
11
1001
De esta ecuación se tiene:
110011
11
Np
Np AA
YY
A
AYYY
110011 1
NpNp AYYAYYAY
AYYAAYYYY NpNp
Np 011011
0110111 YYAYYYYA
NpNp
Np
011001011 YYAYYYYYYA
NpNp
Np
010110 111 YYAA
YYAYY NpNp
(2)
47
AAYY
YYA
NpNp 11101
01
, sacando logaritmo
A
AAYY
YY
N
Np
plog
111log01
01
Para el caso en que A =1
mCCYm 21
Condiciones límites:
10 CY
211 CCY
de donde:
01 YC 012 YYC
mYYYYm 010
Para 1Npm
10101 NpYYYYNp
01
011
YY
YYNp
Np
01
0101
YY
YYYYNp
Np
01
11
YY
YYNp
Np
2.5.5. Ecuaciones de diferencias lineales no - homogéneas
Si Y kc es la solución complementaria (solución de la ecuación homogénea) y
Y kp es alguna solución de la ecuación completa, la solución general para la
ecuación diferencia lineal no - homogénea será:
48
y Y k Y kk c p
2.5.6. Métodos para encontrar soluciones particulares
2.5.6.1 Método de los Coeficientes Indeterminados
Este método es útil cuando la función R(k) consiste de términos de cierta forma
especial. Correspondiente a cada término presente en R(k) se considera una
solución prueba que contiene un número de coeficientes desconocidos que son determinados por sustitución en la ecuación diferencia. Las soluciones prueba para cada caso se muestran en la siguiente tabla. Tabla 1. Soluciones prueba para el método de los Coeficientes Indeterminados
Términos en R(k) Solución prueba
K A K
senk ó cosk A k B kcos sen
Polinomio P(k) de grado m A k A k Am m
m0 1
1 ...
K P k( ) k m m
mA k A k A0 1
1 ...
k ksen ó k kcos kBkAk sencos
Si algún término de la solución particular aparece en la solución complementaria debe eliminarse la dependencia lineal multiplicando este término por una potencia
positiva de k hasta eliminar la dependencia.
Ejercicio 19:
Resolver k
kkk ekyyy 2
11 482
Esta ecuación se puede plantear como:
kkkk ekyEyyE
2111
2 482
ó
122 1482 kkkk ekyEyyE
Solución a la ecuación homogénea:
082 1112 kkk yEyyE
49
082 12 kyEE
024 1 kyEE , que es equivalente a 024 kyEE
Las raíces de la ecuación auxiliar son:
r1 = 4; r2 = -2 kk
k CCy 24 21 ó 1
2
1
11 24
kk
k CCy
Solución particular:
kk beAkAkAy 21
20
Sustituyendo en la ecuación:
121
2
01 11 k
k beAkAkAy
se obtiene:
kk
kk
ekbeAkAkA
beAkAkAbeAkAkA
2121
2
0
212
01
21
2
0
4118
211
Igualando los coeficientes de k2, k, k
0 y e
k de ambos miembros de la ecuación se
obtiene:
0799 012 AAA
0189 01 AA
49 0 A
18
2
eeb
de donde:
82
8144
98
94
22
10
ee
ebA
AA
La solución particular es:
8281
441
9
81
9
42
2
1
ee
ekky
k
k
50
La solución general:
8281
44
9
8
9
424
8281
441
9
81
9
424
2
12
21
2
21
21
11
ee
ekkCCy
ee
ekkCCy
kkk
k
kkk
k
Si se sustituye directamente yk, debe transformarse la ecuación diferencia en:
k
k beAkAkAy 212
0
122 1482 kk ekyEE
eekkyEE kk 48482 22
12
12 48482 k
kkk ekkyyy
En este caso se obtiene:
221
2
0 22 kbeAkAkA
121
2
0 112 kbeAkAkA
eekkbeAkAkA kk 4848 221
20
Que igualando los coeficientes de k2, k, k
0 y ek de ambos miembros se obtiene:
9449 00 AA
9889 11 AA
8144492 220 AAA
82
822
2
ee
ebeeeb
Por lo tanto la solución particular es:
8281
44
9
8
9
42
12
ee
ekky
k
k
La solución general:
51
8281
44
9
8
9
424
2
12
21
ee
ekkCCy
kkk
k
2.5.6.2 Método de los Operadores Inversos Si se asume que U es la solución particular de la ecuación no - homogénea, entonces:
( ) ( )E U R k
definiendo 1( )E el inverso de ( )E , entonces
)()(
1 kRE
U
Este método es útil en caso de que R(k) tome las formas especiales indicadas en
la siguiente lista:
1.
01
;
E
kk ; si =0 use la regla 4
2.
kcosE
ksenE
ó
11
Escriba: 2
kiki eekcos
2
kiki eeksen
y use la regla 1
3.
kP...b...bbkPkPE
mm
10
1
11
Donde la expansión solamente se hace hasta m si
m+1 P(k)=0
La función )1( se transforma a una función de la forma 1+Z ó 1-Z, y
luego se expande teniendo en cuenta que:
(1+Z) -1
= 1 - Z + Z2 - Z
3 + Z
4…
52
(1-Z) -1
= 1 + Z + Z2 + Z
3 + Z
4…
4. )()(
1)(
)(
1kP
EkP
E
kk
, y use regla 3.
Ejercicio 20:
Si 2(1 ) 4 4 expanda
1
1 como una función de
1
4444)1(
22
4
142
12
41
4
1
)1(
1
...
441
4
1 222
Ejercicio 21:
Resolver y y y k ek k k
k
1 1
22 8 4
Solución particular:
kk ekyEE
21
2 482
kk ek
EEy
2
21 4
82
1
1
2 84
1
2 82
2
2E Ek
E Eek
53
1
2 84
1
1 2 1 84
2
2
2
2
E Ek k
(Regla 3)
2
2
2
24
9
14
82221
1kk
2
12
49
19
1k
, expandiendo:
1242
44819
19
1kk...
122
449
19
1kk
se deja sólo hasta 2, por que
4k
(2) = 0 y
2k
(2) =0)
1
94 4
1
814 4
2 1 2 2 1k k k k
48
819
4
9
4 112
kkk
4
9
4
9
8
81
2 1k k
4
9
8
81
2 1k k
4
9
8
81
2k
1
2 8 2 82 2E Ee
e
e e
kk
(Regla 1)
Por lo tanto la solución particular es:
2
1 2
4 8
9 81 2 8
k
k
ey k
e e
1 1
2 2
2 2
4 8 4 81 2 1
9 81 2 8 9 81 2 8
k k
k
e ey k k k
e e e e
54
8281
44
9
8
9
42
12
ee
ekky
k
k
La solución general es:
8281
44
9
8
9
424
2
12
21
ee
ekkCCy
kkk
k
Ejercicio 22:
Resolver kkkyEE 4523442 por el método de los Operadores Inversos
Solución complementaria:
kk
k
kCCy
yE
2
02
21
2
Solución particular:
kkk
EEy 4523
44
12
Si se usa la regla 1 02 , entonces se usa la regla 4 para 2k y la regla 1 para
4k
kkk
EEy 4
4444
153
484
12
22
k
k
ky 44
53
1121
1
4
22
kk
ky 44
53
1
4
22
kk
44
53
4
2 2
kk
k 44
53
4
2 11
kk k4
4
5
22
4
3 2
55
kk kk 44
512
8
3
kkk kky 4
4
521
8
3
Solución general:
kkkkk
kkkk
kkCCy
kkkCCy
44
52
8
322
44
521
8
32
231
21
Ejercicio 23: Hallar una solución particular de: kcosyE k 1 por el método de los
coeficientes indeterminados.
BsenkkcosAyk y 111 kBsenkcosAyk
Remplazando:
kcosBsenkkcosAkBsenkcosA 11
kcos
BsenkkcosAkcossencossenkBsensenkcoskcosA
kcossenkBcosBAsenkcosABsencosA
1 ABsencosA (1)
0 BcosBAsen (2)
Despejando A de la ecuación (2) se obtiene:
sen
cosBA
1
Reemplazando A en la ecuación (1) se obtiene:
1
11
Bsen
sen
coscosB
senBsencosB 221
56
senBsenBcosBcosB 22 2
sencoscossenB 1222
sencosB 12
12
cos
senB
sen
cos
cos
senA
1
12
2
1A
La solución particular es:
senk
cos
senkcosyk
1221
Ejercicio 24:
Resolver: R
RRR R 352386 2
12
Ecuación Homogénea:
086 12 RRR
042
0862
R
R
EE
EE
Ecuación auxiliar:
42
042
21
r;r
rr
Solución homogénea:
R
R RC C 1 22 4
Utilizando el método de los coeficientes indeterminados se halla la solución particular prueba:
57
R
RA R A R A A 1
2
2 3 4 3
Sustituyendo la solución particular prueba en la ecuación diferencia se obtiene:
R
RR
RRRR
AAAARAARA
AARARAAARARA
AARARA
3243833
383116
32286
4123122
1
4322
11
432
2
1
2432
2
112
RR RAAAARAARA 35233243833 2412312
21
33 1 A
5
2243
083
4
123
12
A
AAA
AA
59
443
81 5321 A,A,A,A
Su solución particular es:
RR RR 35
9
44
3
82
La solución general:
R
R R RC C R R 1 2
22 48
3
44
95 3
Ejemplo 2:
En un proceso químico se alimentan 10.000 lb/h de un líquido puro A al primero de una batería de 2 reactores de tanque agitado de igual tamaño que operan en serie. Si ambos recipientes se mantienen a la misma temperatura constante, tal que toma lugar la reacción
A B Ck k1 2
estime el tamaño de los recipientes que darán el máximo beneficio del producto B.
Las constantes de velocidad específica son 11 10 min.k y 1
2 050 min.k a la
temperatura de operación y la densidad del fluido es constante e igual a 60
lbft 3.
58
En la figura 1 se muestra el esquema de la batería de reactores. CA n1
:Concentración de A en el reactor n
CB n1 :Concentración de B en el reactor n
CC n1 :Concentración de C en el reactor n
Figura 1. Esquema de batería de reactores
Balance de masa de A en el reactor n :
A ,nA ,nA ,n
nAnAnA
θCkCC
qCVCkqC
11
11
, , ,
donde V
q V Volumen del reactor q Flujo volumétrico
Balance de masa de B en el reactor n :
A,nB,nB,nB,n
A ,nB ,nB ,nB ,n
θCkθCkCC
VCkqCVCkqC
121
121
Si k1 y k2
de (1):
01 11 n,An,A CEC
(1)
(2)
1 2 n N
q q q qCA,0 CA,1 CA,n-1 CA,N
V1 V2 Vn VN
1 2 n N
q q q qCA,0 CA,1 CA,n-1 CA,N
V1 V2 Vn VN
59
011 1 n,ACE Ecuación diferencia homogénea
n
n,A KC 11 (3)
donde K1 Constante
1
11
Reemplazando CA n, en (2)
nKCCC n,Bn,Bn,B 111
n
n,Bn,B KCC 111 1
n
nB KC 111,1)1( Ecuación diferencia no homogénea
Solución complementaria:
n
nB KC 22,
donde:
K2 = constante
1
12
Se halla la solución particular utilizando el método de los operadores inversos:
1111
1
1
11111
nn
n,B
KK
EC caso 1
nn,B
nn
n,B
KC
KKC
11
111
1
111
1 11
Solución general para CB,n :
60
n
1
1n
22n,B
KKC
(4)
Aplicando condiciones límites:
C C
C C
A A
B B
,
,
0
0 0 para n=0
De la ecuación (3):
K CA1 0 ,
De la ecuación (4):
KC
KC
A
A
2
0
2
0
0
,
,
Reemplazando las constantes en (4):
CC
B n
A n n
,
,
0
1 2
Para una batería de dos reactores:
22
21
0
2
,A
,B
CC
2
2
2
112
01
21
1
1
1
kkkk
CkC
,A
,B
61
033133320
112
11
0
112
23
3
1
3
2
3
2
2
3
1
1
2
3
1
1
3
2
2
12
012
.
kk
k
k
k
k
d
dC
k
k
k
k
kk
Ck
d
dC
,B
,A,B
La raíz real de la ecuación anterior es 7.024 min. Esta raíz debe chequearse con
la segunda derivada para saber si corresponde a un máximo.
4
2
22
4
1
21
12
01
2
22
11
6
k
k
k
k
kk
Ck
d
Cd ,A,B
Reemplazando:
11
12
10
050
0247
min.k
min.k
min.
0,2
2,
2
44
0,2
2,
2
00528.0
105.7109.1112
A
B
A
B
Cd
Cd
Cd
Cd
El valor de min. 0247 corresponde a un máximo.
,2max ,00.4053B AC C
43 1 310min 7.024min 19.51
3600V q ft ft
62
2.5.7. Ecuaciones de diferencia no lineales Estos tipos de ecuaciones generalmente se originan en la solución de problemas de ingeniería y ellos son difíciles y algunas veces imposibles de resolver. Sin embargo, las ecuaciones no lineales de primer orden se pueden resolver gráficamente, y algunas de segundo orden se pueden resolver por sustituciones.
2.5.7.1 Soluciones gráficas Si se considera la ecuación no lineal:
021 BAyyy nnn
Donde A y B son constantes, ésta debe reordenarse de la forma:
BAyyy nnn 2
1
Seleccionando un conjunto de valores para yn, se puede calcular un conjunto
correspondiente de valores para yn+1, de tal manera que se puede graficar yn+1 vs
yn (ver figura 2).
La curva AB representa la ecuación BAyyy nnn 2
1. Para hallar la solución
se construye la recta PQ. Se comienza en la condición de frontera yo y subiendo
hasta la curva AB se obtiene el valor de y1. Luego se localiza el punto C en la recta
PQ. Desde C se dibuja una línea vertical hasta intersectar la curva AB en D. Las
coordenadas de D son (y1, y2). Continuando este procedimiento por pasos hasta N
pasos, se puede obtener el valor de yN+1; y también el valor de y correspondiente a
cada valor de n.
Este método funcionará para todas las ecuaciones de primer orden que se puedan separar en una forma simple tal como la de arriba. El método de Ponchon y Savarit y el método de McCabe-Thiele para determinar composiciones de los diferentes platos de alimentación en una torre de destilación de una mezcla binaria son ejemplos típicos de solución de ecuaciones de diferencias en forma gráfica en Ingeniería Química.
63
Figura 2. Solución gráfica de una ecuación diferencia Ejemplo 3: Se desea esterificar 454 kg/h de alcohol etílico por reacción con 386 kg/h de ácido acético en una batería de reactores CSTR continuos, cada uno de 0.85 m
3 de
capacidad y mantenidos a 100°C. Si la relación de equilibrio es tal que se esterifica el 75.2% del ácido, estime el número de reactores necesarios para una conversión del 60%. A 100°C la constante de velocidad de reacción para la esterificación es 4.76x10
-4
l/gmol.min, y para la hidrólisis del éster es 1.63x10-4
l/gmol.min. La densidad de la mezcla reaccionante puede suponerse constante e igual a 865 kg/m
3.
CH3COOH + C2H5OH CH3COOC2H5 + H2O En la figura 3 se muestra el esquema de la batería de reactores CSTR. Balance de masa para A en el reactor m:
rVqCqC m,Am,A 1 (1)
yn
yn+1
1 2 3 4 5 6 7
7
6
5
4
3
2
1
A
C
D
yn+1= yn2-Ayn-B
yn+1= yn
y2
y1
B
Q
P
y1yo y2
y3
yn
yn+1
1 2 3 4 5 6 7
7
6
5
4
3
2
1
A
C
D
yn+1= yn2-Ayn-B
yn+1= yn
y2
y1
B
Q
P
y1yo y2
y3
64
Figura 3. Esquema de batería de reactores CSTR
Si la reacción es de segundo orden, la velocidad de reacción es:
DCBA CCkCCkr 21 (2)
A: CH3COOH B: C2H5OH C: CH3COOC2H5 D: H2O Reemplazando (2) en (1): VCCkCCkqCqC DCBAm,Am,A 211
DCBAm,Am,A CCkCCkCC 211 (3)
q
V Tiempo de retención en el reactor
Si la concentración del reaccionante B supera inicialmente la de A en la cantidad c,
esta diferencia se conservará a través del sistema, de tal manera que en cualquier
reactor m, la concentración del reaccionante B es (CA,m + c). Por la estequiometría
de la reacción, la concentración de cada producto es CA,0 – CA,m.
Entonces:
CA: CA,m CB: CA,m + c CC: CA,0 –CA,m CD: CA,0 –CA,m Reemplazando estos datos en la ecuación (3):
2
0211 m,A,Am,Am,Am,Am,A CCkcCCkCC (4)
La ecuación (4) es una ecuación diferencia no lineal, que se resolverá gráficamente para determinar el número de reactores necesarios (N).
q q q q
A, B
q1 2 m N
q q q q
A, B
q1 2 m N
65
3
30
3
3
636970
1
60
1386
970865
386454
m/kgmol.m.
h
kg
kgmol
h
kgC
h/m.m/kg
h/kgq
,A
Similarmente:
300
3
30
5436361710
1710970
1
46
1454
m/kgmol...CCc
m/kgmol.m.
h
kg
kgmol
h
kgC
,A,B
,B
min.h.h/m.
m.
q
V
652880
970
8503
3
Sustituyendo los anteriores valores en la ecuación (4):
6526361063154310764244
1 .C...CC.CC m,Am,Am,Am,Am,A
377020210160 21 .C.C.C m,Am,Am,A
(5)
Se eligen valores arbitrarios de CA,m y se sustituyen en la ecuación (5) para
generar la siguiente tabla: Tabla 2. Concentraciones de ácido acético en cada etapa
CA,m CA,m-1
2 2.09
3 3.37
4 4.69
5 6.03
6 7.41
Se grafica CA,m-1 vs CA,m y se trazan las etapas partiendo de una composición del
alimento de 6.63 kgmol/m3, hasta que se cumpla con la conversión requerida del
60% (CA,m-1 = 0.4x6.63 = 2.65 kgmol/m3).
Según la figura 3: Número de reactores requeridos, N = 7 Concentración final de ácido acético, CA,m = 2.51 (62% conversión)
66
Figura 3. Análisis gráfico de reactores
2.5.7.2 Soluciones analíticas Sólo un número limitado de ecuaciones de diferencias no lineales se pueden resolver analíticamente y es posible porque se transforman en ecuaciones lineales. A continuación se presentan tres ejercicios que ilustran este caso.
Ejercicio 25:
Resolver: ; 2121 kkkkkk yyyyyy pista kk utany
kkk
kkkkkk
uuu
utanutanutanutanutanutan
21
2121
Solución complementaria:
2 1 0
1 1 4
2
kE E
r
0 2 4 6 8
0
2
4
6
8
76
5
4
3
2
1
6.63
2.51
CA
,m-1, kgm
ol/m
3
CA,m
, kgmol/m3
Ácido acético en el alimento
67
1 2
1
1 3 1 3,
2 2 2 2
1 3 3 21, tan
4 4 1 3 3
-
i ir r
3
2
3
21 21
ksenC
kcosCu
k
k
Solución particular (método de operadores inversos):
33
11
3
1
33
1
111
1
1
1
1
2
2
22
k
k
u
EEu
Solución general:
3
2
3
2
321
ksenC
kcosCtanyk
Ejercicio 26: Resolver :
yy kk 122
1 , pista:
kk ucosy
kk+
kk+
u cos ucos
ucos ucos
2
12
1
21
02
21
k
kk
uE
uu
kk
kk
Ccosy
Cu
2
2
2
1
Ejercicio 27: Resolver:
68
2
1 1 kk yy , pista: 2
1
kk uy
11
1
1
1
221
k
kk
kk
uE
uu
yy
Solución complementaria:
kk Cu 11
Solución particular (método de operadores inversos):
111
11
1
1
Euk
2
11
21
2
11
21
1
2
11
2
11
Solución general:
kk
k
k
Cy
Cu
12
1
12
1
1
1
Ejercicio 28: Resolver:
y y yn n n 2 1
2 ; pista: sacar logaritmo
02
2
2
12
12
12
nnn
nnn
nn
nnn
xxx
xxx
ylogx
ylogylogylog
0122 nxEE
012
nxE
69
nCC
n
on
oy
nCCx
110
1
Ecuación de Riccati: Es una ecuación diferencia de segundo grado que frecuentemente aparece en problemas de Ingeniería Química. La ecuación toma la forma:
011 CByAyyy nnnn
donde A, B y C son constantes. Esta ecuación se puede convertir en una ecuación
diferencia lineal haciendo la siguiente transformación.
nn uy
Sustituyendo en la ecuación original 011 CByAyyy nnnn
011 CuBuAuu nnnn
0211 CBAuBuAuu nnnn
Escogiendo de tal forma que:
02 CBA
Luego dividiendo por un+1un, se obtiene
0111
1
nn u
Bu
A
Si se define:
n
n
ux
1
011 nn xBxA
01
1
Bx
B
Ax nn Ecuación diferencia lineal no homogénea
70
Resolviendo esta última ecuación:
kB
ACx
n
n
0
donde :
2
1
BAk
2
110
BAB
AC
y
n
n
Ejemplo 4: Una solución de benceno y tolueno de 60% en mol de benceno se alimenta continuamente a una columna de destilación (figura 4). Si hay 9 platos entre el ebullidor y el plato de alimentación, y el producto de cabeza contiene 98%, mientras que el producto de cola 2% en mol de benceno; estime la eficiencia global en la zona de despojamiento de la torre. El alimento entra a la torre en el punto de burbuja, la volatilidad relativa del benceno al tolueno puede considerarse constante e igual a 2.3, y la relación de reflujo 3.0. Balance de benceno en la zona de despojamiento hasta el plato n:
Lx Gy Wxn n w 1
Como la volatilidad relativa es constante, la relación de equilibrio esta dada por:
y
y
x
x
n
n
n
n
*
*1 1
(1)
71
Figura 4. Balance de masa en destilador
n
nn
x
xy
11
*
Remplazando (2) en (1):
Lx G
x
xWxn
n
n
w
1
1 10
Lx x G x Wx xn n n w n 1 1 1 1 1 0
Lx L x x G x Wx W x xn n n n w n w 1 11 1 0
0
11
1
1
111
L
Wxx
L
WxGxxx w
nw
nnn
Llamando:
F, xF
D, xD
W, xw
n
yn
yn-1
xn+1
xn
n
F, xF
D, xD
W, xw
n
yn
yn-1
xn+1
xn
n
(2)
72
A
1
1
1
1
L
WxGB w
C
Wx
L
w 1
x x Ax Bx Cn n n n1 1 0
La ecuación anterior es la ecuación de Riccati, cuya solución es:
2
110
BAB
AC
x
n
n
Si se supone 100 lbmol de alimento:
D.D.
WD
10002098060
100
6281
62411
639460
.RDFL
.DRG
.W,.D
00220
5231
769031
1
1
1
.C
.B
..
A
Escogiendo de tal forma que:
2 0 A B C
0030
7570
0002207540
2
1
2
.
.
..
Remplazando los valores de A, B y 1 se obtiene
73
1
0 0030502 1310
xC
n
n
.. .
Asumiendo que el ebullidor se comporta como una etapa ideal, se puede evaluar
C0, asignando al ebullidor n=0, o sea x0 = 0.02
C0 42 2.
31.1502.02.42003.0
1
n
nx
Para determinar el número de platos ideales en la zona de despojamiento se ubicará primero el plato de la alimentación. Inicialmente se estima nf asumiendo
que xnf = 0.60.
3115020242003060
1...
..fn
5020
24234840
.log
..logn f
nf = 6.96 Con este estimado se calcula x7 y x6 para decidir en cual de los platos ideales se
hace la alimentación.
500.0003.0
31.1502.02.42
166
x
603.0003.0
31.1502.02.42
177
x
Como x7 xf, puede decidirse la alimentación en el plato 6, con esta condición,
100E0 rd
f
n
n
1009
6
%7.66
74
2.6. Ecuaciones diferenciales - diferencias
Los procesos químicos que se llevan a cabo por medio de etapas, son analizados con la ayuda de las ecuaciones de diferencias cuando se operan en estado estacionario. Sin embargo, cuando este tipo de procesos está sujeto a un cambio en las condiciones de operación, las composiciones de las corrientes que pasan a través de las etapas cambian con el tiempo. Esto implica la adición de términos diferenciales y la ecuación resultante se llama ecuación diferencial - diferencia. En muchas ocasiones las ecuaciones resultantes no pueden ser resueltas analíticamente y se hace necesario un análisis etapa a etapa con ayuda del computador. Las soluciones analíticas de ecuaciones diferenciales son definidas por la conversión de este tipo de ecuaciones diferenciales por medio de la transformación de Laplace.
2.6.1.Transformación de Laplace El método operacional "La transformación de Laplace" es una técnica mediante la cual una ecuación diferencial ordinaria se convierte en una ecuación algebraica equivalente, para encontrar la solución particular de la ecuación diferencial.
Figura 5. Transformación de Laplace
Como se ilustra en la figura 5 la transformación de Laplace ofrece una alternativa para encontrar la solución particular a una ecuación diferencial. Este procedimiento
Dominiot
DominiosTransformación
directa
Ecuación Diferencial Ecuación algebraica
Solución general
Solución particular Solución particular
Transformacióninversa
Sistema Lineal
e(t) y(t) E(s) Y(s)
y(t)
Q(D)y(t) = e(t)
Y(s)
Dominiot
DominiosTransformación
directa
Ecuación Diferencial Ecuación algebraica
Solución general
Solución particular Solución particular
Transformacióninversa
Sistema Lineal
e(t) y(t) E(s) Y(s)
y(t)
Q(D)y(t) = e(t)
Y(s)
75
tiene la ventaja que al convertir la ecuación diferencial en una ecuación algebraica el proceso de solución resulta ser más simple que el requerido en el dominio del tiempo. La transformación de la ecuación diferencial en una ecuación algebraica en el dominio de s utiliza unas reglas conocidas en el dominio del tiempo y luego se obtiene la solución particular (y(t)), mediante la transformación inversa de esta solución en el dominio del parámetro s (Y(s)). En este proceso las condiciones límites se introducen en la ecuación algebraica, antes de encontrar la solución particular, a diferencia del método directo, en donde las condiciones límites se aplican después de obtener una solución general.
La transformación de Laplace está definida para una función continua de una
variable independiente t, f(t), para todos los valores de t mayores que cero como:
sfdttfetfL st
0
donde s es un parámetro lo suficientemente grande que hace convergente la integral en el límite superior.
2.6.2. Transformadas elementales
s/aaL. 1
as
eL at
1
.2
1
!.3
n
n
s
ntL
;para n entero
1
1
ns
n ; para n entero
1.
sfRtRfL. 4
0.5 , fsfstfL
1 Función Gama:
n t e dtn t
1
0
Propiedades:
11 nnn.i
!nn.ii 1 ;para n entero.
n.iii ;para n entero negativo o n =0.
11 nnn.iv
76
ssfdttfLt
0
.6
1
!.7
n
atn
as
netL
, para n entero.
22
.8
stSenL
22
.9
s
stCosL
22
.10
stSenhL
22
.11
s
stCoshL
00.12 2 fsfsfstfL
0...00.13 121 nnnnn ffsfssfstfL
2.6.3. Transformadas inversas Existen varios métodos para transformar una función del dominio del parámetro s al dominio del tiempo. El método más simple consiste en descomponer la función
f s en términos cuya inversa sea conocida. En algunos casos no es posible
utilizar esta técnica, por lo tanto debe recurrirse a otros métodos como el método de la integral de convolución y el método de los residuos.
2.6.3.1. Método de la Integral de Convolución
Este método consiste en descomponer la función f s como el producto de dos
funciones para las cuales se conoce la transformada inversa:
shsgsf
La transformada inversa de sf se obtiene entonces como:
t
dhtgsfLtf0
1
77
g h t d
t
0
Ejercicio 29: Hallar la transformada inversa de:
f ss s a
12
ta
at
detf
teth,tgas
sh,s
sg
0
21
11
Integrando por partes:
vduuvudvtf
a
evdedv
dduu
aa
a
tee
a
ae
aa
tee
aa
ed
a
e
a
ede
atat
atat
t
aat at a
a
11
111
2
22
0
200
2.6.3.2. Método de los Residuos
Este es el método más poderoso para encontrar la transformada inversa de Laplace. El se encuentra ampliamente explicado en textos clásicos de ecuaciones diferenciales, y en virtud de que el propósito de este texto no es profundizar en detalles matemáticos, solo se presentarán las ecuaciones de utilidad para su aplicación.
78
Cuando f s es analítica2, excepto para singularidades que son únicamente
polos3, la transformada inversa está dada por:
f t tn
1
donde n t es el residuo de f s en el polo pn. Los residuos se pueden
determinar para un polo simple como:
tp
n
nn
nep
pjt
donde:
s
sjsf
nps
nds
sdp
Si pn es un polo múltiple de orden m, entonces:
mp
p
p
p
tp
np
tAet n
1
1
!1
donde:
n
pm
np ppm
A
!
1 m...,,,p 21
np
npm
pm
n
pm
n sds
dp
sfpss
m
nn
2 Una función f(z)es analítica, en el campo complejo, cuando solo existe un valor de la función
para cada valor de z y existe la primera derivada en todo el dominio de la función. 3 Los polos son los puntos en los cuales el denominador de la función se hace cero y por lo tanto
la función es indeterminada o sea que se hace infinita. Un polo es un punto singular removible
cuando, si existe un factor que multiplicado por la función la haga analítica. z z z f z
m 0
z0 polo, en caso contrario es “esencial”.
79
Ejercicio 30: Encontrar la transformada inversa de:
f ss s a
12
Polos: as,s 0
assassasss
sj
2
1
22
Residuo 1 t , es el residuo en el polo s 0 .
20
10
a
j
21
1
at
Residuo 2 t , es el residuo en el polo múltiple de orden dos, as
2 1 2t e A A tat
A a
A a
1 2
2 2
1
1
s
sfass12
2
2
1a
a
2 2
1s
s
2 2
1a
a
21
1
aA
80
aA
12
a
t
aet at
22
1
a
tee
atttf
atat 1
1221
Ejemplo 5:
Un sistema consiste de N tanques agitados cada uno de volumen v ft3 arreglados
en una cascada (figura 6). Si cada tanque inicialmente contiene agua pura y una
corriente salina de concentración x0 lbft-3
es alimentada al primer tanque a una rata
R ft3h
-1, calcular la concentración de salida del último tanque como función del
tiempo si la eficiencia de la agitación es del 100%.
Figura 6. Cascada de tanques agitados
Análisis en el tanque n:
Balance de masa para la sal:
dt
dxvRxRx
vxdt
dRxRx
nnn
nnn
1
1
Según la regla 5 del acápite 2.6.2:
(1)
R R R R
Xo
RXN
1 2 n N
R R R R
Xo
RXN
1 2 n N
81
0fsfs
dt
tdfL
Aplicando la transformada de Laplace (regla 5) a la ecuación (1):
01 nnnn xsxsvsxRsxR
En el tiempo t=0 no hay sal, entonces xn(0) = 0
sxvssxRsxR nnn 1
01 nn xRRvsx Ecuación diferencia lineal homogénea
01 nxRERvs
Rvs
Rr
n
nvsR
RAsx
(2)
El valor de A se obtiene a partir de las condiciones límites.
AvsR
RAsxo
0
Aplicando la regla 1 del acápite 2.6.2:
s
xxLsx o
oo (composición del alimento constante)
s
xA o
Reemplazando A en la ecuación (2):
nn
o
n
o
n
on
sv
Rsv
Rx
sv
Rv
R
s
x
vsR
R
s
xsx
11
Para n=N:
82
NN
oN
sv
Rsv
Rxsx
11
Definiendo:
N
ov
RxB
y
v
Ra
N
Nsas
Bsx
11 (3)
Utilizando las transformadas elementales (reglas 6 y 7):
sfs
dttfLt 10
N
atN
as!N
etL
1
1
1
y aplicándolas a la ecuación (3):
dtas
LBass
BLtxt
NNN
0
11 111
dt!N
etBtx
tatN
N
0
1
1
Se resuelve la integral por partes:
dttNdutu NN 21 1
a
evedv
atat
t atNatN
N dteta
Ne
a
t
!N
Btx
0
21 1
1
Continuando sucesivamente la integración por partes:
83
NN
atatNatN
Naa
e...
!Na
et
!Na
etBtx
1
21 2
21
Reemplazando B y a en la ecuación anterior:
NN
vtR
N
vtR
vtRNv
tRNN
N
vR
vR
e
vR
te...
vR!N
et
vR!N
et
vRxx
1
2112
21
0
!N
e
v
Rt
!N
e
v
Rt...e
v
Rtexx
vtRNv
tRN
vtR
vtR
N12
1
11
0
!N
vRt
...!
vRt
v
Rtexxx
N
vtR
ooN12
1
12
1
0
00!
N
i
i
vtR
Ni
vRt
exxx
Otro método para encontrar xn(t) es el método del residuo:
n
no
n
n
vsRs
Rx
vsR
R
s
xsx
0
Polos: s = 0
s = -R/v Polo multiple de orden n
sl
sjsxn
vsR
nsvvsRsl
vsRssl
Rxsj
n
n
n
1
0
Residuo 1(t) para s = 0
84
nn
no
RRl
Rxj
010
0
on
no xR
Rxt 1
Residuo 2(t) para s = -R / v de orden n
!1...
!2
12
3212
n
tA
tAtAAet
n
nv
Rt
vR
nA n
1
21
!1
1
n
nn
vsRs
Rx
vRss
02
nv
Rs
x0
nv
Rs
xs
2
02
nv
Rs
xs
3
02 2
n
vRx
ss 0
4
32
!3
n
n
n
n
vRx
s
ns 0
1
12
! 11
01
2 ! 1 xnv
Rn
00
1
! 1
! 1x
n
xnA
vR
nA n
2
22
! 2
1
n
n
n
n
vRx
s
ns 0
1
2
22
! 21
v
Rnxv
Rn ! 202
2
85
! 2
! 20
2
n
vRnx
A
v
RxA 02
vR
nA n
3
23
! 3
1
n
n
nn
vRx
s
ns 0
2
332
! 31
n
n
nn
vRx
vR
n
vR 0
2
332
! 31
n
nn
n
vRx
vR
n0
22
3
1
! 31
20! 3v
Rxn
203 ! 3
!3
1
vRxn
nA
20v
Rx
1
0
n
nv
RxA
10
20
002
! 1...
!2
n
v
Rt
v
Rt
n
x
v
Rtx
v
Rtxxet
12
0
! 1
1...
!2
11
n
v
Rt
v
Rt
nv
Rt
v
Rtex
1
000
n
k
k
v
Rt
n!k
vRt
exxtx
Si n = N
1
000
N
k
k
v
Rt
N!k
vRt
exxtx
Utilizando el método de la integral de convolución:
86
shsgvsRs
Rxsx
n
n
n
0
s
Rxsg
n0
n
n
vRs
vsh
1
nRxtg 0
vRt
nn
etn
vth
1
!1
1
tv
Rn
nn
n den
vRxtx
0
1
0! 1
1
t v
Rn
n
n dn
ev
Rxtx0
1
0! 1
2.7. Problemas propuestos 1. Muestre que la solución general de la ecuación diferencia:
2
2
2
423 xyx
y
x
y
está dado por:
7262121 221 xhxhxChxCy h
xh
x, donde C1(x) y C2(x)
tienen periodos igual a h. 2. Resolver
a. nyy nn 1
b. 022 123 nnnn yyyy
c. 0485 123 nnnn yyyy
d. 122 12 nnn yyy
e. nnyyy nnn cos44 12
f. 21 nnn xxx ; 10 01 x,x
g. n
nnn xxx 268 21
3. Demostrar que para una extracción líquido - líquido con flujo cruzado donde los
solventes son insolubles y la relación de equilibrio es lineal de la forma y’ =
mx’, donde x´ y y´ son razones másicas en las fases extractoras y refinadas, se
cumple:
87
x x
y
m
y
mNp F
S
Np
S1
1
1log
my
x
my
xlog
Np
SNp
SF
donde:
mB
A
B: Flujo másico de solvente extractor/etapa A: Flujo másico de solvente original
2.8 Bibliografía Jenson, V.G., Jeffreys, G.V. “ Mathematical methods in Chemical engineering”, Academic Press, New York, 1963. Mickley, H.S., Sherwood, T.S., Reed, C.E., "Applied Mathematics in Chemical Engineering". McGraw, New Delhi, 1975. Spiegel, M.R., "Theory and problems of calculus of finite differences and difference equations", McGraw-Hill, New York, 1970.
90
CAPÍTULO III
MÉTODOS NUMÉRICOS
TABLA DE CONTENIDO
3.1. Solución de ecuaciones no – lineales ............................................................ 91
3.1.1. Ceros reales ........................................................................................... 92
3.1.1.1. Método de la bisección ..................................................................... 93
3.1.1.2. Método de la falsa posición (regula - falsi) ........................................ 96
3.1.1.3. Método de la falsa posición modificado ............................................ 98
3.1.1.4. Método de la secante ......................................................................100
3.1.1.5. Método de Newton ..........................................................................102
3.1.1.6. Método de las sustituciones sucesivas ............................................103
3.1.1.7. Método de Wegstein .......................................................................105
3.1.2. Ceros complejos ....................................................................................106
3.2. Solución de ecuaciones lineales simultáneas ...............................................109
3.2.1. Método de Jacobi...................................................................................110
3.2.2. Método de Gauss - Siedel ......................................................................113
3.3. Ecuaciones simultáneas no lineales .............................................................115
3.4. Interpolación y aproximaciones ....................................................................120
3.4.1. Aproximaciones polinomiales .................................................................122
3.4.1.1. Método de Gregory- Newton ...........................................................123
3.4.1.2. Método de Lagrange .......................................................................125
3.4.1.3. Aproximación con puntos base igualmente espaciados ...................127
3.4.2. Aproximación de funciones por el método de los mínimos cuadrados ....129
3.5. Diferenciación numérica ...............................................................................133
3.6. Integración numérica ....................................................................................138
3.6.1. Fórmulas de integración cerradas ..........................................................138
3.6.1.1. Regla trapezoidal.............................................................................138
3.6.1.2. Regla de Simpson ...........................................................................139
3.6.2. Fórmulas de integración abierta .............................................................141
3.7. Solución de ecuaciones diferenciales ordinarias ...........................................144
3.7.1. Método de desarrollo de Taylor ..............................................................145
3.7.2. Método de Euler ....................................................................................147
3.7.3. Métodos de Runge-Kutta .......................................................................148
3.9. Sistemas de ecuaciones diferenciales ordinarias ..........................................150
3.10. Ejercicios propuestos .................................................................................155
3.11. Bibliografía .................................................................................................158
91
CAPÍTULO III.
MÉTODOS NUMÉRICOS
Los métodos numéricos son métodos en análisis matemático que permiten la solución de un problema en una forma aproximada, por medio de operaciones aritméticas y lógicas, en un número finito de etapas. El conjunto de pasos secuenciales que deben realizarse para alcanzar la solución de un problema determinado se llama algoritmo. Los algoritmos diseñados para la solución de problemas mediante métodos numéricos contemplan la posibilidad de un número infinito de operaciones, de las cuales en la práctica sólo pueden realizarse un número finito. Este hecho hace que la solución no sea exacta y la aproximación dependa del número de etapas de cálculo realizadas. En una solución por métodos numéricos pueden haber involucrados dos tipos de errores en la respuesta
Error de truncamiento
Error de redondeo El error de truncamiento es el error introducido en la aproximación de la solución de un problema matemático por un método numérico en el cual sólo pueden desarrollarse un número finito de etapas de cálculo. El error de redondeo es el error causado por el redondeo resultado de operaciones aritméticas individuales; porque en las máquinas donde se llevan a cabo las operaciones sólo es posible retener un número finito de dígitos. Este error depende de la máquina donde se llevan a cabo dichas operaciones. Se define estabilidad numérica como la inmunidad que posee un algoritmo a la acumulación de errores de redondeo.
3.1. Solución de ecuaciones no – lineales La mayoría de las ecuaciones se originan con términos al lado derecho e izquierdo del signo igual, pero es tradicional sustraer uno de los dos lados de tal forma que
conduzca a f(x) = 0. Cuando solo hay una variable independiente, el problema es
unidimensional, para lo cual se denomina la solución de esta ecuación como raíces o ceros de la función.
92
3.1.1. Ceros reales
Los métodos utilizados para hallar los ceros reales de las ecuaciones f(x) = 0 son
métodos que generalmente empiezan con uno o más valores iniciales aproximados
o supuestos para las raíces, a partir de los cuales se genera una secuencia x0, x1,
xk, que se espera converja a la raíz. Aunque existen métodos numéricos
restringidos a polinomios que pueden producir aproximaciones simultáneas a todas las raíces como el método de Graeffe y el algoritmo QD, los métodos que aquí se presentan son generales. La mayoría de los métodos iterativos se pueden escribir en la forma:
kk xgx 1
para una adecuada función g(x) y una aproximación inicial x0. En ciertos métodos
es suficiente conocer un intervalo [a,b] en el cual se encuentra la raíz o las raíces.
En otros es conveniente estimar o suponer un x0, el cual está suficientemente
cercano a la raíz. Se advierte que para hacer la selección de los intervalos iniciales de búsqueda se debe tener en cuenta las siguientes consideraciones:
a. Intervalos donde la función tenga el mismo signo en los extremos no necesariamente indican que no existe raíz, sino que también se puede contener una raíz en donde la función es tangente al eje x o múltiples raíces (ver figura 1a y 1b).
b. En ocasiones el cambio de signo en el valor de la función en los extremos del intervalo no significa la existencia de una raíz, ya que ese cambio puede ser ocasionado por la presencia de singularidades (ver figura 1c).
En todos los métodos se realizan las iteraciones hasta que se obtenga la convergencia deseada, la cual puede ser calculada de las dos siguientes maneras:
i. kxf y
1
1
k
kk
x
xx
ii. kxf y kk xx 1
93
(a) (b)
(c)
Figura 1. Ejemplos gráficos de selección de intervalos
3.1.1.1. Método de la bisección Este es el método más simple y consiste en estrechar el intervalo donde se encuentra la raíz, lo cual se determina con la diferencia de signos en la función para los valores extremos del intervalo. Luego se evalúa la función en el punto medio del intervalo y se examina su signo; se usa el punto medio para reemplazar alguno de los dos puntos límites, tal que se conserve la diferencia de signos del valor de la función en los extremos del subintervalo.
Dada una función f(x) continua en el intervalo [a0,b0] tal que f(a0)f(b0) 0, la
aproximación de la raíz en cada etapa se hace con la fórmula:
2
kkk
bax
f(x)
ao bo
f(x)
ao bo
f(x)
ao bo
f(x)
ao bo
f(x)
ao
bo
f(x)
ao
bo
94
Siendo ak y bk los límites del intervalo en cada iteración k, donde está contenida la
raíz. La elección del nuevo intervalo se hace de acuerdo con los siguientes criterios:
Sí 0kk xfaf kk aa 1 y kk xb 1
Sí 0kk bfxf kk xa 1 y kk bb 1
Figura 2. Representación gráfica del método de la bisección
Ejemplo 1: Calcule el volumen molar para el amoníaco gaseoso a una presión de 56 atm y una temperatura de 450 K usando la ecuación de estado de Redlich-Kwong:
TbVV
a
bV
RTP
Donde:
95
c
c
c
c
P
RT.b
P
TR.a
086640
4274702
52
P: Presión en atm
V: Volumen molar en l/gmol
T: Temperatura en K
R: Constante de los gases, R = 0.08206 atm.l/(gmol.K)
Tc: Temperatura crítica, Tc = 405.5 K para amoníaco
Pc: Presión crítica, Pc = 111.3 atm para amoníaco
Reemplazando R, Tc y Pc se hallan los valores de las constantes a = 85.635 y b =
0.0259. Estas constantes se sustituyen en la ecuación de estado:
45002590
63585
02590
45008206056
.VV
.
.V
.
Reorganizando la ecuación queda:
5602590
03694
02590
927360
.VV
.
.V
.Vf
Esta es una ecuación no-lineal, cuya raíz V desea conocerse. Para esto se
utilizará el método de la bisección. Para definir el intervalo de búsqueda se calculó el volumen molar usando la ecuación de los gases ideales a 450 K y 56 atm, el volumen molar ideal es 0.6594 l/gmol. Alrededor de este valor se encuentra el volumen real, por lo que se ensayará la búsqueda en el rango entre 0.5 y 1.
2
k kk
a bV
ao = 0.5 f(0.5) = 6.5363
bo = 1.0 f(1.0) = -22.0261 f(ao)f(bo) < 0
Los datos de las iteraciones se tabulan en la tabla 1.
96
El volumen molar para el amoníaco a 56 atm y a 450 K es aproximadamente 0.5698 l/gmol
Tabla 1. Iteraciones del ejemplo 1 con el método de la bisección
k Vk f(Vk) ak bk
0 0.75 -11.94 0.5 1.0
1 0.625 -4.2858 0.5 0.75
2 0.5625 0.6196 0.5 0.625
3 0.5938 -1.9467 0.5625 0.625
4 0.5782 -0.697 0.5625 0.5938
5 0.5704 -0.0505 0.5625 0.5782
6 0.5665 0.2783 0.5625 0.5704
7 0.5685 0.1092 0.5665 0.5704
8 0.5695 0.025 0.5685 0.5704
9 0.57 -0.017 0.5695 0.5704
10 0.5698 -0.0002 0.5695 0.57
Tomando como criterio de convergencia 31 10kf V y 31
1
1 10k k
k
V V
V
se toma como aproximación del volumen molar el valor 0.5698 l/gmol, pues en la
iteración 11 se tiene que 42 10kf V y 41
1
3.51 10k k
k
V V
V
3.1.1.2. Método de la falsa posición (regula - falsi) Este método elige la secante entre los puntos (ao, f(ao)) y (bo, f(bo)), o en general la secante entre los puntos que definen el intervalo actual para determinar la aproximación de la raíz; ésta se toma como el punto donde la línea cruza el eje. Se usa esta aproximación para reemplazar uno de los dos extremos del último intervalo, de tal manera que se conserve el cambio de signo en el valor de la función en los extremos del nuevo intervalo de aproximación. En la figura 3 se representa el proceso iterativo.
Dada una función continua f(x) en el intervalo [a0,b0] tal que 000 bfaf ; la
aproximación de la raíz en cada etapa se hace con la fórmula:
kk
kkkkk
afbf
bafabfx
97
kk
kkkkk
bfaf
abbfbx
Siendo ak y bk los límites del intervalo en cada iteración k, donde está contenida la
raíz.
Figura 3. Representación gráfica del método de la falsa posición
La elección del nuevo intervalo se hace de acuerdo con los siguientes criterios:
Sí 0kk xfaf kk aa 1 y
kk xb 1
Sí 0kk bfxf kk xa 1 y
kk bb 1
Ejemplo 2: Hacer el ejemplo 1, usando el método de la falsa posición.
5602590
03694
02590
927360
.VV
.
.V
.Vf
f(x)
ao
bo
xox1 x2
f(x)
ao
bo
xox1 x2
98
kk
kkkkk
afbf
bafabfV
En la tabla 2 se muestran las iteraciones realizadas.
Tabla 2. Iteraciones del ejemplo 2 con el método de la falsa posición
k ak bk Vk f(ak) f(bk) f(Vk)
0 0.5 1.0000 - 6.5363 -22.0261 -
1 0.5 0.6144 0.6144 6.5363 -3.5155 -3.5155
2 0.5 0.5744 0.5744 6.5363 -0.3842 -0.3842
3 0.5 0.5703 0.5703 6.5363 -0.0399 -0.0399
4 0.5 0.5698 0.5698 6.5363 -0.0041 -0.0041
5 0.5698 -0.0004
Tomando los mismos criterios de convergencia usados en el ejemplo 1, se toma como aproximación del volumen molar el valor 0.5698 l/gmol, pues en la sexta
búsqueda 44 10kf V y 1
1
0k k
k
V V
V
, valores que son menores que
1x10-3
3.1.1.3. Método de la falsa posición modificado El método consiste en disminuir la pendiente de la secante entre el punto fijo y la nueva posición, esto se logra reduciendo el valor de la función del punto fijo a la mitad del valor real, y con estos dos valores se traza la nueva secante. Este procedimiento se puede apreciar gráficamente en la figura 4.
Dada una función f(x) continua en el intervalo [a0,b0] tal que 000 bfaf ;
la aproximación de la raíz en cada etapa se calcula con la fórmula:
FG
FbGax kk
k
Siendo ak y bk los límites del intervalo en cada iteración k, donde está contenida la
raíz y G y F son valores que inicialmente se calculan como: G = f(b0) y F= f(a0). La elección del nuevo intervalo se hace de acuerdo con los siguientes criterios:
99
Sí 0kk xfaf
2
1
1
FF
xfG
xb
aa
k
kk
kk
Figura 4. Representación gráfica del método de la falsa posición modificado
Sí 0kk xfbf
2
1
1
GG
xfF
bb
xa
k
kk
kk
Ejemplo 3: Hacer el ejemplo 1, usando el método de la falsa posición modificado.
5602590
03694
02590
927360
.VV
.
.V
.Vf
100
FG
FbGaV kk
k
En la tabla 3 se muestran las iteraciones realizadas.
Tabla 3. Iteraciones del ejemplo 3 con el método de la falsa posición modificado
k ak bk Vk F G f(Vk)
0 0.5000 1.0000 6.5363 -22.0261
1 0.5000 0.6144 0.6144 3.2682 -3.5155 -3.5155
2 0.5551 0.6144 0.5551 1.2597 -1.7578 1.2597
3 0.5551 0.5799 0.5799 0.6299 -0.8343 -0.8343
4 0.5658 0.5799 0.5658 0.3400 -0.4172 0.3400
5 0.5658 0.5721 0.5721 0.17 -0.1934 -0.1934
6 0.5687 0.5721 0.5687 0.0893 -0.0967 0.0893
7 0.5687 0.5704 0.5704 0.04465 -0.0468 -0.0468
8 0.5695 0.5704 0.5695 0.0228 -0.0234 0.0228
9 0.5695 0.5699 0.5699 0.0114 -0.0116 -0.0116
10 0.5697 0.5699 0.5697 0.0057 -0.0058 0.0057
11 0.5697 0.5698 0.5698 0.0029 -0.0029 -0.0029
El volumen molar es aproximadamente: 0.5698 l/gmol. En este ejemplo se tomó el
valor 5x10-3
como criterio de convergencia.
3.1.1.4. Método de la secante Este método es muy similar al de la falsa posición, la diferencia radica en que no se requiere que haya cambio de signo en la función para los extremos del intervalo [a0,b0] y se retiene el más reciente de los valores estimados (ver figura 5). La aproximación de la raíz en cada etapa se calcula con la fórmula:
1
111
kk
kkkkk
xfxf
xfxxfxx
1
11
kk
kkkkk
xfxf
xxxfxx
01 ax y
00 bx
101
Figura 5. Representación gráfica del método de la secante Este método tiene como desventajas: i. No converge si en el intervalo elegido existe un punto de inflexión. ii. No converge si en el intervalo existe un máximo o un mínimo.
Ejemplo 4: Hacer el ejemplo 1, usando el método de la secante.
5602590
03694
02590
927360
.VV
.
.V
.Vf
1
111
kk
kkkkk
VfVf
VfVVfVV
En la tabla 4 se muestran las iteraciones realizadas.
Tabla 4. Iteraciones del ejemplo 4 con el método de la secante
k Vk f(Vk)
-1 0.5000 6.5363
0 1.0000 -22.0261
1 0.6144 -3.5155
2 0.5412 2.5086
3 0.5717 -0.1583
4 0.5699 -0.0067
5 0.5698 0.0000
f(x)
ao bo
xo
x1
x-1
x2
f(x)
ao bo
xo
x1
x-1
x2
102
Con el mismo criterio de convergencia del ejemplo anterior se tiene como aproximación del volumen molar 0.5698 l/gmol.
3.1.1.5. Método de Newton Este método toma la raíz de la recta tangente en un punto cercano a la raíz buscada, como aproximación de la raíz de la función. Se distingue de los métodos vistos hasta ahora porque requiere de la evaluación de derivada además del valor de la función en cada etapa de aproximación (ver figura 6).
Dada una función f(x) continuamente diferenciable y un punto de la función
(x0, f(x0)), la aproximación de la raíz en cada etapa se calcula con la fórmula:
En este método solo se requiere un valor inicial xo para comenzar las iteraciones.
k
kkk
xf
xfxx
1
Figura 6. Representación gráfica del método de Newton
Ejemplo 5: Hacer el ejemplo 1, usando el método de Newton.
f(x)
x1xo
x2
f(x)
x1xo
x2
103
5602590
03694
02590
927360
.VV
.
.V
.Vf
2202590
02590203694
02590
92736
.VV
.V.
.V
.V'f
k
kkk
Vf
VfVV
1
En la tabla 5 se muestran las iteraciones realizadas:
Tabla 5. Iteraciones del ejemplo 5 con el método de Newton
k Vk f(Vk) f’(Vk)
0 0.5000 6.5363 -117.7371
1 0.5555 1.2254 -98.3495
2 0.5680 0.1535 -94.6535
3 0.5696 0.0168 -94.1877
4 0.5698 0.0019 -94.1366
El volumen molar es aproximadamente: 0.5698 l/gmol, si se toma el mismo valor de 5x10
-3 para el criterio de convergencia.
3.1.1.6. Método de las sustituciones sucesivas
Dada una f(x) = 0, el método requiere previamente despejar la variable
independiente de una manera sencilla en función de ella misma, para obtener una
ecuación de la forma x = F(x). El proceso parte de un valor inicial xo para calcular
F(xo), y en forma sucesiva genera aproximaciones con la fórmula :
kk xFx 1
El proceso de aproximación sucesiva se ilustra gráficamente en la figura 7.
Este método presenta problema cuando 1kxF en el intervalo de interés.
Ejemplo 6: Hacer el ejemplo 1, usando el método de sustituciones sucesivas.
104
5602590
03694
02590
927360
.VV
.
.V
.Vf
Despejando V del primer término de la ecuación:
Figura 7. Representación gráfica del método de sustituciones sucesivas
36.9270.0259
56 4.0636 / 0.0259F V V
V V
kk VFV 1
En la tabla 6 se muestran las iteraciones realizadas.
Tabla 6. Iteraciones del ejemplo 6 con el método de las sustituciones sucesivas
k Vk F(Vk)
0 0.5 0.5434
1 0.5434 0.5607
2 0.5607 0.5668
3 0.5668 0.5688
4 0.5688 0.5695
5 0.5695 0.5697
6 0.5697 0.5698
7 0.5698 0.5698
105
Como en los ejemplos anteriores también el volumen molar es aproximadamente:
0.5698 l/gmol, si se toma 1.0x10-3
como valor para la convergencia en 1k k
k
V V
V
3.1.1.7. Método de Wegstein Este método, como el método de la falsa posición y el de la secante, utiliza una recta secante a una curva para obtener aproximaciones de la raíz (ver figura 8).
Pero, requiere de la transformación de la función original f(x) = 0 en una forma
similar a como se hace en el método de las aproximaciones sucesivas para
obtener xF .
La aproximación de la raíz en cada etapa, se obtiene como el valor de x en donde
la secante de F(x) en dos puntos intercepta a la línea recta y = x (ver figura 8). La
fórmula algorítmica es:
11
111
kkkk
kkkkk
xFxFxx
xFxxFxx
Para comenzar el método se necesitan dos aproximaciones iniciales. Una de ellas
puede ser un punto arbitrario x0, y el otro se puede generar utilizando la técnica de
aproximaciones sucesivas
Figura 8. Representación gráfica del método de Wegstein
106
Ejemplo 7: Hacer el ejemplo 1, usando el método de Wegstein.
5602590
03694
02590
927360
.VV
.
.V
.Vf
02590025900636456
92736.
.VV/.
.VF
11
111
kkkk
kkkkk
VFVFVV
VFVVFVV
En la tabla 7 se muestran las iteraciones realizadas.
Tabla 7. Iteraciones del ejemplo 7 con el método de Wegstein
k Vk F(Vk)
0 0.5 0.5434
1 0.5434 0.5607
2 0.5722 0.5706
3 0.5698 0.5698
El volumen molar es aproximadamente: 0.5689 l/gmol
3.1.2. Ceros complejos
Método de Newton
Dada una función f(x), si sus raíces son complejos de la forma iyxz , la
función se puede expresar como:
y,xivy,xuzf
donde:
0
0
y,xv
y,xu para las raíces
Para encontrar las raíces se aplica la fórmula iterativa del método de Newton:
107
k
kkk
zf
zfzz
1
Esta fórmula es equivalente a:
yk,xkyx
xy
kkuu
uuvuxx
221
yk,xkyx
yx
kkuu
uuvuyy
221
donde:
y
uu;
x
uu yx
Las fórmulas iterativas equivalentes, para la parte real y la parte imaginaria, pueden demostrarse aplicando el teorema de Cauchy Riemann, que establece que:
yxyx uvvu
para una función analítica, es decir que sólo existe un valor de f(z) para un z dado:
idvduzdf
dyvdxvidyudxu yxyx
Como idydxdz
dz
zdfzf
idydx
dyvdxvidyudxu yxyx
y y y yv dx u dy i u dx v dy
f zdx idy
108
y yu dy idx v dx idy
f zdx idy
y yv dx idy iu dx idy
dx idy
y yf z v iu
Como 1
,k k
k k
y y x y
u ivz z
v iu
1 1 2 2
y y
k k k k
y y
u iv v iux iy x iy
v u
2 2 2 2
y y y y
k k
y y y y
uv vu uu vvx iy i
v u v u
ykxkyx
xy
kkuu
uuvuxx
,
221
1 2 2
,k k
x y
k k
x y x y
vu uuy y
u u
Ejercicio 1:
Hallar las raíces complejas del polinomio: x2
+ 2x + 5
Cambiando la variable x por z:
z2
+ 2z + 5 = 0
y,xivy,xuiyxiyx 522
109
y,xivy,xuyixyixyx 225222
52, 22 xyxyxu
yxyy,xv 22
22 xux yvx 2
yuy 2 22 xvy
Utilizando las fórmulas del método de Newton y partiendo del valor inicial:
iz 0 01
0
0
0
.y
x
se encuentran los valores presentados en la tabla 8.
Tabla 8. Iteraciones del ejercicio 1.
k x y u v ux uy
0 0.0 1.0 4 2 2 -2
1 -1.5 1.5 2.0 -1.5 -1.0 -3.0
2 -0.85 1.95 0.22 0.585 0.3 -3.9
3 -1.0034 1.9946 0.0158 -0.01356 -6.8 x 10-3
-3.9892
4 -0.99999 2.0000 - - - -
Soluciones numéricas:
i..z 029999901 20.99999 2.0z i
Soluciones analíticas:
i..z 02011 21.0 2.0z i
3.2. Solución de ecuaciones lineales simultáneas Un conjunto de ecuaciones lineales se puede expresar de la siguiente manera:
110
nnnnnn
nn
nn
bxa...xaxa
bxa...xaxa
bxa...xaxa
2211
22222121
11212111
Estas ecuaciones pueden representarse de una forma matricial, así:
BXA
donde:
nnnn
n
n
aaa
aaa
aaa
A
21
22221
11211
nx
x
x
X2
1
nb
b
b
B2
1
3.2.1. Método de Jacobi Este método es iterativo y genera la aproximación a través de un proceso repetitivo de cálculos. El sistema:
nnnnnn
nn
nn
bxa...xaxa
...
bxa...xaxa
bxa...xaxa
2211
22222121
11212111
Se puede transformar en:
nnnn,nnnnn
nn
nn
axa...xaxabx
axa...xaxabx
axa...xabx
112211
22232312122
11121211
De forma abreviada:
111
n,...,,i,axabx ii
n
ij
jjijii 21
1
A partir de valores iniciales de las variables se calcula el nuevo conjunto de aproximaciones recurriendo al sistema de ecuaciones transformadas. El algoritmo puede expresarse como:
n...,,,i,axabx ii
n
ij
jk,jijik,i 21
11
Para que este método converja, se requiere que el valor absoluto de cada valor en la diagonal sea mayor que la suma de los valores absolutos de los restantes elementos en la misma fila:
n
ijj
ijii aa1
El criterio de convergencia puede expresarse como:
n...,,,i,xx k,ik,i 211
Ejemplo 8: Realice los balances de materia en estado estable para el tren de separación que se muestra en la figura 9 y calcule los flujos molares para D1, D2, B1 y B2 si se alimentan 100 kgmol/min. Utilice para ello el método de Jacobi. Realizando el balance de masa resulta el siguiente sistema de ecuaciones:
112
207015005020
351065005010
25150106020
20050103050
2211
2211
2211
2211
B.D.B.D.
B.D.B.D.
B.D.B.D.
B.D.B.D.
Figura 8. Tren de separación para xileno, estireno, tolueno y benceno
D1
20% xileno
25% estireno
35% tolueno
20% benceno D2
B1
B2
50% xileno
20% estireno
10% tolueno
20% benceno
30% xileno
60% estireno
5% tolueno
5% benceno
10% xileno
10% estireno
65% tolueno
15% benceno
5% xileno
15% estireno
10% tolueno
70% benceno
D1
20% xileno
25% estireno
35% tolueno
20% benceno D2
B1
B2
50% xileno
20% estireno
10% tolueno
20% benceno
30% xileno
60% estireno
5% tolueno
5% benceno
10% xileno
10% estireno
65% tolueno
15% benceno
5% xileno
15% estireno
10% tolueno
70% benceno
113
50
050103020 2211
.
B.D.B.D
60
150102025 2211
.
B.D.D.B
650
100501035 2112
.
B.B.D.D
70
1500502020 2112
.
D.B.D.B
Se inician las iteraciones partiendo de valores iniciales D1 = B1 = D2 = B2 = 25.
Los resultados se muestran en la tabla 9:
Tabla 9. Iteraciones para el ejemplo 8 con el método de Jacobi
k D1 B1 D2 B2
0 25.00 25.00 25.00 25.00
1 17.50 22.92 44.23 14.29
2 15.98 24.89 47.19 12.46
3 14.38 25.36 47.56 12.12
4 14.06 25.92 47.82 12.46
5 13.64 25.90 47.77 12.46
6 13.66 26.04 47.84 12.59
7 13.55 25.99 47.80 12.56
8 13.59 26.04 47.83 12.60
9 13.55 26.02 47.81 12.58
10 13.57 26.04 47.83 12.60
11 13.55 26.02 47.82 12.59
12 13.56 26.03 47.82 12.59
13 13.56 26.03 47.82 12.59
D1 = 13.56 kgmol/h, B1 = 26.03 kgmol/h, D2 = 47.82 kgmol/h, B2 = 12.59 kgmol/h
3.2.2. Método de Gauss - Siedel Es también un método iterativo, que a diferencia del método de Jacobi, en el que las nuevas aproximaciones se calculan todas a partir de un mismo conjunto de valores precedentes, en este caso, los valores que se van obteniendo para cada variable son inmediatamente involucrados en el cálculo de la variable siguiente. El algoritmo puede expresarse como:
114
n,...,,i,axabx ii
n
ij
jjijii 21
1
La aproximación en cada etapa se puede expresar algorítmicamente como:
1
, 1 , 1 ,
1 1
i n
i k i ij j k ij j k ii
j j i
x b a x a x a
Este método y el de Jacobi exigen una configuración especial del sistema de
ecuaciones, de tal forma que 0iia .
Al igual que en el método de Jacobi, para que este método converja, se requiere que el valor absoluto de cada valor en la diagonal sea mayor que la suma de los valores absolutos de los restantes elementos en la misma fila:
n
ijj
ijii aa1
Ejemplo 9: Realice el ejemplo 8 utilizando el método de Gauss-Siedel. Se utilizan las misma ecuaciones y los mismos valores de partida, la diferencia radica en que el valor aproximado para cada variable se calcula con los ya computados. En la tabla 10 se presentan las iteraciones.
Tabla 10. Iteraciones para el ejemplo 9 con el método de Gauss - Siedel
k D1 B1 D2 B2
0 25.00 25.00 25.00 25.00
1 17.50 25.42 45.35 12.04
2 14.48 26.27 47.75 12.33
3 13.45 26.14 47.87 12.60
4 13.48 26.04 47.83 12.61
5 13.55 26.03 47.82 12.59
6 13.56 26.03 47.82 12.59
7 13.56 26.03 47.82 12.59
8 13.56 26.03 47.82 12.59
D1 = 13.56 kgmol/h, B1 = 26.03 kgmol/h, D2 = 47.82 kgmol/h, B2 = 12.59 kgmol/h
115
3.3. Ecuaciones simultáneas no lineales
Método de Newton-Raphson
Es el método de Newton aplicado a un sistema de ecuaciones. Si se tiene un sistema:
0
0
0
2
1
Xf
Xf
Xf
N
donde X
es un vector columna definido por las variables Nx,...,x,x 21
:
tN
N
x,...,x,x
x
x
x
X 21
2
1
Se hace una expansión de Taylor de cada una de las funciones en las cercanías de un vector
kX , y tomando únicamente los términos con primeras derivadas.
En general, la función de Taylor se escribe de la siguiente manera:
!
ha"'f
!
ha"fha'fafhafxf
32
32
Aplicando a la función 1kf X
N
jj
j
kkk x
x
XfXfXf
1
1111
N
jj
j
kkk x
x
XfXfXf
1
2212
116
N
jj
j
kNkNkN x
x
XfXfXf
11
Se toma como aproximación en cada etapa que 01 ki Xf
, entonces:
kN
N
kk Xfxx
Xfx
x
Xf
11
1
1
1
kN
N
kk Xfxx
Xfx
x
Xf
22
1
1
2
kNN
N
kNkN Xfxx
Xfx
x
Xf
1
1
Llamando kX la jacobiana del sistema:
1 1 1
1 2
1 2
k k k
N
k
N k N k N k
N
f X f X f X
x x x
X
f X f X f X
x x x
k
es el vector de los incrementos:
tNk x,...,x,x 21
y kf X es el vector con los valores de las funciones en la etapa k.
tkNkkk Xf,...,Xf,XfXf
21
El sistema de ecuaciones que contiene a kX es un sistema de ecuaciones
lineales, donde las variables están definidas por el vector k
, la matriz de
117
coeficientes es la matriz jacobiana kX y los términos independientes los
define el vector kf X .
k k kX f X
Con estas definiciones y con un vector de solución aproximado:
tNx,...,x,xX 100
el proceso iterativo de aproximaciones sucesivas a la solución del sistema está dado por la ecuación recursiva:
kkk XX
1
El procedimiento iterativo es el siguiente:
1. Escribir las ecuaciones en la forma apropiada, 0Xfi
.
2. Hallar la matriz jacobiana X
.
3. Inicializar 0XX
, para cada etapa de aproximación.
3.1. Evaluar las componentes del vector kXf
y la matriz kX
.
3.2. Calcular k
resolviendo el sistema de ecuaciones lineales definidas por:
kkk XfX
ó 1
k k kX f X
3.3. Calcular la nueva aproximación como:
kkk XX
1
3.4. Volver a 3.1. hasta que se haya alcanzado el grado de convergencia deseado.
La convergencia se puede definir como:
N,...,,i,ik 211
que puede combinarse con:
N,...,,i,)X(f ki 212
Ejemplo 10: Las siguientes reacciones toman lugar en un reactor batch de volumen constante y en fase gaseosa:
118
A + B C + D
B + C X + Y
A + X Z
Halle las concentraciones de cada uno de los componentes si las constantes de
equilibrio para cada reacción son K1 = 1.06, K2 = 2.63 y K3 = 5. Tome como
valores de partida CA0 = CB0 = 1.5 y CD0 = CX0 = CZ0 = 0.
Las constantes de equilibrio para cada reacción son:
BA
DC
CC
CCK 1
CB
YX
CC
CCK 2
XA
Z
CC
CK 3
Por la estequiometría de las reacciones resultan las siguientes cuatro ecuaciones:
0
0
A A D Z
B B D Y
Y D C
Z Y X
C C C C
C C C C
C C C
C C C
En la solución del problema se utiliza el método de Newton-Raphson y se usa
como criterios de convergencia 721103 3 ,...,,i,ik y
721101 4 ,...,,i,Xf ki
El sistema de ecuaciones que se genera es:
0
0
051
051
05
0632
0061
7567
6436
6425
7414
7513
65322
43211
xxxXf
xxxXf
.xxxXf
.xxxXf
xxxXf
xxxx.Xf
xxxx.Xf
Z
Y
X
D
C
B
A
C:x
C:x
C:x
C:x
C:x
C:x
C:x
7
6
5
4
3
2
1
tkkkkkkkk XfXfXfXfXfXfXfXf
7654321
119
2 1 4 3
3 2 6 5
5 1
1.06 1.06 0 0 0
0 2.63 2.63 0 0
5 0 0 0 5 0 1
1 0 0 1 0 0 1
0 1 0 1 0 1 0
0 0 1 1 0 1 0
0 0 0 0 1 1 1
k
x x x x
x x x x
x x
X
t
..X 0000051510
t
.Xf 00000038520
kkk XfX
1
001 XfXk
0 0.727 0.773 0 0.386 0.046 0.386 0.341t
001
XX
Se sigue este proceso en forma iterativa encontrándose que45 XX
. El resumen
de los resultados se muestra en la tabla 11. En virtud de que se cumplieron los dos criterios de convergencia se acepta como solución del sistema:
5 0.4207 0.2429 0.1536 0.7053 0.1778 0.5518 0.3740X , o sea:
CA = 0.474, CB = 0.251, CC = 0.254, CD = 0.498, CX = 0.223, CY = 0.751, CZ =
0.528
120
Tabla 11. Iteraciones para el ejemplo 10 con el método de Newton-Raphson
k x1 x2 x3 x4 x5 x6 x7
1 0,773 0,727 0,000 0,386 0,045 0,386 0,341
2 0,455 0,315 0,034 0,576 0,140 0,609 0,469
3 0,454 0,230 0,194 0,538 0,224 0,732 0,508
4 0,476 0,255 0,253 0,496 0,221 0,749 0,528
5 0,474 0,251 0,254 0,498 0,223 0,751 0,528
k 1 2 3 4 5 6 7
1 -0,32 -0,41 0,03 0,19 0,09 0,22 0,13
2 0,00 -0,08 0,16 -0,04 0,08 0,12 0,04
3 0,02 0,02 0,06 -0,04 0,00 0,02 0,02
4 0,00 0,00 0,00 0,00 0,00 0,00 0,00
k f1 f2 f3 f4 f5 f6 f7
1 0,596 -0,018 -0,165 0,000 0,000 0,000 0,000
2 0,133 -0,058 -0,150 0,000 0,000 0,000 0,000
3 0,006 -0,046 0,000 0,000 0,000 0,000 0,000
4 0,003 0,004 0,000 0,000 0,000 0,000 0,000
5 0,000 0,000 0,000 0,000 0,000 0,000 0,000
3.4. Interpolación y aproximaciones
Los usos más frecuentes de aproximación de funciones son: i. Reemplazar funciones complicadas por algunas más simples para realizar
operaciones más fácilmente, tales como: diferenciación o integración, o porque se necesita hacer aproximaciones de funciones que no pueden ser evaluadas
estrictamente con operaciones aritméticas, tales como: )( , xlnxsen ,
x t dtexerf0
22
,
0
1dZZex xz, cuando se utilizan en programas
de computadores. ii. Para interpolación en tablas, o sea, para evaluar una función en algún punto no
tabulado, cuando se conocen valores de la función en un conjunto de puntos tabulados.
Las aproximaciones más comunes de funciones son aquellas que tienen combinaciones lineales de funciones simples de algún tipo.
121
0
n
i i
i
f x g x a g x
0 0 1 1 ... n nf x a g x a g x a g x
Los tipos de funciones xgi más utilizados son:
a. Monomiales:
kk xxg
Las combinaciones lineales de funciones monomiales producen las funciones polinomiales:
2
0 1 2 ... n
nf x g x a a x a x a x
0
ni
i
i
f x g x a x
b. Trigonométricas:
kxsenbkxcosaxg kkk
Las combinaciones lineales de funciones trigonométricas generan las series de Fourier.
0 1
1
0
1 1
cos ... cos
...
cos
n
n
n n
k k
k k
f x g x a a x a nx
b senx b sen nx
f x a a kx b sen kx
c. Exponenciales:
xbk
kexg
Las combinaciones lineales de funciones exponenciales generan:
122
0 1
1
0
... n
k
b x b xb x
o n
nb x
k
k
f x g x a e a e a e
f x a e
También pueden hacerse aproximaciones racionales con las funciones polinomiales.
0 1
0 1
...
...
nnn
m
m m
P xa a x a xf x g x
b b x b x P x
De todas las aproximaciones anteriores las más utilizadas son las aproximaciones polinomiales.
3.4.1. Aproximaciones polinomiales
Todos los métodos para hallar la función polinomial a una función, parten del
criterio de que para evaluar los coeficientes de xPn se requiere que:
, 0 1 2 n i iP x f x i = , , ,..., n
Utilizando este criterio se pueden evaluar los coeficientes de la función polinomial, partiendo de un conjunto de puntos de la función
0 0 1 1, , , , ... , ,n nx f x x f x x f x y estableciendo un sistema de
n+1 ecuaciones lineales simultáneas para calcular los respectivos coeficientes
na,a,a , ... 10.
2
0 1 0 2 0 0 0
2
0 1 1 2 1 1 1
...
...
n
n
n
n
a a x a x +a x f x
a a x a x +a x f x
2
0 1 2 ... n
n n n n na a x a x +a x f x
Existen métodos especiales desarrollados para evaluar los coeficientes dependiendo de sí los puntos base son igualmente espaciados o no. Entre estos se encuentran el método de Gregory-Newton, método de Lagrange y el método con puntos base igualmente espaciados.
123
3.4.1.1. Método de Gregory- Newton En este método no se requiere que los puntos base estén igualmente espaciados y utiliza la diferencia finita dividida como una aproximación de las derivadas de la función.
La diferencia finita dividida de primer orden relativa a los argumentos 0x,x se
denota de la siguiente manera:
0
0 0
0
, f x f x
f x x x xx x
Diferencia finita dividida Orden
0
0111,
01
02
0112012
01
0101
00
,,,,,,,
,,,,
,
xx
xxfxxxfxxxf
xx
xxfxxfxxxf
xx
xfxfxxf
xfxf
n
nnn
nn
0 1 2
n
Se puede demostrar que:
1 0
0
, , ... ,n
i
n n ni
i j
j i
f xf x x x
x x
0
1 0
0 1 0 2 0
1
1 0 1 2 1
0 1 1
, , ... ,...
......
...
n n
n
n
n
n n n n
f xf x x x
x x x x x x
f x+
x x x x x x
f x
x x x x x x
124
La fórmula fundamental de Newton establece la forma general del polinomio de interpolación de una función.
n nf x P x R x
en la que:
110102010 ... ... nnn xxxxxx+axxxxaxxaaxP
1 0
0
, , , ... ,n
n n ini
R x f x x x x x x
1 1 0
0
, , , ..., n
n n n n i
i
R x f x x x x x x
Si se reemplaza 0xx en xPn , se obtiene:
0 0 0f x a f x
reemplazando 1xx en f x , se obtiene:
1 0
1 1 0
1 0
,f x f x
a f x xx x
En general:
1 0, ,...,n n na f x x x
Ejemplo 11: Estime el calor específico del aluminio a 90 K si se conocen los datos que se muestran en la tabla 12:
Tabla 12. Calor específico del aluminio a diferentes temperaturas
T, K 10 20 60 80 100
Cp, kJ/kgK 0.0014 0.0089 0.214 0.357 0.481
125
Para resolver el problema se usa el método de Gregory-Newton y se hallan las diferencias finitas divididas de primer a cuarto orden (d1, d2, d3 y d4), tal como se muestra en la tabla 13.
Tabla 13. Diferencias finitas divididas del ejemplo 11.
T, K Cp, kJ/kgK d1 d2 d3 d4
10 0.0014 7.5x10-4
8.76x10-5
-7.7x10-7
5.66x10-10
20 0.0089 5.13x10-3
3.37x10-5
-7.2x10-7
60 0.214 7.15x10-3
-2.38x10-5
80 0.357 6.2x10-3
100 0.481
T0 = 10
0014000 .TCa p
1012344
71233
5122
411
10665
1077
10768
1057
.T,TT,T,TCa
.T,T,T,TCa
.T,T,TCa
.T,TCa
o,p
op
op
op
32104
2103102010
TTTTTTTTa
TTTTTTaTTTTaTTaaTC p
Para T = 90 K:
4240
809060902090109010665
6090209010901077
2090109010768109010570014090
10
7
54
.
.
.
...C p
3.4.1.2. Método de Lagrange
Este método no requiere que los puntos base estén igualmente espaciados. La forma de Lagrange para el polinomio de interpolación está dada por:
126
0
n
n i i
i
P x L x f x
donde:
n,...,,i,xx
xxxL
n
ijj ji
j
i 100
niiiiii
niii
xx...xxxx...xx
xx...xxxx...xxxL
110
110
Ejercicio 2:
Encontrar la aproximación polinomial utilizando el método de Lagrange para la función que se presenta en la tabla 14.
Tabla 14. Función del ejercicio 2
i x f(x)
0 2 1
1 3 2
2 -1 3
3 4 4
413
6
1
231
4130
xxx
xxxxL
412
4
1
141
4121
xxx
xxxxL
43260
1
543
4322
xxx
xxxxL
132
10
1
512
1323
xxx
xxxxL
127
1 1 13 1 4 2 1 4 2 3 4
6 2 20
2 2 3 1
5
f x x x x x x x x x x
x x x
3.4.1.3. Aproximación con puntos base igualmente espaciados
Escribiendo la fórmula fundamental de Newton en términos de las diferencias finitas divididas o cocientes incrementados:
0 0 1 0 0 1 2 1 0
0 1 1 0 0 1 1 0
, , , ...
... ,..., ... , , ,...,n n n n n
f x f x x x f x x x x x x f x x x
x x x x x x f x x x x x x x x f x x x x
Como:
nhxx
hxx
hxx
hxx
n
0
03
02
01
3
2
1 0 0 0 0
1 0
1 0
,f x f x f x h f x f x
f x xx x h h
2
0
2 1 0 2, ,
2
f xf x x x
h
En general:
0
1 0, ,...,!
n
n n n
f xf x x x
n h
Así, el polinomio de interpolación o extrapolación se puede escribir como:
128
2
0 0
0 0 0 1 2
0
0 1 1
...2
...!
n
n
n n
f x f xP x f x x x x x x x
h h
f xx x x x x x
n h
Si se define hxx 0
0x x h
1 0 0 1x x x x h x x h h h h
2 2
n
x x h
x x h n
El polinomio de interpolación se transforma en:
2
0 0 0
0
1...
2!
1 2 ... 1
!
n
n
P f x f x f x
nf x
n
Ejemplo 12:
Utilizando los datos de la tabla 15 estime la presión de vapor de amoníaco a
167F.
Tabla 15. Presión de vapor del amoníaco a diferentes temperaturas
Temperatura (F) 70 80 90 100 110 120 130 140
Presión (lb/in²) 128.8 153.0 180.6 211.9 247.0 286.4 330.3 379.1
De la tabla anterior se calculan los siguientes datos (tabla 16) de diferencia:
129
Tabla 16. Diferencias finitas del ejemplo 12
T P P ²P ³P
70 128.8 24.2 3.4 0.3
80 153.0 27.6 3.7 0.1
90 180.6 31.3 3.8 0.5
100 211.9 35.1 4.3 0.2
110 247.0 39.4 4.5 0.4
120 286.4 43.9 4.9
130 330.3 48.8
140 379.1
Como los puntos por debajo de 110F tienen hasta la tercera diferencia y se desea aproximar a un polinomio de grado 3, se tomará esta temperatura como temperatura base para estimar la presión de vapor. La ecuación de interpolación será:
03
02
003
21
2
1TP
!TP
!TPTPTP
donde:
75
10
110
167
0
0
.
Fh
FT
FhTT
24653840321
73747554
2
747543975247167
inlb..
....
....P
3.4.2. Aproximación de funciones por el método de los mínimos cuadrados
El método se apoya en la minimización de la suma del cuadrado del error dado por la función a la que se está aproximando la función original.
N
iii YyQ
1
2
130
donde:
iy : son los valores de la función original.
iY : son los valores obtenidos con la función propuesta como aproximación.
Los parámetros o coeficientes que aparecen en la fórmula iY se ajustan o
determinan minimizando la función error Q. Esta minimización es posible realizarla
analíticamente para algunas formas sencillas de la función iY
Cuando la función Y es de forma polinomial:
nn xa...xaxaaY 2
210
Los parámetros ka se obtienen a partir de la relación:
n,...,,k,a
Q
k
100
N
k
n
inii
k a
xa...xaay
a
Q
1
2
10
Para el caso en que n=3, las ecuaciones que se producen son:
36
3
5
2
4
1
3
0
25
3
4
2
3
1
2
0
4
3
3
2
2
10
3
3
2
210
iiiiii
iiiiii
iiiiii
iiii
xyxaxaxaxa
xyxaxaxaxa
xyxaxaxaxa
yxaxaxaa
Este sistema de ecuaciones lineales simultáneas en ia se resuelve por cualquier
método. Una expresión de este sistema en forma matricial es:
PSA
PSA
131
En términos generales para un polinomio de grado n:
ni
ni
ni
niii
ni
xxx
xxx
xxN
A
21
12
...............
..................
.................. i
n
o
nii
ii
i
a
a
a
S
xy
xy
y
P
1
En el caso en que Y tenga una forma como:
xb
aY
Las ecuaciones que resultan para evaluar los parámetros a y b son no lineales
02
01
2
2
ii
i
ii
i
xb
a
xb
ay
b
Q
xbxb
ay
a
Q
De donde:
01
ii
ixbxb
ay
0
12
ii
ixbxb
ay
Estas dos ecuaciones pueden resolverse utilizando el método de Newton-Raphson. Ejemplo 13:
132
Use los datos de la tabla 17 para hallar la función de aproximación para la
capacidad calórica media del n-propano. Use como temperatura de referencia 25C (298.15 K). La capacidad calórica media está definida como:
ref
T
Tp
pTT
dTC
Cref
Tabla 17. Capacidad calórica del n-propano a diferentes temperaturas
No. Temperatura, K Capacidad calórica,
kJ/kgK
*Capacidad calórica
media, kJ/kgK
1 50 34.06 54.86
2 100 41.30 60.43
3 150 48.79 65.78
4 200 56.07 70.92
5 273.15 68.74 77.95
6 300 73.93 83.08
7 400 94.01 89.64
8 500 112.59 97.88
9 600 128.59 105.50
10 700 142.67 112.56
11 800 154.77 119.12
12 900 163.35 125.25
13 1000 174.60 131.00
14 1100 182.67 136.43
15 1200 189.74 141.61
16 1300 195.85 146.61
17 1400 201.21 151.47
18 1500 205.89 156.28 * Estos datos fueron calculados con el método de mínimos cuadrados que se describe abajo.
Si se usa el método de los mínimos cuadrados y una función de aproximación de tercer grado, se debe resolver el siguiente sistema de ecuaciones:
133
36
3
5
2
4
1
3
0
25
3
4
2
3
1
2
0
4
3
3
2
2
10
3
3
2
210
iiiiii
iiiiii
iiiiii
iiii
xyxaxaxaxa
xyxaxaxaxa
xyxaxaxaxa
yxaxaxaa
Reemplazando los valores de las sumatorias obtenidas a partir de los datos de la tabla 17:
123
192
161
13100
316
213
110
0
313
210
10
34
210
107221005310321078110441
22638441801032107811044112499611
205543210781104411249961112473
226910441124996111247318
.a.a.a..a
a.a.a.a
a.a.aa
a.aaa
Resolviendo este sistema de ecuaciones resulta:
83210 101640001502647076213 .a.a.a.a
La ecuación para Cp será entonces:
382 1016400015026470765213 T.T.T..Cp
15298
10041000050132407652131114626 4832
.T
T.T.T.T..TC p
Con esta ecuación se hallan los valores de la capacidad calórica media que se presentan en la última columna de la tabla 17.
3.5. Diferenciación numérica
La diferenciación numérica o aproximación de la derivada por un método numérico se puede llevar a cabo mediante los siguientes métodos:
134
1. Derivando el polinomio de aproximación:
Si xPxf n x'Px'f n
2. Aproximando la tangente a la secante, para hallar la primera derivada.
2.1. Si la derivada se evalúa en uno de los puntos extremos del intervalo (ver
figura 9):
nn
nnn
xx
xfxfxf
1
1
2.2. Si la derivada se evalúa en el punto medio del intervalo (ver figura 10):
nn
nn
xx
xfxfCf
1
1
donde:
2
1 nn xxC
Figura 9. Derivada evaluada en uno de los puntos extremos
xn xn+1
f(xn)
f(xn+1)
xn xn+1
f(xn)
f(xn+1)
135
Figura 10. Derivada evaluada en el punto medio del intervalo 3. Aproximación con diferencias finitas. El teorema de Taylor establece que:
af ...
!
hDhDhD=
afDn!
h+afhafhafhaf n
n
321
2
1
32
2
como:
hxfxEf 00
ln hD=
e+
!
hDhDhDE
af!
hDhDhDaEfhaf
hD
1
1
3211
321
32
22
...
...
Expresando el logaritmo natural como una serie y despejando D; se obtiene una
ecuación que relaciona la primera derivada con diferencias finitas:
xn xn+1
f(xn)
f(xn+1)
Cxn xn+1
f(xn)
f(xn+1)
C
136
...
h D= 432
4
1
3
1
2
11
Si se eleva al cuadrado ambos términos, se obtiene una relación de la segunda derivada con diferencias finitas.
... 5432
2
2
6
5
12
111
hD
Ejemplo 14: Halle la densidad del vapor de amoníaco a 110 y 167º F con los datos del ejemplo 12. El calor latente del amoníaco es 544 BTU/lb Para encontrar la densidad del vapor se usará la ecuación de Clausius Clapeyron:
LG VVTdT
dP
Asumiendo que el volumen VL es despreciable con respecto a VG, se tiene:
dT
dPT
VG
1
Como:
...
hD 432
4
1
3
1
2
11
Entonces:
...TPTPTP
h
T 32
3
1
2
1
Para hallar la densidad a 110ºF se deben obtener los valores ),T(P),T(P 2 etc
(tabla 16).
2
627 1 139.4 4.5 0.4
2 310 544
R lbf
BTU inR
lb
137
3
627 37.28
10 544 5.402
lb
ft
30.795
lb
ft
Para hallar la densidad a 167ºF se deben obtener los valores ),T(P),T(P 2 etc,
y extrapolar estos valores de la misma manera como se extrapoló P(T).
40
786
4702
1
33
322
32
.TPTP
.TPTPTP
.TP!
TPTPTP
o
oo
ooo
240
3
1786
2
1470
54410
627
in
lbf...
lb
BTUR
R
3402554410
1467627
ft
lb
.
.
3431
ft
lb.
Si se estima esta densidad con la ecuación de los gases ideales, se observa una diferencia del orden del 5% del valor obtenido con datos experimentales respecto al valor del modelo ideal.
3
2
22
361
14417
6271545
46538
ft
lb.
ft
in
lbmol
lb
RRlbmol
ftlbfin
lbf.
RT
P
138
3.6. Integración numérica
La evaluación de una integral definida b
a
dxxf , por métodos matemáticos es
generalmente difícil o imposible cuando xf no se ajusta a los casos tratables, o
su manipulación se hace muy engorrosa para convertirla a una forma integrable analíticamente. Se presentan entonces dos alternativas para evaluar la integral:
1. Hallar una función xg , que sea formalmente integrable, como una
aproximación de xf .
2. Hallar la integral numéricamente por algún método a partir de valores
generados por la función original xf .
Los métodos de integración numérica normalmente usados pueden clasificarse en dos tipos: Fórmulas de Newton-Cotes que usan valores de la función en puntos base
igualmente espaciados. Fórmulas de cuadratura Gaussiana que emplean puntos base desigualmente
espaciados determinados por ciertas propiedades de polinomios ortogonales. En este libro solo se presentan las fórmulas de integración con puntos base igualmente espaciados, las cuales se dividen en cerradas y abiertas.
Las fórmulas de integración cerradas usan información acerca de xf sobre los
límites de integración y las fórmulas abiertas no requieren de información acerca
de xf en los límites de integración.
En ambos casos la integral es evaluada por la aproximación
b
a n
b
adxxpdxxf
3.6.1. Fórmulas de integración cerradas
3.6.1.1. Regla trapezoidal
1
1
00
20
n
ii
nnx
x
xfxfxf
n
xxdxxf
n
139
Esta fórmula aproxima la función xf a un polinomio de primer grado en
intervalos de espaciamiento: hn
xxn 0
El área bajo la curva en cada subintervalo es aproximada por el trapezoide formado al sustituir la curva por su secante trazada entre los puntos extremos de la curva. Luego, la integral es aproximada por la suma de todas las áreas trapezoidales
3.6.1.2. Regla de Simpson
Las fórmulas de Newton-Cotes compuestas, basadas en polinomios de interpolación cuadráticos y cúbicos se denominan reglas de Simpson. Para el
subintervalo (x0, x2) la integral aproximada con esta regla está dada por:
2
0
1
1
2x
x
hx
hxdxcbxaxdxxf
2 3
1 16 2 4 23 2
a bx h h x h ch
cxbhxah
hcx
bhhx
ah
66263
63
63
263
1
22
1
1
22
1
cbxaxchxbhxachxbhxah
cbxaxcchxbhxbhhxxahhxxah
1
2
11
2
11
2
1
1
2
111
2
1
2
1
2
1
2
1
43
444223
210
111
43
43
xfxfxfh
hxfxfhxfh
En general, para todo el intervalo de integración la receta de Simpson establece que:
140
2
2
012
1
10
0 2230
n
ii
n
iin
nx
xxfxfxfxf
n
xxdxxfn
Esta ecuación se aplica cuando n es par, o sea número de puntos base impar
Forma generalizada:
Se puede hacer la aproximación de la función xf a un polinomio de grado n en
subintervalos.
!n
xfn...
...xf!
xfxfhxfxf
n0
02
000
11
2
1
donde:
h
xx 0
h
ab
............)x(f)x(f)x(f)x(fh
dhxPhdxxPdxxfb
a nn
b
a
03
234
02
23
0
2
0
0 0
6624462
Ejemplo 15: En la tabla 18 se muestra la capacidad calórica del grafito a presión constante para temperaturas que van desde 300 K a 1100 K.
Tabla 18. Capacidad calórica del grafico a diferentes temperaturas.
T, K 300 400 500 600 700 800 900 1000 1100
Cp, cal/g.K 2.066 2.851 3.496 4.03 4.43 4.75 4.98 5.14 5.27
Determine el calor de absorción (q) cuando se calienta un gramo de grafito desde 300 a 1100 K.
141
1100
300
dTTCmq p
Para hallar la integral de esta ecuación se utiliza: a). Regla Trapezoidal:
1
1
00
20
n
iip
pnpnT
T
p TCTCTC
n
TTdTTC
n
53334677292
0662275
8
3001100..
..
cal.g
cal.gq 53334533341
b). Regla de Simpson:
2
2
012
1
10
0 2230
n
iip
n
iipnpp
nT
T p TCTCTCTCn
TTdTTC
n
133415423335459275066283
3001100.....
cal.g
cal.gq 13341133411
3.6.2. Fórmulas de integración abierta
Si el número de puntos base en el subintervalo de integración es 1n se hace una
aproximación a un polinomio de grado 2n ó menor.
b
a
b
a nn dhxPhdxxPdxxf
0 022
donde:
142
h
xx 0 y
h
ab , o número de subintervalos de amplitud h
12
12
111202
2
221
2
2111
xf!n-
α-n+...α-α- +...+
xf!
ααxfαxfhαxPαhxP
n-
nn
b
a...xfxfxfhdxxf 1
2
23
1
2
14
3
62
Si 2 122
0xhfdxxf
x
x
El área o integral se aproxima al área de un rectángulo de
altura f(x1) y amplitud 2h.
Si 3
21
121
2
3
2
3
2
33
3
0
xfxfh
xfxfxfhdxxfx
x
El área o integral se aproxima al área de un rectángulo con
altura igual a la media de f(x1) y f(x2) y amplitud 3h
Si 4 4
0321 22
3
4x
xxfxfxf
hdxxf
Si 5 5
04321 1111
24
5x
xxfxfxfxf
hdxxf
Si 6 6
054321 1114261411
10
3x
xxfxfxfxfxf
hdxxf
Ejemplo 16: En la tabla 19 se muestra el análisis acumulativo por tamizado para una arena.
Tabla 19. Análisis acumulativo por tamizado de una arena.
143
Dp, cm 0.4
7 0.33 0.24
0.1
6
0.1
2 0.08 0.06 0.04 0.03 0.02 Colector
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Determine la superficie específica de las partículas, sabiendo que:
01
0
6 .
pp
wD
dA
Donde: Dp: Diámetro de la partícula
: Fracción acumulada
: Factor de forma: 1,2
p: Densidad de las partículas: 2.7 g/cm3
Para calcular la superficie específica, utilizando métodos numéricos primero se
debe calcular la función f = 1/Dp (tabla 20).
En este problema no hay dato para el límite superior de la integral, o sea, para
=1.0, por lo tanto el método más adecuado sería el de integración abierta.
Se dividirán los datos en tres subintervalos:
334
1
70
70
40
40
0
1
0
ααα
fffdf.
.
.
.
Tabla 20. Cálculo de f() para el ejemplo 16
i Dp f() = 1/Dp
0 0.47 0 2.128
1 0.33 0.1 3.03
2 0.24 0.2 4.167
3 0.16 0.3 6.25
4 0.12 0.4 8.333
5 0.08 0.5 12.5
6 0.06 0.6 16.667
7 0.04 0.7 25
8 0.03 0.8 33.3
9 0.02 0.9 50
10 Colector 1.0 -
144
1
1 2 3 5 6 8 90
4 3 32 2
3 2 2
4 0.1 3 0.1 2 3.03 4.167 2 6.25 12.5 16.67
3 2
3 0.1 33.3 50.0
2
18.799
h h hf d f f f f f f f
13507991872
216..
.
.Aw
3.7. Solución de ecuaciones diferenciales ordinarias
Una ecuación de la forma:
2
2, , , ,..., 0
n
n
dy d y d yF x y
dx dx dx
se define como una ecuación diferencial. Debido a que una ecuación diferencial ordinaria de orden n se puede expresar como un sistema de ecuaciones diferenciales de primer orden, definiendo n 1 variables, los métodos numéricos se desarrollan para ecuaciones de primer orden. Los errores involucrados en una solución numérica de ecuación diferencial se clasifican en: error de truncamiento y error de redondeo. El error de truncamiento incluye un error local y un error de propagación. En la selección de un algoritmo de solución de una ecuación diferencial debe tenerse en cuenta la estabilidad. Se dice que una solución es inestable cuando los errores introducidos en alguna etapa de cálculo se propagan sin límite a través de los cálculos subsecuentes. Inestabilidad inherente: Está asociada con la ecuación que se está resolviendo y las condiciones iniciales, pero no depende del método utilizado. Inestabilidad parcial: Depende de la ecuación, las condiciones iniciales y el método. Los algoritmos comunes para resolver una ecuación diferencial ordinaria, con condiciones iniciales específicas, están basadas en las siguientes aproximaciones:
145
1. Directa o indirectamente se usa la expansión de Taylor de la función objetivo
xy .
2. Usan fórmulas de integración abiertas o cerradas. La variedad de procedimientos pueden ser clasificados en forma general en dos grupos, los métodos llamados de una etapa y los métodos de múltiples etapas.
Los métodos de una etapa permiten el cálculo de 1iy dada la ecuación diferencial
e información en ix solamente, esto es un valor de
iy .
Los métodos de múltiples etapas requieren además valores jy y/o la derivada en
otros valores jx fuera del intervalo de integración en consideración 1ii x,x .
Una desventaja del método multi-etapa es que requiere información adicional a la que se dispone normalmente, para comenzar el procedimiento. Generalmente solo se conocen condiciones iniciales, pero pueden usarse métodos de una etapa para obtener la información adicional. Otra dificultad del método multi-etapa es que es muy difícil cambiar el tamaño de etapa cuando se está en el desarrollo de los cálculos.
3.7.1. Método de desarrollo de Taylor Un método de aproximación de la solución de primer orden, consiste en expresar la
solución xy a partir de un punto inicial 0x por medio del desarrollo de Taylor.
Dada la ecuación diferencial:
x,yfdx
dy
dx
dyyxF
o
0,,
La función y(x) puede expresarse alrededor de un punto base (x0, y(x0)) usando la
fórmula de Taylor como:
2
0 0 0 0 0 0
3
0 0
, ,2!
, ...3!
hy x y x h y x hf x y x f x y x
hf x y x
146
donde :
2
2
dx
yd
dx
y,xdfy,xf ; y así sucesivamente para las derivadas superiores
A partir de la aproximación de Taylor se puede entonces definir el algoritmo para
encontrar el valor de la función en 1ix desde
ix , usando como fórmula recursiva:
iin
n
iiiiiii xy,xf!n
h...xy,xf
!
hxy,xhfxyhxyxy 1
2
12
El error de truncamiento, en este caso, es de orden 1nh y está acotado por el
valor:
M
!n
he
n
t1
1
donde:
1 iimax
)n( x,xy,fM en
Ejercicio 3: Resuelva la siguiente ecuación diferencial:
5000 00 .xyx,yx'y f
Solución analítica: 1 xey x
yxy,xfy,xfdx
dy
iiiiii xyxfh
xyxhfxyxy ,'!2
,2
1
yxdx
dy
dx
yxdf
dx
ydyxf 11
,,'
2
2
Si iiiiii xy,x'f.xy,xf.xyxy.h 00501010 1
Aplicando estas ecuaciones se construye la tabla 21.
Tabla 21. Iteraciones del ejercicio 5.
147
k x y f(x,y) f'(x,y) yexacto
0 0 0.0000 0.0000 1.0000 0
1 0.1 0.0050 0.1050 1.1050 0.0052
2 0.2 0.0210 0.2210 1.2210 0.0214
3 0.3 0.0492 0.3492 1.3492 0.0499
4 0.4 0.0909 0.4909 1.4909 0.0918
5 0.5 0.1474 - - 0.1487
Al comparar el valor de la solución exacta con el valor aproximado hallado con el método, no se observa un diferencia significativa.
3.7.2. Método de Euler
Cuando en el método de desarrollo de Taylor solo se conservan los dos primeros términos, el método se denomina de Euler. En este caso la solución sigue la línea
tangente a xy en ix , y la fórmula recursiva se reduce a:
iiiii xy,xhfxyhxyxy 1
El error de truncamiento cometido por el método es de orden 2h , (error local).
y,f!
het
2
2
donde: 1 ii xx
Ejercicio 4: Resuelva el ejercicio 5 por el método de Euler
yxy,xfy,xfdx
dy
iiii xy,xhfxyxy 1
Si iiii xy,xf.xyxy.h 1010 1
Aplicando estas ecuaciones se construye la tabla 22
148
Tabla 22. Iteraciones del ejercicio 6
k x y f(x,y) y exacto
0 0 0.0000 0.0000 0
1 0.1 0.0000 0.1000 0.0052
2 0.2 0.0100 0.2100 0.0214
3 0.3 0.0310 0.3310 0.0499
4 0.4 0.0641 0.4641 0.0918
5 0.5 0.1105 - 0.1487
En este caso al comparar la solución exacta con la aproximación puede observarse una diferencia significativa entre los valores.
3.7.3. Métodos de Runge-Kutta
Como la solución de una ecuación diferencial por medio de la aproximación de Taylor no es práctica porque deben retenerse en el algoritmo las derivadas de orden mayor, es posible desarrollar un procedimiento de una etapa que utilice evaluaciones de la primera derivada y que arroja resultados equivalentes en precisión a las fórmulas de orden mayor de Taylor. Estos algoritmos son llamados métodos de Runge-Kutta. Las aproximaciones de segundo, tercer, y cuarto orden, es decir aproximaciones con precisiones equivalentes a expansiones de Taylor que retienen términos en
432 hh,h y respectivamente, requieren de estimaciones de y,xf en dos, tres y
cuatro valores en el intervalo 1ii x,x .
Todos los métodos de Runge-Kutta tienen algoritmos de la forma:
h,y,xhyy iiii 1
donde es llamada la función incremental, que es simplemente una aproximación
para y,xf en el intervalo 1ii x,x . La evaluación de esta función tiene mucha
manipulación de ecuaciones algebraicas en el desarrollo de las fórmulas de orden alto. En el algoritmo para la fórmula de Runge-Kutta de orden 3, la función incremental tiene la forma
321 ckbkak
149
donde 321 k,k,k son aproximaciones de la primera derivada en varios puntos en
el intervalo de integración 1ii x,x . En este caso:
123
12
1
hksrshkrh , yxfk
phkph , yxfk
, yxfk
ii
ii
ii
Para determinar las constantes s, p , r ya , b , c se debe expandir
y kkk 321 , en series de Taylor.
En general:
yxfy
mx
ln
yxfy
mx
lyxfmylxf
n
,!1
1...
,,,
1
Para hallar los valores de las constantes se pueden tomar arbitrariamente dos valores para dos de ellas y se obtienen las demás, planteando las ecuaciones algebraicas al igualar los respectivos coeficientes de las potencias de h entre la fórmula de Runge-Kutta y la expansión de Taylor del mismo orden. Se han desarrollado varias fórmulas de acuerdo a los parámetros escogidos, siendo las más comunes, la universal y la regla de los tres octavos. La fórmula más utilizada es la universal, en la que los coeficientes toman los siguientes valores:
2121
61
32
61
s = r = p =
c = b = a =
Con estos valores el algoritmo de orden 3 de Runge-Kutta toma la forma:
3211 46
kkkh
yy ii
123
12
1
2
2
1
2
1
hkhkh,yx = fk
hkh,yx = fk
,yx = fk
ii
ii
ii
150
Ejercicio 7: Resuelva el ejercicio 5 por el método de Runge-Kutta de 3er orden
yxy,xfy,xfdx
dy
3211 46
kkkh
xyxy ii
Si 3211 46
1010 kkk
.xyxy.h ii
iiii yxy,xfk 1
1112 10502
1
2
1
2
1
2
1k.yxhkyhxhky,hxfk iiiiii
1212123 211022 kk.yxhkhkyhxhkhky,hxfk iiiiii
Aplicando estas ecuaciones se construye la tabla 23
Tabla 23. Iteraciones del ejercicio 7
k x y k1 k2 k3 y exacto
0 0 0.0000 0.0000 0.0500 0.1100 0
1 0.1 0.0052 0.1052 0.1604 0.2267 0.0052
2 0.2 0.0214 0.2214 0.2825 0.3557 0.0214
3 0.3 0.0498 0.3498 0.4173 0.4983 0.0499
4 0.4 0.0918 0.4918 0.5664 0.6559 0.0918
5 0.5 0.1487 0.6487 0.7311 0.8300 0.1487
Se observa con este método que se obtiene una mejor aproximación de la solución numérica en relación con los métodos anteriores.
3.9. Sistemas de ecuaciones diferenciales ordinarias
Para resolver ecuaciones diferenciales ordinarias por métodos numéricos, se reduce el sistema a un sistema de n ecuaciones diferenciales simultáneas de primer orden, redefiniendo las variables que sean necesarias para eliminar las
151
derivadas de orden mayor. Luego al sistema de n ecuaciones diferenciales ordinarias de primer orden se aplica en paralelo el algoritmo seleccionado. Ejercicio 6: Resuelva la siguiente ecuación diferencial:
2
1 22
d y dya a y p x
dx dx
Realizando una transformación:
xpyawadx
dw
dx
dyw
21
w,y,xgyawaxpdx
dw
w,y,xfwdx
dy
212
1
El algoritmo para una aproximación en 1ix usando el Método de Runge-Kutta en
este ejercicio sería:
1. Evaluar 1k
iiiiiiw
iiiiy
yawaxpw,y,xgk
ww,y,xfk
211
1
=
=
2. Evaluar k2
2 1 1 = , ,2 2 2
y i i y i w
h h hk f x y k w k
1 2 =2
i i i i
hw p x a w a y
152
2 1 1
1 1 2 1
1 1 2
2 1 2
= , ,2 2 2
=2 2 2
=2 2
2 2
w i i y i w
i i w i y
i i i i i
i i i i i
h h hk g x y k w k
h h hp x a w k a y k
h hp x a w p x a w a y
h ha y w p x a w a y
22
hya i
3. Evaluar 3k
yyi
wwii
wwiyyiiw
wwi
wwiyyiiy
hkhkya
hkhkwahxp
hkhkw,hkhky,hxgk
hkhkw
hkhkw,hkhky,hxfk
122
121
12123
12
12123
2
2
22
2
22
=
=
=
=
4. Evaluar 11 ii w,y
wwwii
yyyii
kkkh
+ =ww
kkkh
y y
3211
3211
46
46
Ejemplo 17: Un proceso biológico involucra el crecimiento de biomasa a partir de sustrato. El balance de materia en el proceso batch produce:
SK
kBS
dt
dB
0.75dS kBS
dt K S
Donde B y S son las concentraciones respectivas de biomasa y sustrato. La
cinética de las reacciones es tal que k = 0.3 y K = 10-6
en unidades consistentes.
Cuáles son las concentraciones de B y S en un tiempo tf = 16, si a t0 = 0 S = 5.0 y
B = 0.05.
153
Se va a utilizar el método de Runge-Kutta de 3
er orden para resolver este sistema
de ecuaciones diferenciales.
= , ,
0.75 = , ,
i iB i i i
i
i iS i i i
i
kB Sk f t B S
K S
kB Sk g t B S
K S
1. Evaluar 1k
1
1
= , ,
0.75 = , ,
i iB i i i
i
i iS i i i
i
kB Sk f t B S
K S
kB Sk g t B S
K S
2. Evaluar k2
2 1 1
1 1
1
2 1 1
1 1
1
= , ,2 2 2
2 2 =
2
= , ,2 2 2
0.752 2
=-
2
B i i B i S
i B i S
i S
S i i B i S
i B i S
i S
h h hk f t B k S k
h hk B k S k
hK S k
h h hk g t B k S k
h hk B k S k
hK S k
3. Evaluar 3k
154
3 2 1 2 1
2 1 2 1
2 1
3 2 1 2 1
2 1 2 1
2 1
= , 2 , 2
2 2 =
2
= , 2 , 2
0.75 2 2 =-
2
B i i B B i S S
i B B i S S
i S S
S i i B B i S S
i B B i S S
i S S
k f t h B hk hk S hk hk
k B hk hk S hk hk
K S hk hk
k g t h B hk hk S hk hk
k B hk hk S hk hk
K S hk hk
En la tabla 24 se muestran algunos de los cálculos iterativos para h = 1.
Tabla 24. Algunas iteraciones del ejemplo 17
t 0 1 2 3 12 13 14 15 16
B 0.050 0.067 0.091 0.123 1.824 2.462 3.322 4.483 6.050
S 5.000 4.987 4.969 4.945 3.669 3.191 2.546 1.675 0.500
k1B 0.015 0.020 0.027 0.037 0.547 0.738 0.997 1.345 1.815
k1S -0.011 -0.015 -0.020 -0.028 -0.410 -0.554 -0.747 -1.009 -1.361
k2B 0.017 0.023 0.031 0.042 0.629 0.849 1.146 1.547 2.087
k2S -0.013 -0.017 -0.024 -0.032 -0.472 -0.637 -0.860 -1.160 -1.565
k3B 0.021 0.028 0.038 0.051 0.761 1.026 1.385 1.869 2.523
k3S -0.016 -0.021 -0.028 -0.038 -0.570 -0.770 -1.039 -1.402 -1.892
En la figura 11 se ilustra la variación de la concentración de B y S con el tiempo a partir de los datos obtenidos con las iteraciones en el método de Ruge-Kutta:
0
2
4
6
8
0 4 8 12 16
Tiempo
Co
nce
ntr
ació
n
B
S
155
Figura 11. Variación de la concentración de B y S con el tiempo
3.10. Ejercicios propuestos 1. Determine los parámetros de Underwood apropiados para realizar los cálculos
en una torre de destilación multicomponente que tiene la siguiente distribución (tabla 25) y con una alimentación tal que q = 0.67.
Tabla 25. Distribución del alimento de la torre de destilación del ejercicio propuesto 1.
Componente j ZjF
CH4 53.2 0.03
C2H6 14.94 0.07
lk n-C3H8 6.30 0.15
n-C4H10 2.405 0.33
hk n-C5H12 1.0 0.30
n-C6H14 0.456 0.12
La ecuación de Underwood es:
qz
j
jFJ
1
2. Use el método de Newton para hallar un cero complejo de la siguiente función:
f(z) = z4 – 2z
3 + 1.25z
2 – 0.25z – 0.75. Tome como punto de partida z = 1+i
3. Una reacción química toma lugar en una serie de cuatro reactores CSTR. Allí se
convierte el reactivo A en el producto B (relación estequiométrica 1 a 1), la reacción es elemental y la constante de velocidad es k = 0.1 h
-1. Si el caudal
alimentado es q = 100 ft3/h y la concentración de A a la entrada del primer
reactor es CA,0 = 3 lb/ft3, calcule la concentración a la salida de cada reactor,
teniendo en cuenta que el volumen en cada uno de ellos es V1 = 20 ft3, V2 = 30
ft3, V3 = 50 ft
3 y V4 = 40 ft
3, y que un 10% de la corriente de salida del reactor 4
se recircula al reactor 3 y otro 10% al reactor 2. Tenga en cuenta que el sistema está en estado estable, las reacciones son en fase líquida y se despreciarán los cambios en volumen o densidad del líquido.
Para la solución utilice los métodos de Gauss-Siedel y Jacobi
156
4. Un reactor químico de flujo continuo operando como un sistema en estado
estable se puede describir por el siguiente conjunto de ecuaciones:
rFFx AA
rFFx BB
rFFF BA
6060
.
BA xxr
Resuelva el conjunto de ecuaciones asumiendo FA = 10 y FB = 20. Utilice el método de Newton-Raphson.
5. La concentración de saturación del oxígeno disuelto en agua en función de la temperatura para una concentración de cloruro de 20 mg/l se muestra en la tabla 26.
Tabla 26. Concentración de saturación de oxígeno disuelto a diferentes temperaturas
Temperatura, ºC Concentración de saturación
5 10.5
10 9.2
15 8.2
20 7.4
25 6.7
30 6.1
Determine: a) Nivel de oxígeno disuelto a 28ºC, utilizando el método de aproximación de
puntos base igualmente espaciados b) La función de aproximación con el método de mínimos cuadrados
6. En la tabla 27 se presentan los datos de composición del líquido versus la
presión total para el sistema benceno (1) y ácido acético (2) a 50ºC.
Tabla 27. Presión de vapor para el sistema benceno – ácido acético en función de la composición a 50ºC
x1 0.0 0.0069 0.1565 0.3396 0.4666 0.6004 0.7021
P, mmHg 57.52 58.20 126.00 175.30 189.50 224.30 236.00
Halle la presión total de la mezcla para una composición de benceno de 0.5. Utilice el método de Gregory-Newton y el método de Lagrange.
157
7. Determine la pendiente de la curva de presión de vapor de agua a 35, 45 y 55
ºF. En la tabla 28 se tabulan los valores de la presión de vapor de agua contra la temperatura. Realice la aproximación con diferencias finitas.
Tabla 28. Presión de vapor del agua a diferentes temperaturas
T, ºF 35 40 45 50 55 60 65
Pv, psi 0.09995 0.12170 0.14752 0.17811 0.2141 0.2563 0.3056
8. Use los datos de la tabla 29 para hallar la capacidad calórica media del n-
propano a 1500, 1300 y 1100 K. Esta se define por la ecuación que se presenta a continuación. Para la solución utilice la regla trapezoidal y la de Simpson y como temperatura de referencia asuma 300 K:
ref
T
Tp
pTT
dTC
Cref
Tabla 29. Capacidad calórica del n-propano a diferentes temperaturas
Temperatura, K Capacidad calórica, kJ/kgK
300 73.93
400 94.01
500 112.59
600 128.59
700 142.67
800 154.77
900 163.35
1000 174.60
1100 182.67
1200 189.74
1300 195.85
1400 201.21
1500 205.89
9. Un material radiactivo se descompone de acuerdo a la siguiente reacción en
serie:
158
A B Ck k1 2
Donde k1 y k2 son las constantes de velocidad de reacción y B y C son los productos intermedio y final, respectivamente. Los valores de las constantes son: k1 = 3 s
-1 y k2 = 1 s
-1. Las condiciones
iniciales de las concentraciones son: CA(0) = 1 mol/m3, CB(0) = 0 y CC(0) = 0.
Determine las concentraciones de CA, CB y CC como una función del tiempo por el método: a) Taylor b) Euler c) Runge-Kutta
3.11. Bibliografía Alkis Constantinides and Mostoufi Navid, “Numerical Methods for Chemical Engineers with MATLAB Applicatons”, Prentice Hall, New Jersey, 1999 Carnahan, B., Luther, H.A., Wilkes, J.O., "Applied numerical methods", Wiley, New York, 1970. Cutlip, M.B., Shacham, M., “Problem solving in Chemical Engineering with numerical methods”, Prentice Hall, Upper Saddle River, USA, 2000. Gerald, C.F., Whealtley P.O., “Análisis numérico con aplicaciones”, 2nd Edición, Pearson Educación, México, 2000 Mickley, H.S., Sherwood, T.S., Reed, C.E., "Applied Mathematics in Chemical Engineering". McGraw, New Delhi, 1975. Press, W.H., Flannery, B.P., Teukolsky, S.A.., Vetterling. W.T.,"Numerical recipes- the art of scientific computing", Cambridge University Press, Cambridge, 1986. Smith, C., Pike, R., Murril, P., "Formulación and optimización of mathematical models", International texbook Company, Scranton,1970. Zurmühl, Rudolf, “Numerical Analysis for Engineers and Physicists”, Springer International, student Edition, New York, 1976. Luthe, L., Olivene, A., Schutz, F., “Métodos Numéricos”, Editorial Limusa, México, 1984.
160
CAPÍTULO IV
OPTIMIZACIÓN
TABLA DE CONTENIDO
4.1. Organización del problema de optimización .................................................. 162
4.2. Métodos de optimización de funciones univariables ..................................... 166
4.2.1. Método analítico de funciones no restringidas ........................................ 166
4.2.2. Método analítico de funciones restringidas ............................................ 167
4.2.3. Métodos numéricos de funciones no restringidas ................................... 168
4.2.3.1. Método de la etapa fija .................................................................... 169
4.2.3.2. Método directo con aceleración ....................................................... 175
4.2.3.3. Método de Fibonacci ....................................................................... 179
4.2.3.4. Método de la sección de oro ............................................................ 182
4.2.4. Método numérico de funciones restringidas .......................................... 184
4.3. Métodos de optimización de funciones multivariables ................................... 191
4.3.1. Método analítico de funciones no restringidas ........................................ 191
4.3.2. Métodos analíticos de funciones restringidas ......................................... 196
4.3.2.1. Restricciones de igualdad ................................................................ 197
4.3.2.1.1. Método de substitución directa .................................................. 197
4.3.2.1.2. Método de la variación restringida ............................................. 206
4.3.2.2. Restricciones de igualdad y desigualdad ......................................... 213
4.3.2.2.1. Método de los multiplicadores de Lagrange .............................. 213
4.3.2.2.2. Método de los multiplicadores de Lagrange y variables de holgura ................................................................................................ 223
4.3.3. Métodos numéricos de funciones no restringidas ................................... 225
4.3.3.1. Método del poliedro flexible ............................................................. 225
4.3.3.2. Método del gradiente ....................................................................... 231
4.3.3.3. Método de las tangentes paralelas .................................................. 234
4.3.3.4. Método de Newton .......................................................................... 239
4.3.3.5. Método de Davidon-Fletcher-Powell ................................................ 239
4.3.3.6. Método de Fletcher-Reeves ............................................................ 241
4.3.4. Métodos numéricos de optimización de funciones restringidas .............. 242
4.4. Ejercicios propuestos ................................................................................... 243
4.5. Bibliografía ................................................................................................... 246
161
CAPITULO IV.
OPTIMIZACIÓN
En el diseño y mejoramiento de plantas químicas y unidades de procesos se tienen múltiples posibilidades y algunas veces hasta infinitas. A esta multiplicidad se enfrenta el ingeniero químico desde de las primeras etapas del diseño cuando debe seleccionar el proceso o tipo de unidad de transformación que va a diseñar. Esta selección, así como la especificación plena de condiciones de operación y dimensionamiento de los equipos, se hace normalmente optimizando en términos de algún criterio efectivo. La optimización en las industrias de procesos químicos requiere, además de la selección del proceso, la selección del equipo y las condiciones de operación apropiadas para la producción de un material determinado, de tal modo que el beneficio sea máximo. Este beneficio puede interpretarse como la producción máxima de una sustancia o como la inversión mínima para un nivel de producción específica. En el caso en que el criterio sea la máxima producción del material o sustancia, puede omitirse el balance económico y el óptimo obtenido se denomina operacional. La necesidad del óptimo operacional puede surgir en el momento en que ya se dispone del equipo. Por ejemplo, en la operación de un reactor catalítico, puede existir una temperatura óptima de operación para cada tamaño de reactor, que puede ser basada en el máximo porcentaje de conversión o en la máxima cantidad de producto por unidad de tiempo. Sin embargo, las variables de costo necesitan ser consideradas en la práctica y el desarrollo de un óptimo operacional es generalmente una etapa en la determinación de un óptimo económico sometido a consideraciones de costo o ganancias. Aunque puede suceder que el óptimo económico no resulte ser el diseño final recomendado, ya que consideraciones de costos incrementales pueden mostrar que el retorno sobre la inversión adicional puede llegar a ser inaceptable antes de que se alcance el punto óptimo. En estos casos los valores óptimos pueden usarse como una base en el análisis de costos incrementales para hacer la selección y especificación del diseño final. La optimización en el campo de la industria química puede dividirse en dos campos: optimización estática y optimización dinámica. El objetivo de la optimización estática es el establecimiento de las condiciones estacionarias de operación del proceso más apropiadas. Estas condiciones pueden estar ligadas a parámetros de los equipos o condiciones de operación como tamaño de equipos, nivel de producción, temperaturas, presión, caudales, etc.; mientras que el establecimiento del mejor procedimiento para corregir fluctuaciones de las condiciones de operación del proceso de sus valores nominales establecidos en la optimización estática es el objetivo central de la optimización dinámica. Esta optimización es una extensión del análisis del control automático del proceso y
162
requiere por lo tanto de un conocimiento de las características dinámicas del proceso. La optimización puede ser tratada de muchos modos que van desde procedimientos analíticos sencillos o sofisticados y métodos numéricos, hasta herramientas que se vienen desarrollando en el ámbito de la inteligencia artificial como los algoritmos genéticos. Las técnicas convencionales de optimización se pueden clasificar en métodos analíticos, métodos numéricos, métodos gráficos; para los cuales se requiere del conocimiento de la función a optimizar, y los métodos experimentales en los que se desconoce la forma de esta función. En los métodos analíticos, que hacen uso del cálculo diferencial y el cálculo variacional como herramientas, el problema de optimización debe describirse en términos matemáticos de tal forma que la función y las variables se puedan manipular mediante reglas conocidas. Los métodos numéricos, que se usan cuando el problema no se puede resolver analíticamente o cuando el cálculo requerido en el modelo analítico es prohibitivo, generan aproximaciones sucesivas del óptimo mediante procedimientos iterativos usando información sobre la función objetivo y otros criterios en ciertas condiciones. Los métodos gráficos, que tienen aplicación limitada para una o dos variables, se valen de la representación gráfica de la función objetivo para obtener por inspección los valores extremos de la función objetivo. Y en los métodos experimentales el óptimo se busca realizando experimentos directamente sobre el sistema o proceso.
4.1. Organización del problema de optimización
Un procedimiento general para optimizar involucra la mayoría de las siguientes etapas: i. Definición de un objetivo apropiado. El objetivo resume el problema real y debe ser expresado en términos de maximizar o minimizar una función a la que se le da el nombre de función objetivo. ii. Restricciones impuestas al problema por agentes externos. En la práctica casi todos los procesos reales tienen restricciones impuestas por agentes externos que no pueden ser controladas por el optimizador.
163
Ejemplos: La producción tiene un límite que lo determina el mercado o la dirección de la
empresa. La calidad está controlada por especificaciones legales o por especificaciones
de la compañía o el consumidor. La materia prima está limitada a ciertas calidades. Las pérdidas de calor y la temperatura de enfriamiento de agua están
parcialmente gobernadas por las fluctuaciones diarias del clima.
iii. Selección del sistema o sistemas para estudio. Pueden existir varios sistemas que satisfagan una misma necesidad y la especificación o selección de uno de ellos se convierte en una restricción para el proceso de optimización. Un recipiente para almacenar un líquido, por ejemplo, puede tener formas diversas: esférica, cilíndrica, cónica, irregular, etc. La producción de una sustancia química puede hacerse mediante procesos diferentes. iv. Examen de la estructura del sistema y de las entradas y salidas. Es conveniente representar esquemáticamente el sistema bajo estudio para identificar los componentes y sus relaciones, así como las entradas y salidas; ya que esta representación facilita el análisis del sistema y muy especialmente la identificación y visualización de las relaciones que proveen información para la formulación de la función objetivo. Para efecto de la formulación de las ecuaciones del modelo matemático que expresa el problema de optimización, es necesario asociar variables de caracterización – variables que informan sobre atributos como flujo, composición, temperatura, presión - a cada una de las corrientes de entrada, de salida, y de las que conectan elementos internos del sistema. Debe contemplarse también en esta etapa del proceso de optimización el conocimiento del comportamiento del sistema bajo estudio, pues sólo ese conocimiento posibilitará la construcción de un modelo matemático y por lo tanto la formulación del problema de optimización. v. Construcción de un modelo para el sistema. La construcción del modelo matemático del sistema, representado por el conjunto de ecuaciones que relacionan las variables del sistema, permite no sólo definir la función objetivo en términos de las variables del sistema, sino también algunas restricciones para los valores de estas variables.
164
vi. Estudio y definición de las restricciones internas del sistema. Además de las restricciones externas pueden surgir otras restricciones impuestas al conjunto de variables del sistema. Estas restricciones, impuestas por criterios de diseño o por el comportamiento del sistema, limitan a ciertos dominios los valores de las variables y se expresan como igualdades o desigualdades matemáticas que deben cumplirse. Como parte de este conjunto de restricciones se encuentran las ecuaciones básicas del modelo matemático del sistema, que son establecidas por los principios de conservación de masa, de momento, energía, o por las expresiones de rata de flujo de estas entidades u otras relaciones entre las variables del sistema.
0,...,
0,...,
21
21
nkk
nJJ
xxxgg
xxxgg
vii. Reducción del problema a sus partes esenciales. El problema de optimización constituido por una función objetivo y el conjunto de restricciones, puede simplificarse en algunos casos, para facilitar su manipulación en el proceso de solución. Esta simplificación puede lograrse de varias formas. Eliminación de aquellas variables que no afecten significativamente la función
objetivo. Realizar la optimización por etapas, dividiendo el problema de optimización en
varios problemas con menores variables. Transformación de la función y las restricciones en relaciones matemáticas más
sencillas. Un caso especial lo constituye la linealización, o sea aproximación de todas las funciones en ecuaciones lineales.
viii. Verificación de que el sistema propuesto representa el sistema bajo estudio. ix. Formulación de la función objetivo en términos de las variables del sistema.
x. Optimización Se encuentra la solución óptima mediante alguna técnica de optimización. xi. Análisis de la solución óptima. Como resultado del desarrollo de este procedimiento, el problema de optimización quedará definido como:
1. Maximizar o minimizar la función objetivo: f X
165
2. Sujeto a:
2.1 Restricciones de igualdad: 0Xhi
, i=1,2,...,m
2.2 Restricciones de desigualdad: 0Xgi
, i=m+1,...,p
0ig X
Ejemplo 1:
1. Definición del objetivo. Maximizar el volumen de una caja sin tapa, que se desea construir con una lamina de área total A. 2. Restricciones externas. El área lateral de la caja no debe exceder el área de la lámina disponible. 3. Elección del sistema. Caja rectangular. 4.Examen de la estructura del sistema (ver figura 1).
Figura 1. Representación de una caja abierta 5. Construcción del modelo.
321 xxxV
322131 22 xxxxxxA
6. Restricciones internas.
0
0
0
33213
23212
13211
xx,x,xg
xx,.x,xg
xx,x,xg
7. Reducción del problema a sus partes esenciales. No es posible en este caso eliminar variables.
166
8. Verificar que el sistema propuesto representa el sistema estudiado. Las relaciones que describen el sistema son las apropiadas. 9. Formular la función objetivo
321321 xxxx,x,xf
El problema de optimización se formulará como:
Maximizar 321321 xxxx,x,xf
Sujeto a:
0
0
0
022
33213
23212
13211
3221313211
xx,x,xg
xx,x,xg
xx,x,xg
Axxxxxxx,x,xh L
4.2. Métodos de optimización de funciones univariables
4.2.1. Método analítico de funciones no restringidas Para la existencia de un punto extremo en una función univariable se requiere que se cumplan dos tipos de condiciones: condiciones necesarias y condiciones suficientes. Si la función es continua y derivable en el intervalo a<x<b Condiciones necesarias:
i. Exista la primera derivada.
ii. La primera derivada sea nula.
0
0 x
dx
xdfy
Condiciones suficientes:
i. Si y´´( x0 )<0 la función tiene un máximo local en x0 .
ydy
dx
df x
dx
( )
167
y x y x y xn( ) ( ) ( )( )
0 0 0 0
ii. Si y´´( x0 )>0 la función tiene un mínimo local en x0 .
iii. Si y´´( x0 )=0 deben analizarse las derivadas de orden superior para determinar la
naturaleza del punto extremo. Este análisis se puede realizar haciendo una expansión en una serie de Taylor cerca al valor x0 de la función:
n
nn
Rxy!n
xx...xy
!
xxxyxxxyxy
0
00
2
0000
2
Si , pero : La función tiene un máximo local en x0 si n es impar y y
(n+1)( x0 )<0.
La función tiene un mínimo local en x0 si n es impar y y(n+1)
( x0 )>0.
La función tiene un punto de inflexión en x0 si n es par.
4.2.2. Método analítico de funciones restringidas
La técnica de optimización para este tipo de problema es análoga al caso de funciones no restringidas, sólo que deben chequearse las restricciones para la solución que se obtenga. Específicamente, si la restricción es una restricción de igualdad, el óptimo se obtiene comparando los valores de la función objetivo en las raíces de la función restricción. Si existen restricciones de desigualdad, se obtienen los valores extremos de la función (máximos ó mínimos) y se comparan con el valor de la función objetivo evaluado en la frontera establecida por el dominio factible de la variable independiente. El dominio factible es el conjunto de factores de la variable independiente que satisface las restricciones. Ejercicio 1:
Maximizar 5 4 3
25 3525 24 4
5 2 3
x x xy x x
Sujeto a: x2 24 1 0 ( )
- 4.1 x 4.1 Dominio factible
La primera y la segunda derivada de la función objetivo son respectivamente:
y xn( ) ( ) 1
0 0
168
y x x x x
y x x x x x x
( )( )( )( )
( )( )( ) ( )( )( )
1 2 3 4
1 2 2 7 3 4 2 3
Chequeando los puntos estacionarios de la función se obtiene (ver tabla 1):
Tabla 1. Puntos estacionarios del ejercicio 1.
x y y y Tipo
1 4.37 0 -6 Max
2 3.73 0 2 Min
3 4.10 0 -2 Max
4 3.47 0 6 Min
-4.1 -2264.8
4.1 3.50
El máximo global cae en x =1.0
4.2.3. Métodos numéricos de funciones no restringidas
Los métodos numéricos se aplican cuando no se cumplen las condiciones para utilizar los métodos analíticos o es muy engorrosa la aplicación del método para determinar los valores extremos de la función objetivo. Estos métodos esencialmente requieren la determinación del valor de la función objetivo y algunas veces su gradiente en localizaciones sucesivas. En síntesis, la búsqueda de un óptimo mediante métodos numéricos envuelve el cálculo sucesivo de valores de la función objetivo y su comparación con un valor actual. Las dos características esenciales de estos métodos es la escogencia de la dirección y magnitud del desplazamiento en la búsqueda desde un punto actual. La investigación del óptimo puede llevarse a cabo por métodos preplaneados y secuenciales. En la primera técnica se eligen los puntos de investigación sin ninguna interacción entre ellos; mientras que en los métodos secuenciales la localización del próximo punto de investigación depende del resultado previo. El procedimiento general de los métodos secuenciales es el siguiente:
i. Seleccionar un punto base. ii. Evaluar la función objetivo en el punto base iii. Escoger de acuerdo al método una segunda localización factible. iv. Evaluar la función objetivo en la segunda localización. v. Comparar el valor de la función en el punto base y la segunda localización.
169
vi. Se prosigue la búsqueda en otra dirección si la función en el punto base es peor que en la segunda localización, de acuerdo con el objetivo de optimización, o se toma como punto base la segunda localización en el caso contrario.
De acuerdo con las características del método secuencial, este se puede clasificarse en: métodos de investigación directa y métodos del gradiente. Los métodos de investigación directa requieren únicamente la evaluación de la función objetivo en una localización particular. La selección de la dirección y magnitud del movimiento puede ser independiente o no de los resultados pasados. Si se utiliza esta información para decidir sobre la dirección y magnitud del movimiento, los métodos se pueden clasificar en: métodos uniformes y métodos acelerados, dependiendo si el desplazamiento tiene una magnitud uniforme o es variable. Los métodos del gradiente requieren valores tanto de la función objetivo como del gradiente en una localización. Estos métodos se dividen en dos subgrupos: Métodos que siguen la dirección del gradiente tan cerca como sea posible, con
desplazamiento acelerado o uniforme. Métodos que usan la dirección del gradiente como guía para la investigación,
pero no necesariamente en la dirección del gradiente, también con desplazamiento acelerado o uniforme.
Los métodos más comúnmente usados son el método de la etapa fija, método directo con aceleración, método de Fibonacci y método de la sección de oro.
4.2.3.1. Método de la etapa fija
Este es un método de investigación directa uniforme. A partir de un punto base, en el intervalo factible, y mediante desplazamientos de tamaño fijo, se evalúa la función en el punto base y en la nueva localización. De la comparación de estos dos valores, se continúa en un nuevo desplazamiento o se obtiene un subintervalo de incertidumbre. Si en el desplazamiento k-ésimo hubo cambio en la tendencia de la función objetivo decreciente-creciente, o creciente-decreciente, según se esté minimizando o maximizando, el intervalo de incertidumbre se establece como:
2 ,k kx x
Si se cumple la precisión requerida definida como:
1k kf x f x
el valor del óptimo se ubica en xk 1
170
Si la precisión requerida no se cumple, se continúa la búsqueda en el intervalo de
incertidumbre 2 ,k kx x, redefiniendo el tamaño del desplazamiento. El tamaño del
desplazamiento en cada intervalo de incertidumbre se define como:
Sx x
N
N 0
donde N es el número de subintervalos en que se divide el intervalo de
incertidumbre y x0 y xN sus limites: x0 , xN . En la figura 2 se muestran los
puntos en una búsqueda de un máximo. Nota: En caso que en el primer desplazamiento no se observe el comportamiento de la función esperado, creciente o decreciente según se esté maximizando o minimizando, se cambia de dirección para la búsqueda. El nuevo punto se ubica con la siguiente ecuación: x x S1 0
Figura 2. Puntos de búsqueda de un máximo por medio del método de la etapa fija
Ejercicio 2: Hallar el mínimo de
x xk
* 1
xo xk-2 xk-1xNxk
f(x)
SS... ...
xo xk-2 xk-1xNxk
f(x)
SSSS... ...
171
2
100f x x
Tomar como intervalo de incertidumbre 80 120 x y 4
En la tabla 2 se presentan las búsquedas hechas con el método de la etapa fija.
Tabla 2. Búsqueda del óptimo con el método de la etapa fija
Etapa ix f x
i( )
1 f x
i( )
1( ) ( )i if x f x S
1 84 400 256 144 4
2 88 256 144 112 4
3 92 144 64 80 4
4 96 64 16 48 4
5 100 16 0 16 4
6 104 0 16 16 4
Ya que no se cumple que la precisión requerida ( 1k kf x f x ), se cambia
de intervalo y redefine el desplazamiento, pues hubo cambio en la tendencia de la función
Nuevo intervalo: [96,104
104 962
4S
. En la tabla 3 se muestran las nuevas etapas de búsqueda del
óptimo.
Tabla 3. Nueva búsqueda del óptimo por el método de la etapa fija
Etapa xi f x
i( )
1 f x
i( )
1( ) ( )i if x f x S
1 98 16 4 12 2
2 100 4 0 4 2
3 102 0 4 4 2
Tomando x =100. Ejemplo 2: Se desea saber cuál es el espesor de aislamiento óptimo-económico para un tanque de almacenamiento. El costo se puede dividir en dos categorías: a) costo instalado (CI) y b) costo de operación (CO). El costo de aislamiento instalado
172
($/año) es C1C2Ax. También se debe instalar un serpentín de calentamiento para
mantener el aceite en el tanque con la viscosidad apropiada, y su costo de instalación es:
os ttU
QCC
43
donde:
oa
ao
hhk
x
ttAQ
11
Los costos de operación del tanque ($/año) son C5C6Q. Halle el costo mínimo y el
aislamiento requerido para el caso en que: A = 8000, t0 = 120, ta = 40, ts = 250, k
= 0.024, C1 = 4, C2 = 0.2, C3 = 0.8, C4 = 0.262, C5 = 1.5*10-6
, C6 = 4000, h0 = 15
+ 60x + 10x2, ha = 4.0 - 10x, U = 17.
CI : Costo instalado, $/año
CO : Costo de operación, $/año
CT : Costos totales, $/año
C1 : Costo del material aislante, $/(ft2 superficie)(ft espesor)
C2 : Costo de amortización, 1/año
C3 : Costo de calentamiento superficial, $/ft2
C4 : Costo de amortización, 1/año
C5 : Costo de vapor, $/BTU
C6 : Horas de operación por año, h/año
A : Área de aislamiento, ft2
ha : Coeficiente de transferencia de calor, de la pared del tanque al aire,
BTU/h(ft2)(ºF)
ho : Coeficiente de transferencia de calor, del aceite a la pared del tanque,
BTU/h(ft2)(ºF)
k : Conductividad térmica de aislamiento, BTU/h(ft)(ºF)
Q : Pérdida calor, BTU/h
U : Coeficiente de transferencia de calor entre el serpentín y el producto,
BTU/h(ft2)(ºF)
ta : Temperatura ambiente, ºF
to : Temperatura del producto, ºF
ts : Temperatura del serpentin, ºF
x : Espesor de aislamiento, ft
A continuación se hallará la función objetivo:
T I OC C C
1 2 3 4
0
I
s
QC C C Ax C C
U t t
173
oa
ao
hhk
x
ttAQ
11
2
0 15 60 10h x x 4 10ah x
2
2 2
2
$ 1 $ 1 /4 0.2 8000 0.8 0.262
17 250 120 ºº
I
QBTU hC ft xft
BTUft ft año ft añoF
hft F
5 $ 6400 9.48 10
añox Q
2
2
2 2
8000 120 40 º
1 1
0.024 4 10 15 60 10º º º
ft FQ
xft
BTU BTU BTUx x x
hft F hft F hft F
11 2
640000
41.67 4 10 15 60 10
BTUQ
hx x x x
QCCC 650
6 $1.5 10 4000O
h BTUC Q
BTU año h
3 $6 10 OC Q
año
5 3
5 3
6400 9.48 10 6 10
6400 9.48 10 6 10
TC x Q Q
x Q
Después de sustituir Q, se obtienen los costos totales anuales en función del espesor del aislamiento.
Función objetivo:
2
3900.6726400
1 141.67
4 10 15 60 10
TC x
xx x x
La solución se hallará por el método de la etapa fija: Tomando como intervalo de incertidumbre 0 0.2x y 2
Si 0.2 0
10 0.0210
N S
174
En la tabla 4 se presentan las iteraciones para la búsqueda del espesor óptimo económico del aislante.
Tabla 4. Iteraciones para la búsqueda del óptimo del ejemplo 2.
Etapa xi
1( )
T iC x
( )
T iC x S
1 0.000 -7588.23 12317.9 19906.1 0.020
2 0.020 12317.9 3495.67 8822.2 0.020
3 0.040 3495.67 2204.39 1291.3 0.020
4 0.060 2204.39 1753.63 450.76 0.020
5 0.080 1753.63 1567.25 186.38 0.020
6 0.100 1567.25 1497.72 69.531 0.020
7 0.120 1497.72 1490.04 7.6796 0.020
8 0.140 1490.04 1519.03 28.9919 0.020
Se cambia de intervalo y redefine el desplazamiento, pues hubo cambio en la tendencia de la función objetivo.
Nuevo intervalo: [0.100, 0.140]
0.140 0.100
5S
En la tabla 5 se muestran las nuevas iteraciones.
Tabla 5. Nuevas iteraciones para la búsqueda del óptimo del ejemplo 2.
Etapa xi
1( )
T iC x
( )
T iC x
1( ) ( )i if x f x S
1 0.092 1546.45 1516.02 30.429 0.008
2 0.100 1516.02 1497.72 18.301 0.008
3 0.108 1497.72 1489.03 8.6936 0.008
4 0.116 1489.03 1488.07 0.9549 0.008
5 0.124 1488.07 1493.44 5.36987 0.008
Tomando 2 , se obtiene el espesor óptimo: 0.116x ft , lo cual hace que los
costos totales sean mínimos e iguales a 1488.07 $/año
175
4.2.3.2. Método directo con aceleración
Como su nombre lo indica este es un método directo, en donde el desplazamiento es acelerado. En este método la función se evalúa en la secuencia:
Sxx,...Sx,Sx,Sx,x kkk
112100 242
donde xk es el primer valor en que falla la tendencia de la función. Es decir, si se
está buscando un máximo:
y0 < y1 < y2 ...<yk-1
yk-1 yk
El intervalo de incertidumbre se establece como: [xk-2 , xk
La amplitud de este intervalo es =3(2k-2
S) (ver figura 3).
Si para el primer paso 0 1y x y x , el máximo o el mínimo se ubica en el
intervalo 0 1,x x .
Si 0 1y x y x ó 0 1y x y x , en el caso de maximización o minimización, la
búsqueda debe realizarse en la dirección contraria con: 1 0x x S .
Figura 3. Búsqueda de un máximo por el método directo con aceleración El máximo se puede localizar de varias maneras:
Aproximando los tres últimos puntos a un polinomio de segundo grado, por
ejemplo, con el método de Gregory-Newton:
xk-2 xk-1 xk
f(x)
222
kdS
12kd S
xk-2 xk-1 xk
f(x)
222
kdS
12kd S
176
0 1 2 11 2 1k k ky x x x x x x
donde:
2 111 1 2
2 1 2 1 2 1
2 1
, ,
k kk k k
k k k k k k k k
k
k k k k
y yf x x x
x x x x x x x x
y
x x x x
El óptimo se localiza en:
Realizando una búsqueda adicional en 1kx .
x xd
k k 1 12
donde: d x xk k 1
El óptimo se localiza con las siguientes fórmulas:
o Si y(xk+1) < y(xk-1), para un máximo y si y(xk+1) > y(xk-1), para un mínimo
o Si y(xk+1) > y(xk-1), para un máximo y si y(xk+1) < y(xk-1), para un mínimo
0 2 2 y y xk k( )
11 2
1 2
1 2
y y
x xf x xk k
k k
k k,
x x xk k
1
2 22 1
1
11
( )
x xd y y
y y yk
k k
k k k
1
1 2
1 1 24 2
x xd y y
y y yk
k k
k k k
1
1
1 14 2
177
Ejercicio 3:
Hallar el mínimo de 2( ) ( 100)f x x .
Sugerencia: partir de x0 = 66 y usar un desplazamiento original S = 3. En la tabla 6
se muestran los resultados de las iteraciones.
Tabla 6. Iteraciones en la búsqueda del mínimo del ejercicio 3.
Etapa xk
f xk
( )1
f xk
( ) 1( ) ( )i if x f x d
1 69 1156 961 195 3
2 75 961 625 336 6
3 87 625 169 456 12
4 111 169 121 48 24
5 159 121 3481
El intervalo de incertidumbre es [87,159. Repitiendo el proceso (tabla 7)
Tabla 7. Nuevas iteraciones en la búsqueda del mínimo del ejercicio 3.
Etapa xk
f xk
( )1
f xk
( ) 1( ) ( )i if x f x d
1 90 169 100 69 3
2 96 100 16 84 6
3 108 16 64 48 12
El mínimo puede calcularse con la aproximación de segundo grado: 0 2 100 f xk( )
1 1 2
16 100
96 9014
f x xk k,
2 111 1 2
2 1 2 1 2 1
2 1
( ) ( ), ,
( )( ) ( )( )
( )
( )( )
100 16 64 1 0
(90 96)(90 108) (96 90)(96 108) (108 96)(108 90)
k kk k k
k k k k k k k k
k
k k k k
f x f xf x x x
x x x x x x x x
f x
x x x x
178
* 12 1
11
*
*
1
2 2
1 1490 96
2 2
100
k kx x x
x
x
El mínimo también puede estimarse, realizando el experimento o búsqueda en xk 1.
1 1
1
2
1296
2
k k
k
dx x
x
1
1
102
( ) 4
k
k
x
y x
Como 1 1( ) ( )k ky x y x , (4<16) , entonces
x xd y y
y y yk
k k
k k k
1
1
1 14 2
* 12 64 16102
4 64 2 4 16x
* 48102 3
72x
* 102 2x
x* 100
Ejemplo 3: Resuelva el ejemplo 2 por el método directo con aceleración.
Se parte de 0 0.095x y desplazamiento original de 0.005. En la tabla 8 se
muestran las iteraciones.
Tabla 8. Iteraciones en la búsqueda del mínimo del ejemplo 3.
Etapa xi
1( )
T iC x
( )
T iC x
1( ) ( )i if x f x S
1 0.100 1507.89 1497.72 10.1691 0.005
2 0.110 1497.72 1488.12 9.59601 0.010
3 0.130 1488.12 1500.95 12.8303 0.020
4 0.170 1500.95 1604.1 103.151 0.040
179
El intervalo de incertidumbre es [0.110, 0.170]. Repitiendo el proceso(tabla 9):
Tabla 9. Nuevas iteraciones en la búsqueda del mínimo del ejemplo 3.
Etapa xi
1( )
T iC x
( )
T iC x
1( ) ( )i if x f x S
1 0.115 1488.12 1487.82 0.30446 0.005
2 0.125 1487.82 1494.5 6.68064 0.010
3 0.145 1494.5 1530.32 35.816 0.020
El mínimo puede calcularse con la aproximación de segundo grado:
0 1 111487.819, 668.064, 4957426.6 * 0.120 1490Tx C
Realizando una búsqueda adicional:
1 1
0.02
0.135 1509.2k T k
d
x C x
Como 1509.2 > 1494.5, entonces se aplica la fórmula:
* 0.11167 1487.7Tx C
Finalmente, se escoge este último como el valor mínimo.
4.2.3.3. Método de Fibonacci
Es un método de aproximación secuencial que usa como mínimas dos investigaciones por ciclo para eliminar una región de posteriores búsquedas. Es análogo a los métodos anteriores con un tamaño de etapa variable, en donde el intervalo de incertidumbre se disminuye en cada etapa e igualmente el desplazamiento para la localización del óptimo y están relacionados con los números de la serie de Fibonacci. El método exige predeterminar el número de investigaciones del óptimo que se van a realizar. En cada subintervalo de incertidumbre los puntos se localizan a una misma distancia de los extremos (ver figura 4).
x xd y y
y y yk
k k
k k k
1
1 2
1 1 24 2
180
Figura 4. Representación de las etapas a seguir con el método de Fibonacci
En la figura 4 puede observarse que AC DB y CD EB . La variable
independiente se ubica en AB , y por ejemplo, en una búsqueda j cualquiera, en C y D se encuentran los valores a investigar en la función, y de esta manera se decide cuál se rechaza y cuál se conserva para la siguiente búsqueda. En el
gráfico se descarta la región AC . En el ejemplo 4 se ilustra esta situación.
Para satisfacer el requerimiento de equidistancia de los extremos de los puntos de investigación del óptimo, se debe cumplir la relación:
donde N es el número de investigaciones predeterminadas. La serie de Fibonacci es la solución de la siguiente ecuación diferencia.
F F Fj j j 1 2 , 1 1oF F , cuya solución es:
1 1
1 1 5 1 5, 0
2 25
j j
jF j
En el primer intervalo de incertidumbre, las investigaciones se localizan a una
distacia l1 de los extremos:
21 1
N
N
Fl L
F
En los intervalos siguientes sólo se requiere de una investigación por cada etapa, porque se conserva un punto de la etapa anterior, como puede confirmarse en la
lF
FLj
N j
N j
j
( )
( )
1
1
A BC D E
Lj
lj lj
lj+1lj+1
Lj+1
Región que
se descarta
A BC D E
Lj
lj lj
lj+1lj+1
Lj+1
A BC D E
Lj
lj lj
lj+1lj+1
Lj+1
Región que
se descarta
181
figura 4 con el punto D. Después de realizar m experimentos de los N predeterminados, la longitud del intervalo de incertidumbre está dada por:
LF
FLm
N m
N
( )1
1
La región fraccional de incertidumbre o efectividad, definida como la fracción con respecto al intervalo de incertidumbre a la que se reduce el intervalo después de realizar las N investigaciones, está dada por:
La última investigación se lleva a cabo en el centro del intervalo LN 1:
2
11
2
1
NN
oN
LL
F
Fl
Ejemplo 4: Resuelva el ejemplo 2 por el método de Fibonacci. Si se define una efectividad de 0.01, se puede determinar FN y por lo tanto N:
1 1100
0.01NF
1 1
1 1 5 1 5, 0
2 25
j j
jF j
,
para j = 10, F10 = 89 y para j = 11, F11 = 144. Se decide trabajar con N=10
En la tabla 10 se presentan los resultados de las iteraciones. El espesor óptimo es de 0.112 ft para un costo total mínimo de 1487.64 $/año. Como puede observarse en la tabla 10 se realizaron 10 búsquedas, dos en el intervalo inicial y una en cada etapa siguiente; aunque debe aclararse que realmente son nueve búsquedas, pues la última coincide con la que se conserva de la etapa anterior.
Tabla 10. Iteraciones en la búsqueda del mínimo del ejemplo 4.
Etapa Lk lk x CT Intervalo
0 0.000 0.200
EL
L F
N
N
1
1
182
1 0.200 0.076 0.076 0.124 1589.72 1493.04 0.076 0.200
2 0.124 0.047 0.124 0.153 1493.04 1550.50 0.076 0.153
3 0.076 0.029 0.106 0.124 1490.73 1493.04 0.076 0.124
4 0.047 0.018 0.094 0.106 1509.43 1490.73 0.094 0.124
5 0.029 0.011 0.106 0.112 1490.73 1487.64 0.106 0.124
6 0.018 0.007 0.112 0.117 1487.64 1488.36 0.106 0.117
7 0.011 0.004 0.110 0.112 1488.09 1487.64 0.110 0.117
8 0.007 0.002 0.112 0.115 1487.64 1487.75 0.110 0.115
9 0.004 0.002 0.112 0.112 1487.64 1487.64 0.112 0.112
4.2.3.4. Método de la sección de oro
Este método es una modificación del método de Fibonacci. Se ha observado que para grandes valores de j:
, por lo tanto,
0.382J jl L , cuando N>5.
Este método exige que las últimas cinco investigaciones se hagan mediante el método de Fibonacci. El método se utiliza cuando no se conoce el número de investigaciones que se van a realizar, o no se sabe el límite de seguridad deseado. Por el contrario el método de Fibonacci permite el cálculo del número de investigaciones a partir de la relación de la seguridad deseada. La región fraccional de incertidumbre después de realizar N experimentos está dada por:
Ejercicio 4: Localizar el mínimo de la función representada por:
y x ( )30 2
Tomar como intervalo de incertidumbre inicial 0 100 x . En la tabla 11 se presentan los resultados.
Tabla 11. Iteraciones en la búsqueda del mínimo del ejercicio 4.
F
F
j
j
20 382.
( . )0618 1N
183
Etapa Lk lk
x y x( ) Intervalo
0 0 100 x 1 100 38.2 38.2, 61.8 67.2, 1011 0 618 x . 2 61.8 23.61 23.61, 38.2 40.8, 67.2 0 382 x . 3 38.2 14.59 14.59, 23.61 237.5, 40.8 1459 382. . x 4 23.61 9.0 23.61, 29.2 40.8, 0.6 2361 382. . x 5 14.59 5.57 29.2, 32.63 0.6, 6.9 2361 32 6. . x 6 9.02 3.45 27.06, 29.2 8.6, 0.6 27 06 32 6. . x 7 5.57 2.13 29.2, 30.5 0.6, 0.3 2919 32 6. . x 8 3.44 1.3 30.5, 31.33 0.3, 1.8 2919 3133. . x
Hasta este punto la región fraccional de incertidumbre es 7
0.618 0.034
Se continúa con el método de Fibonacci a partir de la novena etapa (ver tabla 12).
Tabla 12. Últimas etapas en la búsqueda del mínimo del ejercicio 4.
Etapa Lk lk
x y x( ) Intervalo
0 2919 3133. . x 1 2.14 0.8025 29.98, 30.52 4x10
-4, 0.27 2919 3052. . x
2 1.33 0.532 29.72, 29.98 0.078, 4x10-4
29 72 3052. . x 3 0.8 0.2666 29.98, 30.25 4x10
-4, 0.0625 29 72 3025. . x
4 0.53 0.265 29.98, 29.98 4x10-4
, 2x10-4
29 98 3025. . x
El óptimo se localiza en x* . 29 985 con * 4( ) 2 10y x . El número total de etapas
fue 12, lo que sería equivalente a trabajar con el método de Fibonacci para N = 13. Ejemplo 5: Resuelva el ejemplo 2 por el método de la sección de oro. Se va a tomar como intervalo de incertidumbre inicial 0 0.2x . En la tabla 13 se
presentan las iteraciones.
Tabla 13. Iteraciones en la búsqueda del mínimo del ejemplo 5.
Etapa Lk lk x CT Intervalo
lF
FL1
3
5
1
3
8214 08025 * * . . .
184
0 0.000 0.200
1 0.200 0.076 0.076 0.124 1589.75 1493.04 0.076 0.200
2 0.124 0.047 0.124 0.153 1493.05 1550.44 0.076 0.153
3 0.076 0.029 0.106 0.124 1490.76 1493.05 0.076 0.124
4 0.047 0.018 0.094 0.106 1509.30 1490.77 0.094 0.124
5 0.029 0.011 0.106 0.112 1490.77 1487.64 0.106 0.124
Se hacen las últimas búsquedas con el método de Fibonacci (tabla 14):
Tabla 14. Últimas iteraciones en la búsqueda del mínimo del ejemplo 5.
Etapa Lk lk x CT Intervalo
0 0.106 0.124
1 0.018 0.007 0.112 0.117 1487.65 1488.36 0.106 0.117
2 0.011 0.005 0.110 0.112 1488.10 1487.65 0.110 0.117
3 0.007 0.002 0.112 0.115 1487.65 1487.74 0.110 0.115
4 0.005 0.002 0.112 0.112 1487.65 1487.65 0.110 0.112
La región fracciónal de incertidumbre en este caso se ha reducido a 2.3% , el
cual puede considerarse un valor aceptable. El espesor óptimo es de 0.112 ft para un costo total mínimo de 1487.65$/año.
4.2.4. Método numérico de funciones restringidas
Muchas funciones solamente toman valores en valores discretos de la variable independiente. Caso de estas funciones se obtienen con procesos reales donde, la variable independiente es el diámetro de la tubería, el espesor de los materiales de aislamiento, el número de unidades en una batería de unidades de proceso: reactores, evaporadores, etc. En los problemas con estas restricciones no son directamente aplicables los métodos precedentes. Estos problemas pueden ser resueltos utilizando modificaciones de los métodos anteriores. Por ejemplo, el método de Fibonacci puede aplicarse con algunas adaptaciones. Caso 1:
Si la función discreta está definida en K puntos y se cumple que: K FN 1
185
Donde FN: Número de la serie de Fibonacci
Para esta aplicación no es necesario que los valores de la variable independiente estén igualmente espaciados, pero si se requiere que estén ordenados de alguna forma. Una vez estén ordenados, creciente o decrecientemente, es necesario rotular los valores con números desde 1 hasta K, de tal manera que cada uno quede identificado por un entero k, donde:
1 k K Con esta asociación de la posición definida, para cada valor de la variable independiente la búsqueda del óptimo siempre corresponderá a un número entero, que no es el valor de la variable sino que indica la posición de la variable en el orden preestablecido. Se define entonces que el intervalo inicial para la búsqueda está dado por: L K1 1
y los dos primeros experimentos se realizan en k l 1 y k K l 1 1 , donde:
2 21 1 2( 1)
( 1)
N NN
N
F Fl L K F
F K
En general:
lF
FL Fj
N j
N
N j
( )
( )
1
1 1
Caso 2: Si K+1 no es un número de la serie de Fibonacci, se agregan puntos ficticios en los extremos hasta obtener un número de la serie de Fibonacci, o sea que:
1NF F K
Donde F es el número de puntos ficticios agregados en los extremos. Se recomienda que estos puntos se distribuyan en los dos extremos; y si debe realizarse una búsqueda en un punto ficticio se pasa la búsqueda al punto real más cercano. El intervalo de incertidumbre inicial, para los dos casos se define como [0,FN] y en la etapa j, [kI,kS] siendo kI el límite inferior y kS el superior. Estos valores dependen de que región se descarta y cual se conserva, de acuerdo con el objetivo de optimización.
186
Las posiciones en el ordenamiento donde debe evaluarse la función objetivo en la etapa j serán: k1 = kI + lj y k2 = kS-lj Si el mejor valor de la función objetivo, mínimo o máximo, se ubica en el valor k1, se descartan los valores mayores que k2 y se conservan para el nuevo intervalo de incertidumbre todos los valores de k menores que k2. En el caso en que el mejor valor de la función se ubique en el valor k2, se descartan los valores menores que k1. Ejemplo 6:
Se desea bombear 1000 lb/h de glicerina a 15°C desde un tanque de almacenamiento que está al nivel del piso, hasta otro situado a una altura de 35 ft. La longitud total de la tubería es de 75 ft e incluye cuatro codos de 90°. Determine el diámetro más apropiado de la tubería para la planta considerando solamente los costos de tubería instalada y los costos de bombeo. El costo de tubería de 1 in de diámetro es X $/ft de longitud, y para determinar el costo de cualquier tubería se puede utilizar la relación:
2
1
2
1
D
D
C DC D
CD: Costo de la tubería de diámetro D
Los tamaños estándares de la tubería pulgadas pueden ser tomados como 1, 1¼, 1½, 2, 2 ½, 3, 4, 5, 6 y 8, los costos de electricidad Y $/kwh. Una representación del sistema se muestra en la figura 5.
187
Figura 5. Representación del sistema de bombeo del ejemplo 6.
Total B TC C C CB: Costos de bombeo CT: Costos de tubería
BC Q HtY H: Cabeza del sistema g t: Tiempo
D SH h h hD: Cabeza total de descarga
hS: Cabeza total de succión
D SD PD fDh h h h hSD: Cabeza estática de descarga
hPD: Cabeza superficial de descarga
hfD: Cabeza fricción de descarga
S SS PS fSh h h h hSS: Cabeza estática de succión
hPS: Cabeza superficial de succión
hfS: Cabeza fricción de succión
235SDh H
0PDh
A la cabeza de fricción de descarga contribuyen los 74 ft de tubería (1), los cuatro codos de 90º (2) y el agrandamiento súbito al final de la línea de descarga, pero este último es despreciable.
1 2fD fD fDh h h
2 2
1
644
2 Re 2fD
L V L Vh f
D g D g
35 ft
H1
H2
1ft
35 ft
H1
H2
35 ft
H1
H2
1ft
188
3 3
8
2
3
3
1.264 79.01 800 2.42 1936
9.8 4.1731 10
11000 12.673
79.01
g lb lbcp
cm ft fth
m ftg
s h
lb lb ftQ
h ft h
2 2 2
4 4 12.673 16.136 0.6577 Re
Q Q DVV
A D D D D
2 3
1 44 8
16.13664 74 2.2464 10
0.6577 2 4.1731 10fD
Dh
D DD
Aunque la solución de este problema se buscará en régimen laminar, se usarán valores de longitudes equivalentes de tubería para régimen turbulento como una aproximación. En la tabla 15 se presentan las longitudes equivalentes (Le) de tubería recta para codos estándares de 90º para flujo turbulento.
Tabla 15. Longitudes equivalentes para codos de 90º1.
Diámetro nominal
(in) 1 1¼ 1½ 2 2½ 3 4 5 6 8
Longitud
equivalente (ft)2
1.6 2.1 2.4 3.1 3.6 4.4 5.9 7.3 8.9 12
Diámetro interno (ft) 0.087 0.115 0.134 0.172 0.206 0.256 0.336 0.421 0.505 0.673
Realizando una regresión del diámetro interno (ft) frente a la longitud equivalente (ft) y haciéndola pasar por el origen, se obtiene el mejor ajuste para una línea recta cuya ecuación es 17.658Le D
2
2 34 8
16.13664 0.002144
0.6577 2 4.1731 10fD
Le DDh
D DD
3
4 3
2.2464 10 0.00214fDh
D D
3
2 4 3
2.2464 10 0.0021435Dh H
D D
1 Syska R. And Birk J., “Pump engineering manual”, The Duriron Company, 1976
2 Radio corto
189
1SSh H
0PSh
A la cabeza de fricción de succión contribuyen 1 ft de tubería y pérdidas por la entrada a la tubería, pero esta última se va a despreciar.
2 5
44 8
16.13664 1 3.0357 10
0.6577 2 4.1731 10fS
Dh
D DD
5
1 4
3.0357 10Sh H
D
3 5
2 14 3 4
2.2464 10 0.00214 3.0357 1035H H H
D D D
Suponiendo que H1 = H2
3
4 3
2.216 10 0.0021435H
D D
33 35
3
3 3
2 3 3 3
0.304812.673 9.97 10
3600
1009.8 1.264 12387.2
1000
8000
151$ /
ft h mQ
h ft s s
cmm g kg Ng
s cm g m m
t h
Y kW
3 35
3 4 3
2.216 10 0.00214 0.3048 9.97 10 12387.2 35
1
$ 1 8000 151
1000
BC Q HtY
m N mft
s m D D ft
h kW Ws
año kWh W Nm
4 3
1.008 0.973 15917
D D
El costo de tubería de 1 in de diámetro nominal en acero inoxidable 304 sch 40 es 18900 $/m.
190
1
1
T D
D LC C
D T
L: Longitud total de tubería, ft T: Vida útil del sistema, año Para la longitud de tubería del sistema y 10 años de vida útil:
$ 0.3048 12 118900 75
1 1 1 10
518465
T
m Dft inC ft
m ft in ft año
D
Sumando los costos de tubería y costos de bombeo se obtiene la función objetivo:
4 3
1.008 0.97315917 518465TotalC D
D D
D[=] ft, diámetro nominal CT[=] $
El diámetro óptimo se encuentra entre uno de los siguientes valores de diámetro nominal en pulgadas: 1, 1¼, 1½, 2, 2 ½, 3, 4, 5, 6 y 8. En estos casos el método más apropiado para realizar la optimización es el numérico de funciones restringidas, tal como el de Fibonacci modificado, en donde la variable toma valores discretos. Siguiendo el método tenemos que: K = 10, K+1 = 11 Como K+1 no coincide con un número de Fibonacci, entonces corresponde al caso 2, y debe buscarse un F tal que:
1NF F K
De allí se encuentra F = 2 y F6 = 13 En la tabla 16 se muestra la distribución de la variable independiente D, frente a la nueva variable independiente k. Como puede observarse, los valores ficticios de k se distribuyen en los extremos del intervalo de D. Uno se adicionó a la izquierda, por ello el primer valor del diámetro no está asociado al valor de k = 1, y el otro se adicionó al otro extremo. Queda el intervalo inicial [0, FN] = [0, 13]
191
Tabla 16 Variables independientes para el ejemplo 6
k 0 1 2 3 4 5 6 7 8 9 10 11 12 13
D(in) 1 1¼ 1½ 2 2½ 3 4 5 6 8
En la tabla 17 se muestran los resultados de las iteraciones,
Tabla 17. Iteraciones en la búsqueda del mínimo del ejemplo 6.
Etapa Lj lj k CTotales Intervalo
0 0 13
1 13 5 5 8 1.038x105 1.888x10
5 0 8
2 8 3 3 5 0.79356x105 1.038x10
5 0 5
3 5 2 2 3 0.8171x105 0.79356x10
5 2 5
4 3 1 3 4 0.79356x105 0.8535x10
5 2 4
5 2 1 3 3 0.79356x105 0.79356x10
5
El diámetro óptimo para el sistema de bombeo es 1¼ in. El número de Reynolds
para este diámetro es 6.34 el cual es menor de 2100, confirmando la suposición de régimen laminar en el sistema.
4.3. Métodos de optimización de funciones multivariables
4.3.1. Método analítico de funciones no restringidas
Análogamente a las funciones univariables, para la existencia de un punto extremo es necesario que se cumplan dos tipos de condiciones:
si f x x x f Xn( , , . . . , ) ( )1 2
es la función objetivo, las condiciones necesarias y
suficientes son: Condiciones necesarias:
i. f X( )
diferenciable en X *
ii. 0
*Xf
Condiciones suficientes:
f X( )
sea dos veces diferenciable en X *
i. Para un máximo, que:
192
Di 0 ; i=1,3,5,... (impar)
Di 0 ; i=2,4,6,... (par)
ii. Para un mínimo, que:
Di 0 ; i=1,2,3,4,...
Donde: Di es el determinante menor de la matriz hessiana definido como:
iiii
i
i
xxxxxx
xxxxxx
xxxxxx
i
fff
fff
fff
D
21
22212
12111
donde:
2 *f X
fx x x xj i j i
; segunda derivada evaluada en *X
Si no se cumple ninguno de los dos grupos de condiciones suficientes, el valor estacionario puede no ser una condición óptima. En el caso en que todos los Di
sean ceros deben chequearse las derivadas de orden superior a dos. En los otros casos el punto estacionario es un punto silla. Las condiciones necesarias y suficientes para un punto óptimo de una función pueden analizarse en la expansión de Taylor para la función. La expansión de Taylor para una función puede expresarse como:
y X y X yy y y
kR
k
k( ) ( )! !
. . .!
2 3
12 3
ó
f X f X ff f f
kR
k
k( ) ( )! !
. . .!
2 3
12 3
donde:
*
1 1 2 2
1 2
... n n
n
f X f X f Xf x x x x x x
x x x
2 2 2 *
2 2 22
1 1 2 22 2 2
1 2
... n n
n
f X f X f Xf x x x x x x
x x x
193
2 * 2 *
* * * *
1 1 2 2 1 1 3 3
1 2 1 3
2 2 ...f X f X
x x x x x x x xx x x x
2 * 2 *
** * *
1 1 1 1
1 1
2 ... 2n n n n n n
n n n
f X f Xx x x x x x x x
x x x x
En general:
k
n
p
n n
pk
p p
n
pf
k
p p px x x x
f X
x x xn
n
!
! !. . . !( ) . . . ( )
( )
. . .
* *
1 2
1 1
1 2
1
1 2
donde la sumatoria se hace sobre todos los enteros positivos mayores o iguales a cero, tal que:
p ki
i
n
1
Por ejemplo para n=2 y 2 f k=2, los enteros resultantes son:
p1 = 0 y p2 = 2, p1 =1 y p2 = 1, p1 = 2 y p2 = 0
2 *2 * *1 2
1 1 2 21 21 2
1 2
2! ( )( ) ( )
! !
f Xp pf x x x x
p pp p x x
2 * 2 * ** 2 * * * 2
1 1 1 1 2 2 2 22 2
1 1 2 2
2( ) ( ) ( )( ) 2( )( ) ( )
f X f X f Xx x x x x x x x
x x x x
Para que la función f X( )
tenga un óptimo en un punto estacionario se requiere:
i. Para un máximo: 2 0f
ii. Para un mínimo : 2 0f
Si no se cumplen las condiciones anteriores deben analizarse los signos de los de orden superior junto con la función en términos de la serie de Taylor, o sea :
f X f X ff f f
k
k
( ) ( )!
...!
*
2 3
2 3!
Ejercicio 5: Encuentre el punto estacionario de la función
f X x x x x x x x x( )
1
2
2
2
3
2
1 3 2 3 12 4
194
y diga si es un máximo o un mínimo.
1 3
1
2 2 4f X
x xx
2 3
2
2f X
x xx
1 2 3
3
2 2f X
x x xx
Haciendo *( ) 0f X , se obtiene:
2 2 4 0
2 0
2 2 0
1 3
2 3
1 2 3
x x
x x
x x x
Resolviendo el sistema de ecuaciones lineales se tiene: x
x
x
1
2
3
10
4
8
Evaluando los determinantes menores de la matriz hessiana:
D fx x
Dfx x fx x
fx x fx x
D
fx x fx x fx x
fx x fx x fx x
fx x fx x fx x
1 1 1
21 1 1 2
2 1 2 2
3
1 1 1 2 1 3
2 1 2 2 2 3
3 1 3 2 3 3
fx x
fx x
fx x
fx x
fx x
fx x
fx x
fx x
fx x
1 12
1 20
1 32
2 10
2 22
2 31
3 12
3 21
3 32
195
D 21
2 0D 4
2 0 -2
2 0 -2
D 0 -2 -1 23
-2 -1 2
El punto estacionario no es ni máximo ni mínimo, es un punto silla. Ejemplo 7: Un fabricante puede producir un cierto ítem A por 20 pesos/lb y un ítem B por 10 pesos/lb. El equipo de mercadeo de la empresa cree que la compañía puede vender 2’000.000/x
2y lb/dia de A y 2’000.000/xy
2 lb/día de B, donde x es el precio
de venta de A, en pesos/lb y y es el precio de venta de B, en pesos/lb. Cuáles son
los valores de x y y para obtener el máximo beneficio? El beneficio obtenido se puede expresar a través de la siguiente función objetivo:
10000.000'2
20000.000'2
22 y
xyx
yxXf
Siendo
y
xX
Utilizando el método analítico de funciones no restringidas, se puede optimizar
Xf para hallar los valores de x y y que hacen máxima la función.
Se debe cumplir la condición necesaria:
0)( *
Xf , es decir:
0
0)( *
y
fx
f
Xf
0102
401026
22
y
x
y
yxx
Xf (1)
196
0202
201026
22
x
y
x
yxy
Xf (2)
Resolviendo el sistema de ecuaciones formado por (1) y(2), se obtiene:
30* x y 15* y
Con estos valores, se puede confirmar la otra condición necesaria, de que *Xf
es diferenciable en xX
. Para la existencia de un máximo debe cumplirse que Di 0 ; i=1,3,5,... (impar)
Di 0 ; i=2,4,6,... (par).
D
f f f
f f f
f f f
i
x x x x x xi
x x x x x xi
xix xix xixi
1 1 1 2 1
2 1 2 2 2
1 2
.....
.....
: : :
.....
fx
jxi
f X
xj
xi
2 ( *)
62
2 2 2 2
2 10 120 4 206.584
f y yfxxx x y x x x
2 6
2 2 2 2
2 10 60 4 4026.337
f x xfyyy x y y y y
2 6
2 2
2 10 40 202 6.584
ffxyx y x y x y
2 6
2 2
2 10 40 202 6.584
ffyxy x x y x y
1 6.584 0D
2
6.584 6.584130.05 0
6.584 26.337D
Se confirma que los valores de x = 30 y y = 15, generan el máximo beneficio.
4.3.2. Métodos analíticos de funciones restringidas
197
4.3.2.1. Restricciones de igualdad
4.3.2.1.1. Método de substitución directa Si existen m restricciones de igualdad lineales, el método consiste en eliminar m de las n variables y resolver el problema por el método de funciones no-restringidas con (n - m) variables.
Ejercicio 6:
Encontrar el mínimo de la función: f X x x
4 51
2
2
2 sujeto a 2 3 61 2x x .
De la restricción se obtiene que:
xx
126 3
2
al sustituir x1 en la función objetivo se obtiene:
2
1 2 2 2
1 2
2
2
14 36 36
28 36
f x x x
f xx
x
2 2
2
1 1
1
361.286
28
28
1.071
x x
x
D f
x
El mínimo es:
2 2*
*
4 1.071 5 1.286
12.857
f X
f X
El método de substitución directa es recomendable cuando las variables pueden despejarse fácilmente para substituirlas. Este método debe usarse preferencialmente cuando las restricciones son lineales.
Ejercicio 7:
Maximizar y x x x 1 2 3
23 5
Sujeto a x x x1 2
2
33 10
198
Eliminando
x x x
f x x y x x x x
1 2
2
3
2 3 1 2
2
3 2 3
2
10 3
10 3 3 5
,
10 3 5 32
2
2 3
2
3x x x x
Condiciones necesarias:
y
xx x
y
xx x
x
1
2
2 2
1
3
3 3
1
2
2 3 03
2
10 3 03
10
103
23
3
108 65
.
Condiciones suficientes:
D f Df f
f f
fy
xD
fy
x x
fy
x x
fy
x
x x
x x x x
x x x x
x x
x x
x x
x x
1 2
2
1
2
2 1
2
1
2 3
2
1
3 2
2
1
3
2
2 2
2 2 2 3
3 2 3 3
2 2
2 3
3 2
3 3
2
0
0
10
2
2 020
0 10D
*
8.65
3/ 2
3/10
X
es un máximo
199
Ejemplo 8: Se dispone de la materia prima A en una solución saturada de 0.2 gmol/l, a partir de la cual se puede producir D mediante la reacción:
A D
cuya velocidad de reacción puede aproximarse a:
-rA = k1CA donde:
k1 = 0.004 min-1
CA [=] gmol/l Determine el grado de conversión necesaria y el tamaño del reactor de tanque agitado para un proceso constituido por un reactor y una unidad de destilación para la recuperación del reactivo, para producir 50 gmol/min de D, si el costo del reactor es 3000+1500V pesos y el de la columna 20000+5000Q pesos, donde:
V: Volumen del reactor, l
Q: Flujo volumétrico en el sistema, l/min
Los costos de operación anual del reactor y de la columna de destilación pueden asumirse proporcionales al flujo e iguales a $10000/(l/min)(año). El valor del producto D es 60 $/gmol y el de A en solución 20 $/gmol. Para el análisis del sistema considere que se opera 350 días al año y se tiene un horizonte económico de vida útil igual a 10 años. También asuma que la recuperación del reactivo en la unidad de destilación es completa, que no se recircula en el sistema y que tiene el mismo precio de la solución materia prima. En la figura 6 se muestra el esquema del problema planteado. Modelo matemático del sistema:
2
*
8.65 3(3/ 2) 5(3/10)
12.7
y
y
CA0 = 0.2 gmolmin
CD = 0
Q, CA, CD
CD = 50 gmolmin
CA0 = 0.2 gmolmin
CD = 0
Q, CA, CD
CA0 = 0.2 gmolmin
CD = 0
Q, CA, CD
CD = 50 gmolmin
-1
-1
200
Figura 6. Esquema del problema 8
1. Volumen de control: Reactor - Reactor CSTR - Sistema isotérmico - Flujo volumétrico constante
Principio de conservación de masa:
0 1A A AQC k C V QC (i)
1 A Dk C V QC (ii)
2. Volumen de control: Unidad de destilación
50min
D
gmolQC (iii)
Modelo matemático del problema de optimización: Tiempo de análisis: 1 año de operación Objetivo a optimizar: costos totales anuales Costos totales anuales = costos operación anual + costo anual materia prima +
costo anual del reactor (inversión) + costo anual de la torre (inversión)
En la función del costo se asume que no se carga al sistema costos financieros del capital invertido en el reactor y en la unidad de destilación.
201
Costo de operación anual = Q10000
Se tiene sólo en cuenta la materia prima que reacciona, porque la otra se recupera en el proceso.
Costo materia prima (A) = 8( ) 60min 24 350 $50 20 5.04 10
min ( )
gmol A h d
h d año gmol A
Costo de capital por el reactor (anual) = 1
3000 1500 300 15010
V V
Costo de capital por unidad de destilación (anual) =
1
20000 5000 2000 50010
Q Q
El consumo de materia prima por minuto se obtiene a partir del modelo matemático del sistema.
Consumo de materia prima por minuto = 0 1A A AQC QC k C V
Función objetivo:
810000 5.04 10 300 150 2000 500TAC Q V Q
Restricciones:
0 1A A AQC k C V QC (1)
1 A Dk C V QC (2)
50DQC (3)
Utilizando el método de la sustitución directa:
(3) en (1): 1
1
5050A
A
k C V Vk C
(2) en (3): 0
0
5050A A
A A
QC QC QC C
Sustituyendo V y Q en términos de CA en la función objetivo:
8
0 1 0
50 50 5010000 5.04 10 300 150 2000 500TA
A A A A A
CC C k C C C
202
58
0
5.25 10 75005.04002 10
0.004TA
A A A
CC C C
5 6
8
0
5.25 10 1.875 105.04002 10TA
A A A
CC C C
5 6
2 2
5.25 10 1.875 10
0.2
TA
A AA
dC
dC CC
25 2 60 5.25 10 1.875 10 0.2TA
A A
A
dCC C
dC
22 3.57 0.2
1.889 0.2
2.889 0.3778
0.1308
A A
A A
A
A
C C
C C
C
C
5095638.87
0.004 0.1307V l
50721.5
0.2 0.1307 min
lQ
652
32 3
2 1.875 102 5.25 10 1
0.2
TA
A AA
d C
dC CC
2 6 6
32 3
1.05 10 3.75 100
0.2
TA
A AA
d C
dC CC
Porcentaje de conversión:
%6.341000
0
A
AA
AC
CCx
Ejemplo 9:
203
Se convierte un reactante A en un producto B, en una batería de N reactores continuos de tanque agitado, cuyo volumen total es V ft
3. Si el caudal de
alimentación es q ft3/min y la concentración de A a la entrada es CA,0 , demuéstrese
que la producción máxima de B se obtiene cuando todos los tanques son del mismo tamaño. Puede considerarse que la reacción es de primer orden y que la batería opera isotérmicamente, además puede tomarse densidad constante para cualquier reactor. Objetivo: Maximizar la producción de B o minimizar la concentración de A a la salida del sistema Sistema para estudio: En la figura 7 se muestra el esquema de una batería de reactores.
Figura 7. Esquema de una batería de reactores Formulación del modelo matemático del sistema: De un balance de A en el reactor n, se obtiene: qC kC V qCA n A n n A n, , , 1
definiendo:
1 2 n N
q q q qCA,0 CA,1 CA,n-1 CA,N
V1 V2 Vn VN
1 2 n N
q q q qCA,0 CA,1 CA,n-1 CA,N
V1 V2 Vn VN
204
nn
n A n A n
A n
n
A n
Vq
k C C
Ck
C
1 0
1
10
1
1
, ,
, ,
Si: Ak
n
n
1
1
C 1A n n A nA C, , 1 0
La ecuación (1) es una ecuación diferencia con coeficientes variables cuya solución es:
, ,0
1
n
A n A t
t
C C A
, ,0 1 2
, ,0
1 2
....
1 1 1.... 2
1 1 1
A n A n
A n A
C C A A A
C Ck k k n
Para una batería de N reactores cuyo volumen total es constante, se tiene que:
1 1
N N
t i
t i
V
q
donde V : es el volumen total de los reactores.
Vi
N
i
n
1
n=1
N
=
De la ecuación (2) se obtiene que la concentración de salida de A, de la cascada, está dada por
205
, ,0
1 2
, ,0
1
1 1 1....
1 1 1
1
1
A N A
N
N
A N A
t t
C Ck k k
C Ck
como: 1 2 .... N
V
q
1
1
N
N t
t
V
q
Función objetivo:
1,0
, 11
1
1
11
NA
A N Ni i
i
i
CC
kVk
q
Solución:
Todas las derivadas (,A N
i
C
) deben ser iguales a cero.
1 1, A,0
,0 2 111 11
1
11
-kC1 1+
1 11 11
N NA N
A NNi ii i
iiii
C kC
k kVV k kkqq
,
1
0A NC
1,0
21 1
1
1,0
11
1
1
1
11
1
11 1
NA
N i i
i
i
NA
Ni i
i
i
kC
kVk
q
kC
kVk k
q
206
11
1
1
1
1
1
1
1 1
11
1 1
1 1
N
i
i
N
i
i
N
N
kVk
q
Vk k
q
k k
De la derivada con respecto a n se obtiene:
N nN n N n
V VV V
q q
O sea que el volumen del reactor N es igual al volumen de cualquier reactor de la batería; lo que implica que todos los reactores tienen el mismo tamaño.
4.3.2.1.2. Método de la variación restringida
En el método de la substitución directa el procedimiento está constituido por una primera etapa de substitución y una posterior de diferenciación, y el óptimo no se empieza a buscar hasta tanto no se hayan eliminado las m variables de la función objetivo. En el método de la variación restringida el orden del procedimiento se invierte. Condiciones necesarias:
La condición necesaria para la existencia de un óptimo en este método, asumiendo continuas la función objetivo, las restricciones y sus primeras derivadas, junto con la existencia de las segundas derivadas, es:
Jf X g g g
x x x xk
m
k m
( ), , , . . . .
, , . . . .
1 2
1 2
0
para k=m+1,m+2,...,n
donde:
207
Jf X g g g
x x x x
f
x
f
x
f
x
f
x
g
x
g
x
g
x
g
x
g
x
g
x
g
x
g
x
km
k m
k m
k m
m
k
m m m
m
( ), , , . . . .
, , . . . .
. . . . . .
. . . . . .
: : : :
. . . . . .
1 2
1 2
1 2
1 1
1
1
2
1
1 2
g: restricciones de igualdad n: númerode variables m: número de restricciones de igualdad La condición necesaria constituida por (n-m) ecuaciones y las m ecuaciones de igualdad conforman un sistema de n ecuaciones con n incógnitas. Condiciones suficientes:
La condición suficiente está dada por el signo de 2 f en la expansión de Taylor de
la función después de eliminar m variables.
n
mj
n
mj
n
mkkhjh
gkxjx
fjh
gjx
fXfXf
1 1 1
.....2
!2
1)*()(
En esta expresión *( )j j jh x x . La notación g se interpreta como que los xi con
i=1,2,...,m toman los valores que satisfacen las restricciones. La condición se define como: i. Para un mínimo
2
2 0
1 1
n n ff h hi jx xi m j m i j g
ii. Para un máximo
2
2 0
1 1
n n ff h hi jx xi m j m i j g
donde:
208
1.
22 2
1 1 1
m m mx x xf f fs s rx x x x x x x x xs s ri j s i j r s i jx gxg gg
2 2 2
1 1
m mx xf f fs s
x x x x x x x xs ss j i s i j i jg xx g x
2.
xp
xig
Jg g gm
x x xp xi xp xm
Jg g gm
x x xm
1 2
1 2 1 1
1 2
1 2
, ,.....,
, ,..... , , ,....,
, ,.....,
, ,.....,
En el jacobiano del numerador se reemplaza la variable xp por xi
3.
, ,.... , ,....,1 2 1 12 , ,.... , ,....,1 2 1 1,
( 1), ,.....,1 1 2
, ,.....,1 2
g g g g gl l mJx x x x xx m p p mp p l i j
dlx x g g gli j mJgx x xm
En el jacobiano del numerador se eliminan la función gl y la variable xp.
4.
2,
1 1
xm m g x pi j l sdl x x x xp s p s i jg gx
2 2 2
1
x xm g g gp pl l l
x x x x x x x xp j p i i p j i jgg x x x
para: njmnim 1 ,1
Como condición suficiente puede aplicarse también: i. Para un máximo, que
0itD ; i=1,3,5,.... (impar)
209
0itD ; i=2,4,6,.... (par)
ii. Para un mínimo, que
0itD
donde:
imximx0f......
2mximx0f
1mximx0f
:::imx2mx
0f......2mx2mx
0f1mx2mx
0f
imx1mx0f......
2mx1mx0f
1mx1mx0f
tiD
f xi x j
f
xi x jg
02
Ejercicio 8:
Minimizar 1
22
21 44 xxxy
Sujeto a: 2 12 12x x
A) Solución por el método de substitución directa:
Eliminando 12
12
2
xx
2
2 11 1 1
124 4
2
xy x x
2
1 1 12 20 144y x x
Condición necesaria:
dy
dxx1
1
14 20 0 *
1 5x
*
2 7 / 2x
210
Condición suficiente:
d y
dxx
2
1
1
2
1
0
*
d y
dx
2
1
1
24 0
X *
/
5
7 2 y* 94
B) Solución por el método de la variación restringida:
y f x x x x x ( , )1 2
21
22 14 4
1 2 2 1( , ) 2 12 0g x x x x
Condiciones necesarias: i. Tanto la función objetivo como la restricción son continuas y sus primeras y segundas derivadas existen.
ii. Jf X g
x x21
2 1
0( ),
,
n = 2, m = 1 y k =2
J
f
x
f
x
g
x
g
x
x x2
2 1
1
2
1
1
8 2 2 1 4
2 1
2 18 4 8 0x x (1)
2 12 12 0x x (2)
1 5x
2 7 / 2x
Condiciones suficientes:
211
D fx x
y
xg
12 2
02
22
i =2 y j = 2
222 21 1
2 2 21 22 2 12 2
x xy y y
x xx x xx gg g x
2 212
21 2 2 2
1
xy y
x x x xg x
2
1
1
2 4
x
yx
x
2
2
2
1
2
x
y
x
1
2
2
8
x
yx
x
2
2
2
1
8y
xx
2
1 2
0y
x x
1 1 2
2 1 1
( / )2
( / )g
x J g x
x J g x
2
1
2
20
x
xg
, pues g X
1( )
es lineal.
D x
D
1 1
2
1
2 4 0 2 2 2 0 2 8
16
( )( ) ( ) ( )( )
Como D1 0 entonces X *
/
5
7 2 es un mínimo
Ejercicio 9:
Encontrar un óptimo para f X x x( )
4 51
2
2
2
sujeto a: g X x x1 1 22 3 6 0( )
Como n=2 y m=1, la condición necesaria establece que:
Jf g
x x2
1
2 1
0,
,
J
f
x
f
x
g
x
g
x
x xx x2
2 1
1
2
1
1
2 1
2 1
10 8
3 220 24 0
Esta ecuación resuelta simultáneamente con g X1( )
se obtiene:
x
x x
2
1 2
36 28 1286
5 6 1071
/ .
/ .
212
Con n=2 y m=1, se analiza el signo de 2 f .
22
2
2 2 2
2ff
xx x
g
( )*
222 21 1
2 2 21 22 2 12 2
x xf f f
x xx x xx gg g x
2 212
21 2 2 2
1
xf f
x x x xg x
f
xx
x1
1
2
8
2
1
2
2
8f
xx
f
xx
x2
2
1
10
2
2
2
1
10f
xx
2
1 2
0f
x x
1 2 2
2 1 1
( / ) / 3
( / ) / 2g
x J g x g x
x J g x g x
)/(
)0/0()1(
1
2,2
1
11
2
2
1
2
xgJ
Jd
x
x
g
En este caso como sólo hay una restricción:
Jg g g g g
x x x x xJk k m
p p m
1 2 1 1
1 2 1 1
0 0 1, , .. . . , , . . . . ,
, , . . . . , , . . . . ,( / )
En el numerador no queda ninguna función al sacar a g1 (única restricción de
igualdad) y en el denominador tampoco queda ninguna variable al sacar la única
posible, pues m =1.
dg
x
x
x
x
x
g
x x
g
xx g g x x
1
2 22
1
2
1
2
2
1
2
2
1 2
2
2
2
2 1
2,
Como la restricción es lineal,
213
2
1
2
2
g
xx
2
1 2
2
2
2
1
0g
x x
g
xx x
d1
2 2 0,
Por lo tanto:
2
1
2
20
x
xg
Substituyendo los valores encontrados en:
2
2
2 1
28 0 8 3 2 2 0 3 2 10 28f
xx
g
( ) ( / ) ( )( / )
Con este valor 2 0f , siendo el punto entonces un mínimo.
Nota: Se recomienda aplicar el método de la variación restringida cuando el número de restricciones no es mayor que 3.
4.3.2.2. Restricciones de igualdad y desigualdad Una restricción de desigualdad es activa cuando la desigualdad es de la forma
0 .
4.3.2.2.1. Método de los multiplicadores de Lagrange
Las condiciones necesarias establecidas por el método de Lagrange para la existencia de un mínimo de una función restringida dependen de si las restricciones son de primer orden o de segundo orden. Definido el problema:
Minimizar f X( )
Sujeto a: h Xi ( )
0 , i=1,2,...,m
g Xi ( )
0 , i=m+1,...,p
Restricciones de primer orden:
214
Las restricciones son de primer orden cuando son una vez diferenciables y todos los gradientes de las restricciones activas de desigualdad y de las restricciones de
igualdad evaluadas en el óptimo ( )*X son linealmente independientes.
1. Condiciones necesarias: Si se cumple la condición de restricción de primer orden las condiciones necesarias para la existencia de un mínimo son:
i. Las funciones f X( )
, h Xi ( )
y g Xi ( )
sean una vez diferenciables.
ii. Existen multiplicadores de Lagrange, tales que:
1. h Xi ( )*
0 , i=1,2,...,m
2. g Xi ( )*
0 , i=m+1,...,p
3. U g Xi i
* *( )
0 , i=m+1,...,p
4. U i
* 0 , i=m+1,...,p
5. L X U W( , , )* * * 0
donde:
L X U W f X W h X U g XJ j
J
m
J j
J m
p
( , , ) ( ) ( ) ( )
1 1
L X U W f X W h X U g XJ j
J
m
J j
J m
p
( , , ) ( ) ( ) ( )1 1
Los valores de * * *, X U y W se obtienen resolviendo el sistema
h Xi ( )*
0 , i=1,2,....,m
U g Xi i
* *( )
0 , i=m+1,....,p
L X U W( , , )* * * 0 , n: ecuaciones
2. Condiciones suficientes:
i. Las funciones f X( )
, h Xi ( )
y g Xi ( )
sean dos veces diferenciables.
ii. Para todo vector 0V , el cual:
V g Xt
J ( )* 0 Para todas las restricciones de desigualdad activas.
*( ) 0t
JV g X Para todas las restricciones de desigualdad no activas
215
V h Xt
J ( )* 0 J=1,...,m
Se cumple que:
2 * * *( , , ) 0tV L X U W V
donde 2 L X U W( , , )* * * es la matriz hessiana.
Restricciones de segundo orden: Las restricciones son de segundo orden cuando son dos veces diferenciables y los gradientes de las restricciones de desigualdad activas y los gradientes de las
restricciones de igualdad, evaluadas en X * son linealmente independientes.
1. Condiciones necesarias:
Las condiciones necesarias para que haya un mínimo cuando las restricciones son de segundo orden son:
i. Las funciones f X( )
, h Xi ( )
y g Xi ( )
sean dos veces diferenciables.
ii. Existen multiplicadores de Lagrange, tales que:
1. h Xi ( )*
0 , i=1,2,...,m
2. g Xi ( )*
0 , i=m+1,...,p
3. U g Xi i
* *( )
0 , i=m+1,...,p
4. U i
* 0 , i=m+1,...,p
5. L X U W( , , )* * * 0
iii. Para todo vector
V diferente de cero, el cual:
V g Xt
J ( )* 0 Para todas las restricciones de desigualdad activas.
y,
V h Xt
J ( )* 0 J=1,...,m
Se cumple que:
2 * * *( , , ) 0tV L X U W V
donde 2 L X U W( , , )* * * es la matriz hessiana.
2. Condiciones suficientes:
216
También se aplican las mismas condiciones que se usan cuando las restricciones son calificadas como restricciones de primer orden.
Una condición suficiente alternativa para que en X * haya un mínimo (válido para
restricciones de primer y segundo orden) es que f X( )
, g XJ ( )
y h XJ ( )
sean dos
veces diferenciables y el determinante de la matriz Jacobiana de las funciones
h XJ ( )
, ( )J JU g X y las definidas por L X U W( , , ) 0 sea diferente de cero
evaluado en X * .
La matriz Jacobiana está definida como:
1
, ,..., ,..., , ,...,1 2 1 1
, ,..., , , ,..., , , ,...,1 2 1 2 1 2
L Lh h U g U gm m p p x xnJ
x x x U U U W W Wn m m p m
1 1 1 1 1 1 ... ... ... ...
1 2 1 1
1 1 1 1 ...
1
2 2 2 ... .
1 2 1
h h h h h h
x x U U W Wm p m
U g U gm m m m
x Wm
L L L
x x x x x Un n n m
2..
L
x Wn m
Ejercicio 10:
Minimice f X x x
1
2
2
Sujeto a:
2 2
1 1 2
2 1 2
9 0
1 0
g X x x
g X x x
Al analizar las funciones g X1
y g X2
se observa que son dos veces
diferenciables. Como solo hay una restricción activa y ninguna restricción de igualdad, entonces se cumplen las condiciones para calificar las restricciones como de segundo orden.
217
La función f X
es también dos veces diferenciable, entonces:
1. * * *2 *2
1 1 1 1 2 9 0U g X U x x
2. * * * *
2 2 2 1 2 1 0U g X U x x
Como:
2 2 2
1 2 1 1 2 2 1 2
1 2
1 1 1
1 2
1 2
2 2 2
, , 9 1
, ,
L X U W x x U x x U x x
g gf
x x xL X U W U U
f g g
x x x
1
1 2
1 11 2
1 2
2 2
1 2
2 1
2 2
1 1
f fx
x x
g gx x
x x
g g
x x
**1* *1
1 2*
2
*, *, * 0
2 120
11 2
L X U W
xxU U
x
3. * * * *
1 1 1 22 2 0x U x U
4. * * *
1 2 21 2 0U x U
Hay varias soluciones para este sistema de ecuaciones, sin embargo la única que
satisface U i
* 0 es:
X U
tt
* , * ,
0 3
1
60
Esta solución puede obtenerse mediante el siguiente procedimiento:
Si *
2 0U , de (3) se obtiene * *
1 12 1 0x U . Lo cual implicaría que *
1 1U ó
*
1 0x . El valor *
1 1U viola la condición * 0iU , entonces *
1 0x . De (1),
2 2
* *
1 2 9x x , con *
1 0x , se obtiene *
2 3x . El valor de *
2 3x no satisface
218
g X2 ( )
, por lo tanto X
t* , 0 3 . Los valores de U * son entonces U2 0* y
*
1 1/ 6U que se obtiene de (4).
Este sistema de ecuaciones no lineales también se resolvió por métodos numéricos, usando el programa Polymath, arrojando los siguientes resultados: (i)
x1 = 0, x2 = -3, U1 = 0.167, U2 = 0, (ii) x1 = 0, x2 = 3, U1 = -0.1667, U2 = 0, (iii) x1 =
0.5, x2 = 0.5, U1 =0, U2 = -1 y (iv) x1 =-1.56, x2 = 2.56, U1 = -0.5 y U2 = 1.56
La otra condición necesaria se chequea con un
V v vt 1 2, , tal que:
V g Xt
J ( )* 0
Como solo 1( )g X es activa en *0
3X
, entonces
v vx
x1 2
1
2
2
20,
v v1 2
0
60,
0 6 01 2v v v2 0
Vv
1
0
V L X U W Vt 2 0( , , )* * *
2 2
2
1 1 22
2 2
2
2 1 2
( , , )
L L
x x xL X U W
L L
x x x
2
1
2 12 1L
xU ( )
2
1 2
0L
x x
2
2 1
0L
x x
2
2
2 12L
xU
*
12
*
1
2 1 0, ,
0 2
UL X U W
U
219
Reemplazando * 1
6U
2
14 06
, ,20
6
L X U W
2
1 11
14 06
,0 14 02 0 60
6
v vv
El valor 2
1
14
6v es mayor a cero independientemente del valor que tome v1 , por lo
tanto se cumplen las condiciones necesarias para que las restricciones sean
calificadas como de segundo orden. También se cumple que 2
114 06
v la condición
suficiente para un mínimo. Puede verificarse la condición suficiente alterna. Para evaluar esta condición se
obtiene primero la matriz Jacobiana con respecto a X U, y
W de las funciones:
1 1 1 1
1 2
1 1 2 2
1 2
1 2 1 2
2
2 2
. .
, , ,. . . .
.. . . ., , ,
. . .
U g U g
x UL LU g U g
x xJ
x x U U
L
x U
U g X U x x1 1 1 1
2
2
2 9( ) ( )
U g X U x x2 2 2 1 2 1( ) ( )
L
xx U x U
1
1 1 1 22 2
L
xU x U
2
1 2 21 2
U g
xU x1 1
1
1 12
U g
xU x1 1
2
1 22
U g
Ux x1 1
1
1
2
2
2 9 ( )
U g
U
1 1
2
0
U g
xU2 2
1
2
U g
xU2 2
2
2
220
U g
U
2 2
1
0
U g
Ux x2 2
2
1 2 1
2
1
2 12 1L
xU ( )
2
1 2
0L
x x
2
1 1
12L
x Ux
2
1 2
1L
x U
2
2 1
0L
x x
2
2
2 12L
xU
2
2 1
22L
x Ux
2
2 2
1L
x U
2
1
1 1
2L
xx U
2
1 2
1L
x U
La matriz Jacobiana evaluada en X
t* , 0 3 y
Ut* / , 1 6 0 se obtiene:
0 1 0 0
0 0 0 4
14 / 6 0 0 1
0 1/ 3 6 1
Resolviendo el determinante por la primera fila
3 4
0 0 414 / 6 0
( 1) 1 14 / 6 0 1 4( 1) 4(14 / 6)( 6) 560 6
0 6 1
Como el valor es diferente de cero, entonces el punto X
t* , 0 3 es un mínimo
* 3f X
Ejemplo 10: El hidrocarburo que se alimenta a un proceso petroquímico se calienta y se mezcla con el reciclo del material que no reaccionó, antes de pasarlo por un reactor catalítico. El producto del proceso y el material que no reaccionó se separan por destilación, y el reciclo se comprime antes de mezclarlo con el alimento del proceso.
221
Determine la temperatura T y la razón de reciclo R (Flujo de reciclo/flujo del alimento fresco) óptimas, que minimizan los costos diarios de operación, para un flujo de alimentación al proceso de 5000 bbl/día, si la razón entre la temperatura y la razón de reciclo debe ser igual a 5000ºF. El costo de operación del horno que calienta el alimento fresco es $0.5 por barril y por cada 50ºF de calentamiento por encima de la temperatura del alimento. El costo de operación del reactor es 5(R+R
2)-1
$/bbl de alimento al reactor diario. El producto se separa por destilación a un costo de 0.5 $/bbl de alimento a la unidad de destilación, y el costo de recirculación es 0.15 $/bbl de recirculado. La temperatura del alimento es 70 ºF. F: Rata de alimentación = 5000 bbl/día
OT OH OR OD OCC C C C C
700.5 50 3500
50OH
TC F T
4
12 5 2.5 10
5 1OR
FC R R F R
R R
0.5 1 2500 1ODC F R R
0.15 750OCC RF R
42.5 10
50 3500 2500 1 750OTC T R RR
Función objetivo:
42.5 1050 3250 1000OTC T R
R
(1)
Restricción:
5000T R (2)
Utilizando el método de la variación restringida: Condiciones necesarias: La función y la restricción son dos veces diferenciables, por lo tanto las condiciones necesarias para restricciones de segundo orden son: Las condiciones necesarias cuando las restricciones son de segundo orden son:
i. Las función ( , )OTC f T R y la restricción de igualdad ( , ) 5000 0h T R T R son
dos veces diferenciables. ii. Existen multiplicadores de Lagrange, tales que:
222
1. * *, 5000 0h T R T R (1)
2. , , 0L T R W
como 42.5 10
, , 50 3250 1000 5000L T R W T R W T RR
y 4
2
50
, , 02.5 103250 5000
LW
TL T R W
L WR
R
y *50 0W (2)
4
*
*2
2.5 103250 5000 0W
R
(3)
Resolviendo simultáneamente estas tres ecuaciones se tiene:
* 0.314R * 1570ºT F * 50W
iii. Para todo vector
V diferente de cero, el cual: * *, 0tV h T R , se cumple que:
2 * * *( , , ) 0tV L T R W V
como *
* *
*
1,
5000
h
Th T R
h
R
* *
1 2
1, 0
5000
tV h T R v v
1 25000 0v v
Lo que implica que existen muchos vectores [v1 v2] diferentes de cero que
satisfacen esta condición.
Para la función 42.5 10
, , 50 3250 1000 5000L T R W T R W T RR
se tiene
que:
223
2 2 4 2 2
2 2 3
5 100 0 0
L L L L
T R R T R R T
y
2 2
22
2 2
2
( , , )
L L
T T RL T R W
L L
R T R
2 * * *
6
0 0( , , )
0 1.615 10L T R W
Condición suficiente:
, , 2 2 2
2, ,
2 2 2
2
h h h
T R WL L
hL L LT RJ
T R W T R T WT
L L L
R T R WR
1 5000 0 45 10 6 0 0 1 1 5000 0 0 0 1.615 10 03
0.31445 100 5000
30.314
como este valor de la jacobiana es diferente de cero, entonces, en * 0.314R y * 1570ºT F hay un mínimo. Los costos mínimos diarios son: 158 138 $
4.3.2.2.2. Método de los multiplicadores de Lagrange y variables de holgura
En este método las restricciones de desigualdad son transformadas en restricciones de igualdad, introduciendo una variable de ajuste apropiada por cada restricción. Con esta transformación el problema de optimización se convierte en:
Minimizar o maximizar f X( )
224
Sujeto a: h Xi ( )
0 i=1,...,m
g X vi i( ) 2 0 i=m+1,...,p
donde vi son las variables de holgura.
La función de Lagrange queda definida entonces como:
p X W f X w h X w g X vi i i i i
i m
p
i
m
( , ) ( ) ( ) ( ( ) )
2
11
donde w i pi 0 1, , para minimizar
w i pi 0 1, , para maximizar
Las condiciones necesarias para minimizar se establecen como:
0 1,...,
0 1,...,
2 0 1,...,
0 1,...,
i
i
i i
i
i
p Xi n
x
p Xi p
w
p Xw v i m p
v
w i p
Notas: El método de multiplicadores de Lagrange puede fallar en problemas no
convexos en minimización o no cóncavos en maximización3.
Cuando solo existen restricciones de desigualdad, en el método de multiplicadores de Lagrange puede utilizarse como condición suficiente la establecida para funciones no-restringidas, si el punto extremo es un punto interior
4.
En el caso en que solo existan restricciones de desigualdad y se haya utilizado el método de Lagrange con variables de holgura, puede utilizarse como condición suficiente la definida en el método de la variación restringida.
Ejercicio 11:
Halle el mínimo de la función: 2 2
1 24 5 5 4y x x , restringido a que 1 2 1x x
3 Un conjunto es convexo si para todo
X1 y
X2 en el conjunto, el segmento que los une está en
el conjunto 4 Un punto interior en la región factible, es un punto que cae dentro de ella y no en su frontera.
Estos puntos se dan cuando las restricciones son satisfechas sin el signo igual.
225
1 2
2
1 0
0i
g X x x
g X
Función de Lagrange:
1
,m
i i
i
P X W f X w h X
2
1
m
i i i
i
w g X
2,P X W f X w g X
2 2 2
1 2 1 2, 4 5 5 4 1P X W x x w x x
1 1
1
8 5 0 8 5P
x w w xx
(1)
2
2
10 4 0P
x wx
(2)
2
1 2 1 0P
x xw
(3)
2 0P
w
(4)
Si w = 0 de (1), (2) y (3): 1 25 4 5 4 1 8x x
Si = 0 de (3): 1 2 1 21 1x x x x (5)
Reemplazando (5) en (1): 2 28 1 5 8 4w x x (6)
De (2): 210 4w x (7)
Igualando (6) y (7): 2 1 2
4 5 1
9 9x x x
El mínimo de la función es y = 0, para x1 = 5 y x2 = 4.
4.3.3. Métodos numéricos de funciones no restringidas
4.3.3.1. Método del poliedro flexible El método consiste en comparar en cada etapa de aproximación los valores de la función objetivo en los vértices de un poliedro flexible, y eliminar del poliedro aquel vértice donde la función es mayor si se está minimizando, o donde es menor si se está maximizando, y remplazarlo por un vértice nuevo localizado en una nueva posición, la cual se define con el resultado de una de tres operaciones que se realizan sobre el poliedro: expansión, contracción o reducción.
226
Un poliedro puede ser definido mediante un conjunto de vectores, en el cual cada vector representa la posición de un vértice; así, las coordenadas de los vértices de un poliedro convexo regular pueden definirse por una matriz D, en la cual las
columnas representan los vértices 1V ,
2V ,3V ,...,
nV y las filas representan las
coordenadas de los vértices ( , ,....., )x x xn1 2 .
Antes de iniciar el algoritmo se define un poliedro con n filas, numero de variables de decisión en el problema de optimización y n+1 filas, número de vértices del poliedro. Si el primer vértice de este poliedro inicial se ubica en el origen, la matriz que define el poliedro convexo regular es:
D
d d d
d d d
d d d
d d d
0
0
0
0
1 2 2
2 1 2
2 2 2
2 2 1
donde:
112
112
2
1
nn
td
nnn
td
D: matriz de n filas y (n+1) columnas
t: distancia entre dos vértices contiguos
n: número de coordenadas
Si el primer vértice se ubica en otro punto diferente al origen, las coordenadas de cada uno de los vértices estará incrementada en la correspondiente coordenada de este primer vértice. Algoritmo
Para minimización, los cálculos requeridos en la etapa k son (en la figura 8 se
muestra un esquema del procedimiento): 1. Ubicación en el poliedro del valor mínimo y valor máximo de la función. En cada etapa de aproximación se debe conocer en que vértice del poliedro se localizan el mínimo y el máximo de la función objetivo. Si en la etapa k:
227
k
ni
k
i
k
i
k
i x,...,x,xX 21
son las coordenadas del vértice i, con i=1,2,....,n+1; el
valor mínimo y el valor máximo de la función objetivo, que se identificarán con los
vectores k
a
k
b XyX
respectivamente, se obtienen como:
k
n
kkk
b
k
n
kkk
a
Xf,...,Xf,XfminXf
Xf,...,Xf,XfmaxXf
121
121
2. Cálculo de las coordenadas del centroide.
El centroide2nX
se obtiene como el centroide de todos los vértices del
poliedro, excluyendo el vértice donde se localiza el valor máximo de la función, y se calcula como:
j,
k
a
n
ij,
k
ij,n xxn
x1
12
1; j: designa cada coordenada, j=1,2,...n.
3. Reflexión de k
aX
a través del centroide.
k
a
k
n
k
n
k
n XXXX
223
donde es el coeficiente de reflexión, mayor que cero, pero se recomienda
=1.
Se calcula 3
k
nf X y dependiendo del valor que tome la función para 3
k
nX ,
comparado con el de los demás puntos del poliedro, debe hacerse una de las tres operaciones: expansión, contracción o reducción 4. Expansión.
Si k
b
k
n XfXf
3, se obtiene k
n
k
n
k
n
k
n XXXX 2324
donde 1 ( es el coeficientes de expansión) y se recomienda
0382 .. .
Se calcula 4
k
nf X y se compara con k
bf X
228
4.1. Si k
b
k
n XfXf
4, se reemplaza el vértice done se encuentra el
máximo de la función,k
aX
, por k
nX 4
y se pasa a la etapa k+1.
4.2. Si k
b
k
n XfXf
4, se reemplaza el vértice donde se encuentra el
máximo de la función,k
aX
, por k
nX 3
y se pasa a la etapa k+1.
5. Contracción.
Si 3
k k k
b n af X f X X se hace una contracción obteniendo:
)XX(XX n
k
a
k
n
k
n 225
donde es el coeficiente de contracción, 0< <1, para el cual se recomienda
6040 .. .
Se calcula 5
k
nf X y se compara con k
af X
5.1. Si 5
k k
n af X f X , se reemplaza el vértice donde se encuentra el
máximo de la función,k
aX
, por k
nX 5
y se pasa a la etapa k+1.
5.2. Si 5
k k
n af X f X , se hace reducción con la siguiente fórmula:
1 0.5 , 1, , 1k k k k
i b i bX X X X i n y se pasa a la etapa
k 1. 6. Reducción.
Si k
a
k
n XfXf
3, se reducen todos los vectores del poliedro,
redefiniendo los vértices como :
1 0.5 , 1, , 1k k k k
i b i bX X X X i n y se pasa a la etapa k 1.
229
Antes de proseguir a la etapa 1k , se analiza la convergencia con:
1
1 2 2
2
1
1
1
nk k
i n
i
f X f Xn
Figura 8. Esquema del procedimiento del proliedro flexible
230
Figura 9. Representación gráfica del método del poliedro flexible en dos dimensiones Ejercicio 12:
Halle el mínimo de la función 2 2
1 22 3y x x , por el método del poliedro
flexible.
Tabla 18. Iteraciones para la búsqueda del mínimo del ejercicio 12
k i x1 x2
Convergencia
1 1 2.000 1.000 4.000
2 2.483 1.129 3.732
3 2.129 1.483 2.318
4 2.306 1.306
5 2.612 1.612 2.301 0.833
6 3.225 2.225 2.101 Expansión
2 1 3.225 2.225 2.101
2 2.483 1.129 3.732
3 2.129 1.483 2.318
4 2.677 1.854
5 2.871 2.578 0.937 1.190
6 3.259 4.027 2.641 Expansión
3 1 3.225 2.225 2.101
Disminuye f(X)
Contornos de f(X)
x2
x1
Disminuye f(X)
Contornos de f(X)
x2
x1
kf X
231
2 2.871 2.578 0.937
3 2.129 1.483 2.318
4 3.048 2.402 0.690
5 3.967 3.320 3.970 Reducción
4 1 3.048 2.402 1.456
2 2.871 2.578 0.937
3 2.500 2.031 1.190
4 2.960 2.490
5 2.694 2.755 0.542 2.321
6 2.164 3.285 0.108 Expansión
19 1 1.992 2.998 6,2E-05
2 2.001 3.004 1,37E-05
3 1.995 2.995 4,79E-05
4 1.998 2.999 4.23039E-05
5 2.004 3.001 1,48E-05 Reducción
Se partirá del valor inicial x1 = 2 y x2 =1. En este caso n = 2 y se tomará t = 0.5,
=1, = 0.5 y =3. d1 y d2 se calculan con las fórmulas:
1
2
1 1 0.48302
1 1 0.12942
td n n
n
td n
n
Los datos de las primeras cuatro iteraciones y de la última teniendo en cuenta una
convergencia de 4x10-5
se muestran en la tabla 18.
El mínimo está en x1 = 1.998 y x2 = 2.999.
4.3.3.2. Método del gradiente
Este método utiliza el gradiente en la etapa k para la transición desde el punto X k
a otro punto X k 1 , mediante la siguiente expresión:
kkkkkk SXXXX
1
donde: S k : vector unitario en la dirección del gradiente en
X k .
k : escalar que define la magnitud del desplazamiento desde X k en la dirección
del gradiente o en la dirección contraria. Si se toma el signo (+) el
232
desplazamiento se hace hacia donde crece la función y si se toma (-) hacia donde decrece.
puede escogerse como una cantidad variable o como una constante. También
puede ajustarse en cada etapa de tal manera que la función se minimice o maximice, dependiendo del propósito, en cada etapa.
ˆk
k
k
f XS
f X
1 2 k
k
n X
f f ff X
x x x
22
1
...k
n
f ff X
x x
El valor de variable se obtiene en cada etapa a partir de una expansión en Taylor
de la función objetivo.
kkktkkkkktkk XXXHXXXXXfXfXf
1111
2
1
H: Matriz Hessiana
Si X X Sk k k k 1
ˆ
0
ˆ ˆ ˆ 0
ˆ
ˆ ˆ
k k k
k
Tt k k k k k
t k k
k
Tk k
f X S
f X S S H S
f X S
S HS
En algunos textos se sugiere utilizar un constante. Con este, si se pretende
buscar un mínimo, los siguientes son los cálculos en la etapa k .
1. Si f X S f Xk k k
, entonces se toma X k como el óptimo, con :
exactitud de la medida para el óptimo.
1. Se calcula kk SXf ˆ
, se compara con kXf
y se elige una de las dos
siguientes opciones:
2.1. Si f X S f Xk k k
:
233
Se evalúa f X Sk k
2 y se compara con f X Sk k
; si continua menor se
mantiene la misma dirección hasta obtener un punto X Sk m k 2 tal que:
kmkkmkkmk SXfSXfSXf 11 222
y se continúa en la etapa k+1, partiendo de X Sk m k 2 .
2.2. Si f X S f Xk k k
:
Se evalúa f XSk
k
2 y se compara con kXf
, si continúa mayor, se
sigue disminuyendo el desplazamiento hasta que:
f X S f Xk
m
k k
2 y se continúa en la etapa k+1 en el punto
X Sk
m
k
2 .
Ejercicio 13:
Halle el mínimo de la función 2 2
1 225y x x , por el método del gradiente.
Se partirá del valor inicial x1 = 2 y x2 =2. Se tomará = 1 y = 0.05
1 2 k
k
n X
f f ff X
x x x
1 22 50k
f X x x '
1 1
1
2y
y xx
'
2 2
2
50y
y xx
2 2
1 22 50k
f X x x M
ˆk
k
k
f XS
f X
'
11
ys
M
'
22
ys
M
En la tabla 19 se muestran los resultados de las iteraciones.
Tabla 19. Iteraciones para la búsqueda del mínimo del ejercicio 13
Desplaz. k x1 x2 y1’ y2’ M s1 s2 y
0 2 2 4 100 100.08 0.040 0.999 104
234
1.998 1.950 99.058
1.960 1.001 28.882
2 1.920 0.002 3.687
4 1.840 -1.997
103.06
7
1 1.923 0.001 3.846 0.0739 3.847 1.000 0.019 3.698
1.873 0.001 3.509
0.923 -0.018 0.860
2 -0.076 -0.037 0.040
4 -2.076 -0.075 4.452
2 -0.076 -0.038 -0.153 -1.9234 1.930 -0.079 -0.997 0.043
-0.073 0.011 0.008
0.003 0.958 22.963
/2 -0.037 0.460 5.290
/4 -0.057 0.211 1.114
/8 -0.067 0.086 0.190
/16 -0.072 0.024 0.019
3 -0.072 0.024 -0.143 1.1925 1.201 -0.119 0.993 0.019
-0.066 -0.026 0.021
El mínimo se localiza en x1 = -0.066 y x2 = -0.026.
4.3.3.3. Método de las tangentes paralelas Este método conocido como el método PARTAN, utiliza dos tangentes paralelas a contornos de la función y en la línea que une los puntos de tangencia investiga el óptimo de la función. Existen algunas modificaciones de este método, entre ellos uno denominado PARTAN CONTINUADO. Las etapas para la búsqueda de un mínimo por el método PARTAN son:
1. Dada una primera aproximaciónX ( )0 , determinar la dirección del negativo del
gradiente en X ( )0 .
T
Xnx
f
x
f
x
fXf
021
0
2. Localizar (1)X en el mínimo de f X a lo largo del negativo del gradiente desde X ( )0 .
1 0 0X X n S n = 1, 2, ...
235
0
00
Xf
XfS
Se obtienen aproximaciones de (1)X iniciando con n = 1, hasta un n+1 en
donde el valor de la función objetivo cambie la tendencia de decreciente a creciente.
es un escalar que determina el tamaño del desplazamiento para la búsqueda del mínimo en la dirección del negativo del gradiente.
3. Determinar la dirección del negativo del gradiente desde (1)X .
1
1
1 2
T
n X
f f ff X
x x x
4. Localizar (2)X en el mínimo de f X a lo largo del negativo del gradiente
desde (1)X . 2 1 1
X X n S n = 1, 2, ...
1
1
1
ˆf X
Sf X
Se obtienen aproximaciones de (2)X iniciando con n=1, hasta un n+1 en donde
el valor de la función objetivo cambie la tendencia de decreciente a creciente.
5. Conectar X ( )0 y (2)X con una línea recta y localizar el mínimo de f X( )
a lo
largo de esta línea y denotarlo con (3)X .
3 0 0ˆX X nU
2 00
2 0
ˆ X XU
X X
Se usa el signo + ó - dependiendo de la dirección hacia donde decrezca la función objetivo. Esta dirección se identifica realizando un cálculo inicial para el valor de n = 1.
236
6. Establezca X(3)
como un nuevo punto de arranque y repita el procedimiento
desde la etapa 1, hasta obtener una convergencia deseada, la cual se define
como 1k kX X , siendo e un escalar mayor que cero.
Ejemplo 11: Resuelva el ejemplo 7, por el método de las tangentes paralelas. Función objetivo:
6
2 2
1 10 54 10
xf X
xy x y y
xy
yxyxyxx
Xf
2232
6 5201104
yy
xyyxxyy
Xf
3222
6 10101104
M
y
Xf
x
XfXf
22
)(
M
ys
M
ys
Xf
XfS
yx
21 ,ˆ
Siguiendo el procedimiento descrito para el PARTAN, tomando un = 0,1, = 0.05 y tomando como valores iniciales x = 29 y y = 14, se calcularon los datos
que aparecen en la tabla 20.
Tabla 20. Iteraciones para la búsqueda del mínimo del ejemplo 11.
Etapa X(k)
n x y
-yx o
x(2)
-x(0)
-yy o
y(2)
-y(0)
M s1 o u1 s2 o u2 f
0 X(0)
29 14 15,89 41,600 44,53 0,357 0,934 -
T
(k)
(k)X
y
f
x
fXf
237
9 4 2936,3
1 29,036 14,093
-
2940,5
2 29,071 14,187
-
2944,3
3 29,107 14,280
-
2947,7
4 29,143 14,374
-
2950,7
5 29,178 14,467
-
2953,3
6 29,214 14,560
-
2955,6
7 29,250 14,654
-
2957,5
8 29,286 14,747
-
2959,0
9 29,321 14,841
-
2960,3
10 29,357 14,934
-
2961,2
11 29,393 15,028
-
2961,8
12 29,428 15,121
-
2962,1
X(1)
13 29,464 15,214
-
2962,2
14 29,500 15,308
-
2961,9
29,464 15,214 2,250 -1,952 2,979 0,755 -0,655
-
2962,2
1 29,540 15,149
-
2962,4
2 29,615 15,083
-
2962,6
3 29,691 15,018
-
2962,7
X(2)
4 29,766 14,952
-
2962,7
5 29,842 14,887
-
2962,6
X(3)
1 29,627 14,779 0,766 0,952 1,222 0,627 0,779
-
2961,3
-1 28,373 13,221
-
2872,3
2 30,254 15,558
-
2958,1
1 X(0
) 29,627 14,779 4,125 8,754 9,678 0,426 0,905
-
2961,3
1 29,670 14,870
-
2962,1
2 29,712 14,960
-
2962,6
238
3 29,755 15,050
-
2962,8
X(1)
4 29,797 15,141
-
2962,8
5 29,840 15,231
-
2962,4
29,797 15,141 0,425 -2,306 2,345 0,181 -0,983
-
2962,8
X(2)
1 29,816 15,043
-
2962,9
2 29,834 14,944
-
2962,8
X(3)
1 30,209 15,592 0,189 0,264 0,324 0,582 0,813
-
2957,8
-1 29,045 13,966
-
2935,5
2 30,791 16,405
-
2933,5
2 X(0)
30,209 15,592 -4,856 -15,047
15,81
1 -0,307 -0,952
-
2957,8
1 30,178 15,497
-
2959,3
2 30,148 15,402
-
2960,5
3 30,117 15,307
-
2961,5
4 30,086 15,212
-
2962,2
5 30,055 15,116
-
2962,7
X(1)
6 30,025 15,021
-
2963,0
7 29,994 14,926
-
2962,9
30,025 15,021 -0,301 -0,718 0,778 -0,387 -0,922
-
2963,0
X(2)
1 29,986 14,929
-
2962,9
X(3)
1 30,025 15,021 -0,184 -0,571 0,600 -0,307 -0,952
-
2963,0
-1 30,516 15,973
-
2948,3
2 29,595 13,118
-
2894,7
Los valores de precios de venta de A y B para obtener el máximo beneficio, son respectivamente:
$/día 1515,021y
$/día 30 025,30
x
239
Otros métodos de optimización numérica de funciones multivariables son:
4.3.3.4. Método de Newton
La ecuación algorítmica para este método es: )()(1
1 kkkk XfXHXX
. para
encontrar un mínimo, y para un máximo: )()(1
1 kkkk XfXHXX
,
donde H Xk
1( )
es la matriz inversa de la hessiana evaluada en el punto X k .
4.3.3.5. Método de Davidon-Fletcher-Powell Este método está basado en la lógica de las direcciones conjugadas. En los métodos que utilizan esta lógica, las aproximaciones sucesivas no se obtienen siguiendo las direcciones del gradiente en cada punto, sino las llamadas direcciones conjugadas.
X X Si i
i
n
0
0
1
donde en cada etapa Si es un vector unitario s s sn
T
1 2, ,...., que hace parte del
conjunto llamado de direcciones conjugadas de la matriz H, los cuales cumplen la condición: S HSi
T
j 0 i j , j=0,1,....n-1. con 0i jS y S .
Un procedimiento general que utilice las direcciones conjugadas arranca
generando X1 y a partir de este sigue generando
X X2 3, , hasta obtener
X en n
iteraciones.
El valor de X1 lo obtendría
X X S1 0 0 0
donde 0 se obtiene optimizando
g f X S( ) ( ) 0 0 0 0
o sea:
000
0
000SXHS
SXXHb
T
T
El vector S0 inicial puede ser cualquier vector unitario.
240
Una vez obtenido X X1 2, se obtiene como:
X X S2 1 1 1
El vector S1 se obtiene de la propiedad de conjugado:
S HS1 0 0
y de que S1 sea un vector unitario
S HST
1 1 0
El valor del desplazamiento 1 se calcula con la ecuación
11
111
SHS
SXHb
T
T
Siguiendo esa secuencia, cualquier aproximación se puede obtener
k
T
k
kT
kk
k
T
k
kk
kkkk
SHS
SXHb
SS
SHS
SXX
0
01
1
El algoritmo para el método de Davidon-Fletcher-Powell consiste en obtener una aproximación con la ecuación: X Xk k k 1
donde k k k kS X
donde la dirección Sk se obtiene como:
S D f Xk k k
Dk: aproximación de 1
kH X
k se calcula con la minimización de:
g f X Sk k k k
241
si se está buscando un mínimo, o maximizando, si se está buscando un máximo. La matriz Dk se actualiza en cada etapa con la ecuación:
D D A Bk k k k 1
donde:
1
T
k kk T
k k
k k k
T T
k k k k
k T
k k k
A
f X f X
D DB
D
Para la primera iteración puede tomarse D0 como la matriz identidad; realmente lo
que se requiere es que esta matriz sea simétrica y positiva definida. Este método es mucho más efectivo, tiene una mayor convergencia, que los métodos que utilizan únicamente la dirección del gradiente. Para medir esta efectividad existe la función de Rosembrok
f X x x x
100 12 1
22
1
2
que tiene contornos marcadamente excéntricos y que hace que los métodos basados puramente en el gradiente presenten una convergencia lenta.
4.3.3.6. Método de Fletcher-Reeves Este método también está basado en las direcciones conjugadas, pero no tiene la misma eficiencia del método anterior, pero si lo es más que los métodos de ascenso-descenso acelerado y de Newton. El método obtiene una aproximación a partir de la ecuación algorítmica X X Sk k k 1
donde k se obtiene de la optimización de:
g f X sk k k k( ) ( )
.
El vector
sk se obtiene para una nueva etapa con:
242
s f X sk k k k 1 1( ) .
k
T
k k
T
k k
f X f X
f X f X
( ). ( )
( ). ( )
1 1
El algoritmo arranca escogiendo como dirección inicial: s f X0 0 ( ) .
4.3.4. Métodos numéricos de optimización de funciones restringidas La mayoría de los métodos de optimización de problemas no lineales restringidos se apoyan en uno de los siguientes conceptos básicos. i. Extensión de la metodología de programación lineal por medio de
aproximaciones sucesivas a un problema lineal. ii. Transformación de la función objetivo mediante el uso de funciones de
penalización. iii. Uso de tolerancias factibles para acomodar las aproximaciones a la región
factible. En los problemas de optimización sin restricciones no era necesario iniciar la búsqueda del óptimo a partir de un punto factible, mientras que en la mayoría de los métodos numéricos para problemas con restricciones se requiere la búsqueda inicial de un punto factible para comenzar con el problema de optimización. La búsqueda de un óptimo restringido puede hacerse, en principio, mediante las técnicas para problemas no-restringidos, con una rutina adicional que chequee y asegure en cada aproximación que se está en la región factible. El movimiento desde un punto a una nueva localización puede conducir a una región no factible, requiriéndose de un retorno a la región factible, el cuál puede hacerse con información únicamente de la función objetivo y de las restricciones en métodos directos, o con evaluación del valor del gradiente local cuando se utilizan métodos del gradiente. Los métodos que utilizan aproximación del problema a un problema lineal en cada etapa, utilizan la expansión en Taylor para la aproximación.
El problema : optimizar f X( )
Sujeto a: h Xi ( )
0 , i=1,2,...m
g Xi ( )
0 , i=m+1,.....,p
Se transforma a:
Optimizar ))(()( kktk XXXfXf
243
Sujeto a: 0))(()( kk
i
tk
i XXXhXh
, i=1,...,n.
0))(()( kk
i
tk
i XXXgXg
, i=m+1,...,p.
Entre estos métodos se tienen: MAP: Método de aproximación programación. POP:Programa para el proceso de optimización. NLP: Método de programación no lineal. La solución del problema lineal se resuelve mediante el método simplex revisado o un algoritmo modificado de este método. El método simplex es un proceso iterativo en el cuál el procedimiento de búsqueda comienza en un punto que satisface las restricciones, y en cada ciclo se obtiene un punto que mejora el valor de la función objetivo. En este método, los puntos que se prueban son puntos localizados en los vértices de la región factible. Los métodos que usan tolerancias factibles, mejoran el valor de la función objetivo usando puntos factibles y puntos llamados casi-factibles. La tolerancia para clasificar estos puntos casi-factibles se hace más restrictiva a través de la solución del problema hasta un límite determinado. En estos métodos, el problema de optimización se transforma a:
Optimizar: f X( )
Sujeto a: ( ) ( )k T X
0 .
donde ( )k es el valor de la tolerancia flexible para el criterio de factibilidad en la
etapa k.
definiendo la función T X h X u g Xi i i
i m
p
i
m
( ) ( ) ( )
2 2
11
1 2
donde ui es el operador Heaviside tal que ui = 0 para g Xi ( )
0 , ui =1 para
g Xi ( )
0 .
Los métodos del gradientes son métodos que utilizan información sobre el gradiente de la función objetivo en cada etapa para obtener la próxima aproximación del óptimo.
4.4. Ejercicios propuestos 1. Se desea instalar un evaporador de múltiple efecto para manejar un alimento de
100.000 lb/h de una solución salina del 5% en peso. Si se va a concentrar la
244
solución hasta el 20%, determine el número de efectos que deberían usarse para conseguir los costos anuales más bajos. El costo de inversión del evaporador debe ser tomado como US$50.000 para cada efecto instalado, junto con un valor adicional de US$15.000 para el equipo auxiliar que debe ser dispuesto, independientemente del número de efectos usados. La vida de la unidad se estima en 12 años y al final de este tiempo el valor de salvamento se considera que es US$7.500 por efecto. El evaporador operará 320 días al año. Los costos fijos anuales (excluyendo depreciación) deben ser tomados como el 12%, y los costos de mantenimiento anual como el 5%, ambos basados en la inversión original de capital. Los costos de vapor son US$5/1.000 lb de vapor usado, y 0.8N lb de agua se evapora en la unidad por cada libra de vapor, N es el número de efectos instalados. Los otros costos, excepto los de depreciación, deben ser considerados independientes del número de efectos usados.
2. Halle la temperatura máxima de salida del tercer intercambiador mostrado en el esquema (figura 9), sujeto a la restricción de que el área total tendrá un valor fijo, donde: N = 3, t1 = 150ºF, t2 = 200ºF, t3 = 250ºF, To = 100ºF, U = 0.1 ft
-2, At =
100 ft2
UA
UAtTT
i
iiii
1
1
Figura 9. Esquema intercambiadores en serie
2. Resuelva el ejemplo 9 con el método de sustitución directa 3. Considere un proceso de extracción de 2 etapas con flujo cruzado. En cada
etapa se pone en contacto 10 l/min de fluido de proceso con un solvente inmiscible con el fin de extraer el soluto presente que se alimenta en cada etapa. Para esto, se alimenta wi ml/min de solvente fresco (i representa cada etapa). La concentración de soluto en la solución original que se alimenta al sistema es x0 = 0.4. zi es la concentración de soluto deseado en la corriente de salida del solvente en cada etapa. Las composiciones de las corrientes de salida de cada etapa están relacionadas por la ecuación de equilibrio zi = 2xi. Si la cantidad unitaria de soluto extraído vale 500 $/l y el costo de la cantidad unitaria de solvente es 100 $/l, determine: i) una expresión para las ganancias con este sistema, si éstas están dadas por la resta del valor del soluto extraído menos el
... To T1 T2 Tn-1 Tn
t1 t2 Tn
1 2 n
A1 A2 An
245
costo del solvente suministrado, asumiendo costos de operación nulos, ii) los puntos estacionarios resultantes de optimizar las ganancias y clasifíquelos como máximo, mínimo y punto silla. Las concentraciones xi y zi están expresadas como ml de soluto/ml de solvente extractor o solvente portador.
Utilice para la solución un método analítico de optimización de funciones multivariables con restricciones.
246
4.5. Bibliografía Avrial M., “Nonlinear Programming: Analysis and Methods, Prentice-Hall, New Jersey, 1976 Bazaraa M., “Nonlinear programming”, John Wiley & Sons, New York, 1979 Beveridge, S., “Optimization, theory and practice”, McGraw-Hill, New York, 1970 Himmelblau, D., “Applied nonlinear programming”, McGraw-Hill, New York, 1972. Mickley, H.S., Sherwood, T.S., Reed, C.E., "Applied Mathematics in Chemical Engineering". McGraw, New Delhi, 1975. Smith, C., Pike, R., Murril, P., "Formulation and optimización of mathematical models", International texbook Company, Scranton,1970.
247
TABLA DE CONTENIDO
5.1. Distribución de errores ................................................................................. 250
5.2. Propagación de errores ................................................................................ 252
5.3. Varianza de una medida indirecta................................................................. 258
5.4. Estimación de intervalos y confiabilidad de estimaciones ............................. 260
5.5. Estimado de intervalos de desviaciones estándar ........................................ 266
5.6. Pruebas de hipótesis .................................................................................... 270
5.6.1. Etapas en las pruebas de hipótesis .................................................... 270
5.6.2. Comparación de varianzas..................................................................... 271
5.6.2.1. Comparación de la varianza de una muestra y una varianza hipotética ....................................................................................................... 271
5.6.2.2. Comparación entre las varianzas de dos muestras.......................... 274
5.6.3 Comparación de medias ..................................................................... 278
5.6.3.1 Comparación entre la media de un conjunto y una media hipotética . 279
5.6.3.2 Comparación entre la media de un conjunto x1 y la media de otro
conjunto x2 .................................................................................... 284
5.6.3.3 Comparación entre las medias de dos conjuntos cuando se sospecha que hay factores extraños que pueden influir en las determinaciones individuales .................................................................................... 289
5.6.3.4 Comparación entre varios valores de medias ................................... 290
5.7. Ejercicios propuestos ................................................................................... 296
5.9. Bibliografía ................................................................................................... 297
248
CAPITULO V.
INTERPRETACIÓN DE RESULTADOS EXPERIMENTALES Son muchas las actividades en ingeniería química en las que se requiere obtener, analizar e interpretar datos para la toma de decisiones. En la investigación y desarrollo de procesos, así como en el diseño, operación y mejoramiento continuo de unidades de transformación o plantas de procesos completas, por ejemplo, el ingeniero químico está enfrentado al tratamiento y análisis de datos, resultados de experimentos, cálculos u operaciones de producción cotidiana. En la investigación y desarrollo, y en el diseño de algunas unidades como reactores, filtros, centrífugas, lixiviadores, sistemas de suspensión y emulsificación, entre otros, el ingeniero químico debe realizar experimentos, tantos como sea necesario para validar hipótesis, encontrar relaciones entre variables de los sistemas en estudio, o determinar las mejores condiciones de operación para diseñarlos y optimizarlos. En la operación, el tratamiento y análisis de datos es una actividad cotidiana que debe realizarse por cambios o variaciones en materias primas y variables de operación, o por modificaciones en las especificaciones de los productos para adaptarlos a los cambios del mercado o requerimientos de los consumidores. En todas estas actividades el ingeniero está interesado en obtener siempre resultados confiables. Confiabilidad que está sustentada en el grado en que los valores de dichos resultados efectivamente representen el valor verdadero de los parámetros o características de los sistemas. Así, el significado de las conclusiones basadas en datos numéricos y la seguridad en las decisiones apoyadas en dichas conclusiones, están necesariamente determinados por la confiabilidad de los datos y métodos de procesamiento utilizados. Por ello es necesario evaluar la confiabilidad tanto de los datos como de los resultados obtenidos con base en medidas experimentales o medidas directas, mas aún, cuando de dichas conclusiones se desprenden decisiones costosas.
La confiabilidad en datos no sólo es requerida en las investigaciones para la seguridad en las conclusiones y en la determinación experimental de propiedades físicas y fisicoquímicas, sino que condiciona también la realización de investigaciones y medidas experimentales con un mínimo de tiempo y costo. Tiempo y costo que están vinculados al número de experimentos que deben realizarse y a la precisión de los instrumentos de medida y rigurosidad de los métodos de cálculo o procesamientos utilizados. Todos los datos, medidos o calculados, están sujetos a errores. En la práctica no es posible obtener el valor verdadero de un parámetro o característica de un sistema. Siempre habrá la presencia de una desviación, ya por las limitaciones inherentes a los sentidos humanos, debido a las aproximaciones de los métodos que se usen o sofisticación de procedimientos de medida o instrumentos, o por la descalibración de estos instrumentos.
249
Si el error en un dato es descubierto y tenido en cuenta en su magnitud y signo en la forma de una corrección en su efecto, el error se denomina determinado, y los que no pueden ser tenidos en cuenta se denominan indeterminados. Estas categorías de errores también pueden clasificarse de manera más específica en errores accidentales, errores constantes y errores de método. Los errores accidentales son una clase importante de errores indeterminados. Ellos ocurren por limitaciones físicas de las personas que realizan la medida (error humano) y/o por variaciones fortuitas en la sensibilidad del instrumento de medida (error por sensibilidad). Los errores de métodos, también indeterminados, son debidos a aproximaciones y suposiciones hechas en el desarrollo teórico del modelo usado para calcular un resultado u obtener un dato, como por ejemplo el truncamiento en una serie y los errores de redondeo. Mientras que los errores constantes, que pueden determinarse haciendo medidas con diferentes instrumentos, son debidos a la descalibración del instrumento de medida.
La presencia de errores accidentales y constantes determina la precisión y exactitud en una medida. La precisión o reproducibilidad está asociada a la ausencia de errores accidentales en la medida, mientras que la exactitud hace referencia a medidas libres de errores accidentales y constantes. Se concluye entonces de las afirmaciones precedentes, que si se desea conocer un valor de una propiedad mediante un análisis de laboratorio, resulta evidente que no se obtiene el valor “verdadero”. Sin embargo, puesto que ningún valor obtenido experimentalmente es absoluto, si se puede determinar mediante métodos estadísticos la confiabilidad de la determinación experimental. Esto exige realizar una medida tantas veces como deseemos tener confianza en relación con el valor absoluto o verdadero.
En el caso específico de la comprobación de una hipótesis o la determinación de la confiabilidad de algún valor factual, se debe utilizar un experimento planeado estadísticamente. Básicamente esos experimentos preparados le permiten al analista determinar con un grado de confianza preestablecido, el grado de variación de las determinaciones experimentales que se debe a la casualidad y el causado por influencias conocidas o no.
En el análisis de datos y planeación de experimentos es necesario responder algunas preguntas: ¿Qué tipo de errores son probables en una medida o cálculo? ¿Cómo se extiende en los resultados un error en los datos? ¿Cuánta seguridad deben poseer las cantidades individuales que entran en un cálculo para una confiabilidad especificada en el resultado? ¿Qué seguridad es económicamente factible obtener en una investigación? ¿Qué método de investigación es más confiable?
250
Estas preguntas y otras relacionadas con la comprobación de hipótesis, la determinación de una estimación confiable de algún valor factual y la representación funcional de una característica, se responden con ayuda del análisis estadístico.
El análisis estadístico está constituido por un conjunto de técnicas para reducir y organizar datos y para determinar su significado esencial. Los métodos estadísticos se basan en el concepto simple de la variabilidad. Mediante este concepto se determina una base para la planeación de experimentos y el análisis de datos; en este sentido, los métodos estadísticos, se ocupan de obtener la información máxima a partir de un conjunto dado de datos (análisis) y, a la inversa, de minimizar la cantidad de datos (planeación experimental) necesarios para deducir informaciones específicas.
5.1. Distribución de errores
Toda medida individual de una propiedad o característica de un sistema, por la presencia de errores, no es más que un estimado de su valor verdadero. Por ejemplo, si se tiene un tanque de producto de un proceso y se desea conocer la densidad del producto en el tanque, y se toma una muestra y se le determina su densidad, se dice que esta medida es un estimado de la densidad del producto. Por los errores que pueden estar presentes en la medida, no es posible decir que ese dato es el valor real o verdadero de la densidad. Esa medida específica de la densidad puede expresarse en función del valor verdadero y una variación debida a los errores, como:
= + ε
donde:
= valor verdadero.
ε = error experimental.
Si se toman varias muestras y a cada muestra se le determina la densidad, la medida para cada muestra puede expresarse como:
i= + i
En este caso la media de estas determinaciones puede tomarse como un estimado más confiable de la densidad. Resulta evidente, en forma intuitiva, que en la medida en que se tome un mayor número de muestras, la media de las determinaciones tiende a un valor fijo. Este valor representa el valor verdadero de la densidad, si no existen errores de método y/o errores no-aleatorios inherentes en las medidas.
251
Las medidas repetidas de una cantidad x son comúnmente reportadas en términos de la media o valor promedio, y la desviación estándar o variación o la dispersión de los datos. Así, la media o promedio está dada por:
xn
xi
i
n
1
1
donde: xi : son los valores individuales.
n : número de datos o valores. La desviación estándar muestral es la raíz cuadrada del promedio de la diferencia al cuadrado entre los valores individuales y el valor promedio.
2
1
1
1
n
i
i
s x xn
Si en un conjunto infinito de datos las variaciones de los valores individuales son aleatorias, Gauss demostró que la distribución de los datos alrededor de la media está dada por la función:
21 ( )
exp2
( )2
x u
f x
, -∞< x < +∞
donde:
u = media hipotética
= desviación estándar f x( ) = frecuencia o probabilidad de ocurrencia de un valor de magnitud x.
Esta función de distribución puede simplificarse definiendo la transformación:
zx u
por lo tanto:
252
21exp
2( )
2
z
f z
, -∞< z < +∞
La cual es conocida como la distribución normal estándar
5.2. Propagación de errores Cuando una cantidad deseada M está relacionada a varias cantidades
directamente medidas nM,...,M,M 21
por la ecuación:
nM,...,M,MfM 21
M puede determinarse indirectamente o medirse indirectamente. En general, el valor verdadero de M no puede ser conocido si no se conocen los
valores verdaderos de nM,...,M,M 21
, pero el valor mas probable de M
denotado por Q puede obtenerse a partir de los valores más probables de
nM,...,M,M 21 , denotados por 1 2, ,..., nq q q . Evidentemente los errores en las
medidas se propagaran hasta la cantidad calculada. El valor más probable de M, así como un estimado de M a partir de los estimados
de qi pueden calcularse con la misma función, como:
1 2, ,..., nQ f q q q
1 2, ,..., nQ f q q q
Si se conocen los errores en q q qn1 2, ,......., se puede estimar la característica del
error en Q . Haciendo una expansión en Taylor alrededor del punto que define los
valores más probables de los qi y reteniendo únicamente los términos lineales se
obtiene:
tQ Q f q q q
donde:
1 2, ,..., nq q q q y 1 2, ,..., nq q q q
Como Q Q Q , error en la medida indirecta
253
tQ Q Q f q q q
1 2
1 2
1
...
t
q q
n
i
i i q
Q Q Q q q q
f fQ q q
q q
fQ q
q
El signo en qi es el que haga máximo a Q .
Así, el error calculado en Q depende entonces de:
Naturaleza de la función f
Magnitud de las cantidades medidas Magnitud de los errores en las cantidades medidas Si la función f es una suma:
Q q q q q
Q q
n i
i
i
n
1 2
1
. . . . . . .
Si la función es una productoria
Q qi
i
n
1
Q
Q
q
q
i
ii
n
1
En este caso si denominamos error relativo al error fraccional, en este caso se tiene que el error relativo en Q es igual a la suma de los errores relativos en q. Si la función tiene la forma:
k
n
baqqqQ ...21
n
k
n
j
n
aak
n
bqkqqqqaqqqQ
1
111
1
12 .........
n
n
q
qk
q
qb
q
qa
Q
Q
...
2
2
1
1
254
En este caso se establece que el error relativo de Q está dado por la suma de errores relativos afectados por la respectiva potencia en qi en la función.
Ejemplo 1: Durante el curso de un análisis de funcionamiento de planta se hizo necesario determinar la velocidad promedio de agua a través de cierta tubería. El método más conveniente de medida fue un método indirecto consistente en la medida del peso del agua que salía de la tubería durante un tiempo t, medida del diámetro de la tubería y cálculo de la velocidad promedio con la relación:
vW
tA
W
D t
42
Las medidas directas con los errores estimados son: W 100 5lb t 70 10. s D 1 003. in 62 34 0 001. . lb/ft
3
Si despreciamos el error relativo en el peso específico, se tiene que el error en v está dado por:
v v vv W t D
W t D
De la relación de v se obtiene:
v
W D t
v
t
W
D t
v
D
W
D t
4
4
8
2
2 2
3
2 2 2 3
4 4 8W Wv W t D
D t D t D t
Reemplazando los valores de las variables, sin el error, se obtiene:
1000.042 0.060
12v W t D
255
Para obtener el máximo error se toman los signos de W t y D, tales que v sea
máximo.
100
0.042 5 0.060 1.0 0.0312
0.522 /
4 100 144/
70 3.14 62.3
4.21 /
v
v ft s
v ft s
ft s
El máximo error relativo es:
0.522100 12.4%
4.21
Para hallar los errores relativos en las cantidades medidas para que el error de la cantidad indirectamente medida esté dentro de cierto margen de seguridad se utiliza el principio de efectos iguales; asumiendo que el error total puede estimarse como n veces la contribución de cualquiera de las medidas directas. O sea:
1 2
1 2
... ... n
n
f f fQ n q n q n q
q q q
i. Si 1 2 ... nQ q q q
1 2
1 2
n
n
qq qQn n n
Q q q q
ii. Si k
n
baqqqQ ...21
1 2
1 2
... n
n
qq qQna nb nk
Q q q q
Ejemplo 2: Cuáles deben ser los errores relativos en W,D y t para el ejemplo anterior, si se desea que v posea un error de 2 0%..
256
0.023 0.7%
3
0.023 0.7%
3
0.023 2 0.33%
2 3
v W W
v W W
v t t
v t t
v D D
v D D
Ejemplo 3: La calibración de un orificio medidor normalmente se realiza midiendo la rata de flujo de agua con la caída de presión medida en un manómetro de mercurio. El método más simple para obtener la rata de flujo másico consiste en recoger y pesar el agua que fluye a través del medidor en un período definido de tiempo. Para un orificio particular de 0.25 in. de diámetro, se determinó una rata de flujo W igual a 19 lb/min con un error estimado de +/- 0.1 lb/min, y la correspondiente caída de presión fue 9.1 inHg con un error estimado de +/- 0.1 in Hg. Calcular el máximo error posible en el cálculo del coeficiente del orificio Cv, para el flujo medido. Determine cuál debe ser el error máximo en las medidas de W y caída de presión si se desea que el error máximo en Cv sea el +/-2%.
CK
W
hv
m
1
donde
0
12 2
2 2
3 2
12
60 2 1.05
1(0.25) 62.3 60 2 1.05 32.2
4 min 144
10.5min
wK A g
lb seg ft ftin
ft in seg
lb ftK
W = rata másica en lb/min.
hm = caída de presión en in Hg.
v vv m
m
C CC W h
W h
1v
m
C
W K h
257
32
32
2
1
2
vm
m
v m m
m
C Wh
h K
WC W h h
KK h
Reemplazando los valores de K, W y hm, se obtiene:
0.0316 0.0329v mC W h
Para obtener el máximo error se toman los signos de W y hm que hagan,
efectivamente, máximo el valor.
30.0316(0.1) 0.0329( 0.1) 6.45 10vC
El valor del coeficiente será por lo tanto Cv 0 6 6 45 10 3. . * .
Para hallar los errores relativos de W y hm, para que Cv tenga un error máximo del
+/-2% se aplica el principio de efectos iguales:
1 2
1 2
... n
n
Q Q QQ n q n q n q
q q q
En este caso:
2 2v vv m
m
C CC W h
W h
2 2 2 22
1 1( 0.02) 0.01 1%
2 2
v v v v vm m
v v
m
v
v
C C C C W C WWW K h K h
C W CWW
K h
CW
W C
3 122
22
2%
v v v v m v mm
v vmmm
m m
m v
m v
C C C C h C hh
C CWh WWhhK h K hK
h C
h C
258
El error relativo con que debe determinarse el flujo W es ±1% y ±2% para la caída de presión.
5.3. Varianza de una medida indirecta La varianza de una medida indirecta está dada por:
2
2 2
1
( ) ( )n
i
i i q
QQ q
q
y el estimado de dicha varianza se puede obtener de una relación similar:
2
2 2
1
( ) ( )n
i
i i q
Qs Q s q
q
Esta relación se puede demostrar a partir de una expansión en Taylor de la función de Q. Una expansión en Taylor truncada en el segundo término da:
( )tQ Q f q q q
1 2( , ,... )nQ f q q q
iq : Media estimada del valor verdadero.
tQ Q f q q q
1 2
1 2
...
q q
f fQ q q
q q
Elevando al cuadrado y despreciando los dobles productos.
22 2
2 2 2 2
1 2
1 2
... n
nq q q
f f fQ q q q
q q q
dividiendo por n -1
259
22 2
22 22
1 2
1 2
...1 1 1 1
n
nq q q
qq qQ f f f
n q n q n q n
donde n es el número de medidas individuales y usando la definición de varianza, para cada medida directa de qi, se obtiene:
2
2 2
1
( ) ( )n
i
i i q
Qs Q s q
q
Ejemplo 4: Hallar la varianza de la velocidad promedio del agua, con los datos del ejemplo 1, teniendo en cuenta que el estimado de la varianza para cada una de las variables es:
2
2
2 4
2 7
4.884
0.195
1.69 10
1.95 10
s W
s t
s D
s
vW
tA
W
D t
42
Las medidas directas con los errores estimados son: W 100 5lb t 70 10. s D 1 003. in 62 34 0 001. . lb/ft
3
Si despreciamos el error relativo en el peso específico, la varianza de v está dada por:
2
32 2
1i
i
i i q
vs v s q
q
260
2 2 2
2 2 2 2v v vs v s W s t s D
W t D
De la relación de v se obtiene:
v
W D t
v
t
W
D t
v
D
W
D t
4
4
8
2
2 2
3
2 2 2
2 2 2 2
2 2 2 3
4 4 8W Ws v s W s t s D
D t D t D t
Reemplazando los valores de las variables, sus varianzas y para obtener el máximo error se toman los signos de las derivadas parciales positivos para que
2s v sea máximo.
2
2 22 2 2 21000.042 0.060
12s v s W s t s D
2 3 3 4
2
1.76 10 4.884 3.6 10 0.195 69.44 1.69 10
2.1 10
s v
5.4. Estimación de intervalos y confiabilidad de estimaciones Los valores de y para una medida de alguna propiedad o característica
provee una descripción de la precisión del método de medida. Sin embargo, en la práctica no es posible obtener estos parámetros, sino estimaciones de ellos a partir de un conjunto finito de datos o medidas. Si se supone que la diferencia entre una media muestral x y se debe solo a la
casualidad y que las medidas individuales de x tienen una distribución normal, se puede determinar una medida de la confiabilidad de x al estimar . Esta medida
se denomina intervalo de confianza. Se puede demostrar que si una distribución de observaciones o medidas individuales es normal, con una media y desviación
estándar , las medias muestrales, cada una de ellas basadas en n
observaciones o medidas escogidas aleatoriamente de la población, tendrán
261
también una distribución normal en torno a , pero con una desviación estándar
igual a
n. Así, si se conociera se podría definir un intervalo de confianza en el
cual se encuentre el valor , con una probabilidad especificada, a partir de una
muestra. El intervalo estaría definido por:
nzx
2
donde: n: número de observaciones o medidas para la muestra.
z/2: valor definido por el nivel de probabilidad, y obtenido de la distribución normal.
z2
dzzfzzPz
2
)(2 2
Ejemplo 5 : Obtener un intervalo de confianza del 95% para el rendimiento diario de un reactor de ácido sulfúrico, a partir de los rendimientos: 91.37%,91.45%,93.13%,92.87%,91.65%,91.96%,92.28%,92.57%,92.93% y 92.79%; si se supiera que =0.75.
xx
n
i
i
n
1
109137 9145 92 79 92 30
1
( . . ... . ) .
De una tabla de valores de probabilidad para la distribución normal con 1-p(z)=5%/2=2.5%, se obtiene z=1.96, para p(z)=97.5. El intervalo para el rendimiento diario sería:
92 30196 0 75
1092 30
196 0 75
10.
. * ..
. * . R
9183 92 76
92 30 0 464
. . .
. . .
R
R
Si se tiene un conjunto de medias con los respectivos estimados de la desviación estándar de la población, se puede conformar una muestra de medias de
inx,...,x,x,x 321y a partir de esta muestra obtener un mejor estimado de la media
de la población. Este estimado está definido como:
1
1 in
m j
ji
x xn
262
donde: ni representa el número de muestras o medias
El estimado muestral de la desviación estándar del conjunto de medias está dado por:
2
1
1( )
1
in
m j m
ji
s x xn
Este estimado muestral de la desviación estándar del conjunto de medias se puede estimar desde una simple muestra.
21
;1
m i
ss s x x
nn
s = estimado de la desviación estándar de la población
sm = estimado de la desviación estándar de la población medias muestrales
Se ha observado que la distribución de frecuencia de medias muestrales xi en
torno a la media de la población es esencialmente normal, aunque la
distribución de frecuencia de la población no lo sea. Este hecho es importante porque permite calcular intervalos de confianza para la media de una población aún cuando no se cumpla la condición de distribución normal para ella.
Para una muestra con 30n se puede aproximar m a ms , es decir
m ms
Como la media de una muestra es un buen estimado de la media de la población,
se puede usar junto con ms para la estimación de intervalos. En este caso el
intervalo estará definido como:
mm szx2
a partir de un conjunto de medias
n
szx
2 a partir de una media
z2
2 2
P z z( )
263
Ejemplo 6: Un resultado analítico arroja una media de 30.8 y una desviación estándar estimada del conjunto de medias igual a 0.489. Calcular el límite del 95% de confianza para el valor verdadero.
Se parte del supuesto de que m es conocido e igual a 0.489 por lo que, en el
cálculo del intervalo se usará el estadístico z. De una tabla de probabilidad para la
distribución normal con 15
22 5% P z . , se obtiene z = 1.96 para P z 97 5%. .
El intervalo de confianza del 95% será:
2
30.8 1.96 0.489
30.8 0.96
29.8 31.8
mx z s
En el caso en que el número de datos de la muestra sea pequeño 2
30,s
nn
no
es un estimado adecuado de m
2 . En este caso se utiliza la distribución t de
Student para el estimado del intervalo en lugar de la distribución normal. La distribución t de Student está definida por.
f tt
1
1
2
2
12
1
2
, -∞< t < +∞
donde:
m
xt
s
: grados de libertad (número de valores usados para calcular las medias menos
el número de medias calculadas). Por lo tanto un intervalo para el valor verdadero puede definirse a partir de la distribución t de Student con una probabilidad específica o una confianza deseada. Con esa probabilidad, y de la definición de la variable t , se tiene
264
2
t
s
x
m
donde:
2mx t s
/ 22 2
( ) ( )2 t
t P t t f t dt
Ejemplo 7: Los resultados de un análisis gravimétrico son: 55.3, 56.9, 55.8, 57.3 y 57.7. Calcular
el rango en que pueda encontrarse el valor verdadero con una confianza del 95%.
Como el número de datos es menor que 30 (n 30), para el calculo del intervalo de
confianza se usará el estadístico t y el estimado ms .
Cálculo de la media:
5
1
1i
i
x xn
1
55.3 56.9 55.8 57.3 57.75
56.6
Cálculo de la ms :
522
1
2
1
1
0.20
56.6 0.45
m i
i
m
s x xn n
x t s
t
Con el 95% de probabilidad y los grados de libertad igual a 4 se obtiene de la tabla 2-1, de Mickley and Sherwood, “Applied Mathematics in Chemical Engineering”,
1975, el valor de / 2 2.776 2.8t .
56 6 126
5534 57 86
. .
. .
265
Si se tienen varios grupos de datos que muestren medias equivalentes estadísticamente, es decir no existe una diferencia entre ellas estadísticamente significativa, se puede obtener a partir de las medias muestrales un mejor estimado del valor verdadero:
x
w x
w
mv
i i
i
n
i
i
n
i
i
1
1
donde :
i,mi
ik
i
ik
iss
nnw
222
1
nk = número de datos en un grupo
Un intervalo para el valor verdadero puede definirse a partir de la distribución t de Student con el valor xmv y un estimado muestral de la desviación estándar del
conjunto de medias muestrales. El estimado del intervalo de confianza se hace con el mejor valor de la media de las medias, cuando la varianza del conjunto de datos de cada muestra tienen los
valores diferentes i j
2 2 , donde i, j son dos conjuntos de datos diferentes.
El estimado de la varianza de la población de mejores valores de media, 2
,m mvs , se
puede obtener a partir de los estimados de la desviación estándar de la población de medias maestrales que se hace en cada conjunto de datos.
2
21
2
2
1
11mv,m
i,mi i
ik
mv,m s
s
n
El intervalo de confianza esta dado como:
,2
mv m mvx t s
con = número total de datos menos el número de grupos
in
iiik nn
1
266
donde:
ni = número de grupos o muestras
(nk)i = número de datos en el grupo o muestra i
Ejemplo 8: Un análisis realizado por dos procedimientos diferentes arroja los resultados que se muestran en la tabla 1.
Tabla 1. Procedimientos del ejemplo 7
x1 x2 x3 x4 x5 x sm
2
Procedimiento 1 55.3 56.9 55.8 57.3 57.7 56.6 0.2 Procedimiento 2 52.6 54.3 58.0 52.7 60 55.5 2.2
Obtenga el rango del valor verdadero con una confianza del 95%.
56.6 55.50.2 2.2 56.5
1 10.2 2.2
mvx
2
,
10.183
1 10.2 2.2
m mvs
Para obtener el intervalo con el mejor valor de la media se asumirá que las
varianzas de los dos procedimientos son diferentes, es decir 2 2
1 2 .
Con 10 2 8 y 95.0)(22
tttp se obtiene de la tabla 2-1 de Mickley
and Sherwood, “Applied Mathematics in Chemical Engineering”, 1975, el valor de
/ 2 2.306t , así el intervalo está dado por:
,2
56.5 2.306 0.18
56.5 0.984
mv m mvx t s
5.5. Estimado de intervalos de desviaciones estándar
267
Si se asume que la población de la cual se hace el muestreo tiene una distribución aproximada a la distribución normal, se puede demostrar que el estadístico
22
2
1
( )n s
llamado chi-cuadrado, tiene una distribución continua conocida como la distribución de chi-cuadrado, con media igual a (n-1), los grados de libertad. Esta distribución está dada por la función:
21
2 2 22 2
2
1( ) , 0
22
f e
donde : grados de libertad
1
0
k tk t e
, k >0
Para esta distribución: Con una probabilidad de ( )1 , se puede acertar que:
2
2 2
212 2
( 1)n s
A partir de esta ecuación, mediante transformaciones algebraicas se obtiene el
intervalo para , para muestras pequeñas, (n 30) :
( ).
( )n s n s
1 12
2
2
2
12
2
donde : 2
2 es el valor de la variable 2 tal que 2 2
2
( )2
P como se muestra
en la figura 1; y 2
12
es el valor de la variable 2 tal que 2 2
12
( )2
P
como
se ilustra en la figura 2.
268
Figura 1. Distribución chi-cuadrado
Figura 2. Regiones de la distribución chi-cuadrado
Para muestras grandes. (n ≥ 30), la distribución de s se puede aproximar a una
distribución normal que tiene media igual a y desviación estándar igual a
2n.
Con esta distribución se puede establecer el intervalo para con un nivel de
significancia .
269
2 21 12 2
s s
z z
n n
donde:
z2
2 2
P z z( )
Ejemplo 9: Se hicieron cinco determinaciones del flujo de agua fria en un intercambiador de calor. Los valores obtenidos en GPM (galones por minuto) fueron: 5.84, 5.76, 6.03, 5.90, 5.87. Determine el intervalo de confianza para la imprecisión en la medida del flujo.
Como el número de datos es menor que 30, n 30, el intervalo de confianza se
construye con el estadístico 2 ; y esta dado por:
( ).
( )n s n s
1 12
2
2
2
12
2
Cálculo de la media:
1
5ix x
1
5.84 5.76 6.03 5.9 5.875
5.88
Cálculo del estimado de la varianza:
5 2
2
1
1
4i
i
s x x
2 2 2 2 21(5.84 5.88) (5.76 5.88) (6.03 5.88) (5.9 5.88) (5.87 5.88)
4
0.013
= 0.00975
Los valores de 2
/ 2 y 2
1 /2 se leen de una tabla para las distribución Chi-cuadrado
con 5% ; para obtener el intervalo de confianza con una probabilidad del 95%.
Los valores leídos con 4 son:
270
2
0.025 11.1 ; 2
0.975 0.4844
4 0.00975 4 0.00975.
11.1 0.4844
0.059 0.284
5.6. Pruebas de hipótesis
Con mucha frecuencia en las investigaciones es necesario comparar un promedio de un conjunto de datos con un valor hipotético o con el valor promedio de otro conjunto (o los promedios de otros conjuntos) de datos, para determinar si las diferencias observadas entre ellos pueden deberse a la casualidad. Igualmente es necesario, en algunos casos, tener información sobre la homogeneidad de datos o de un conjunto de determinaciones experimentales; es decir, conocer la variabilidad o la varianza de un conjunto o varios conjuntos de medidas. En esas circunstancias, el criterio para determinar si una diferencia es o no real, es determinar la magnitud de la diferencia que puede deberse a la casualidad. Si la diferencia observada es mayor que la que pudiera esperarse razonablemente en forma aleatoria, se dice que dicha diferencia es estadísticamente significativa. Para responder si efectivamente existe alguna diferencia entre la media y un valor hipotético, o entre un conjunto de medias, así como si existe alguna diferencia entre la varianza y un valor hipotético se realizan pruebas de hipótesis. En las pruebas de hipótesis, se pueden cometer dos tipos de errores: Error tipo I: Descartar una hipótesis cuando es verdadera. Error tipo II: Aceptar una hipótesis cuando es falsa. Esta situación puede esquematizarse en la tabla 2, si se simboliza con H la hipótesis.
Tabla 2. Pruebas de hipótesis
H es verdadera H es falsa
Aceptar H Decisión correcta Error tipo II
Rechazar H Error tipo I Decisión correcta
5.6.1. Etapas en las pruebas de hipótesis 1. Formular una hipótesis de tal forma que pueda calcularse la probabilidad de un
error tipo I. A esta hipótesis se le llama hipótesis nula.
271
2. Formular una hipótesis alterna de tal forma que el desecho de la hipótesis nula sea equivalente a la aceptación de la hipótesis alternativa.
3. Especificar la probabilidad con la cuál queremos correr el riesgo de un error tipo I. Esta probabilidad es generalmente llamada el nivel de significancia con el cuál se realizará la prueba y es denotada por .
4. Construir el criterio de la prueba usando la teoría estadística apropiada. 5. Finalmente, especificar si la alternativa de desechar la hipótesis nula es aceptar
o reservarse el juicio sobre la hipótesis alterna.
5.6.2. Comparación de varianzas Hay tres tipos básicos de comparaciones de varianza: Entre la varianza de un conjunto y una varianza hipotética. Entre la varianza de dos conjuntos de datos. Entre las varianzas de varios conjuntos de datos.
5.6.2.1. Comparación de la varianza de una muestra y una varianza
hipotética
La hipótesis nula que se denominará H0, y la hipótesis alterna que se designará H1, se formularán de acuerdo con la pregunta que se requiere responder. Con cada
hipótesis nula hay asociada una hipótesis alterna. Si 2 es el valor verdadero de la
varianza del conjunto de datos y 2
0 un valor hipotético de la varianza, los pares
posibles que pueden construirse son:
Ho : 2 ≥ 2
0 y H1 : 2 2
0
Ho : 2 ≤ 2
0 y H1 : 2 > 2
0
Ho : 2 = 2
0 y H1 : 2 ≠ 2
0
El estadístico 2 se usa en los criterios para aceptar o rechazar la hipótesis nula.
El valor calculado u observado de este estadístico está dado por la ecuación:
2
2
0
2
1
n s
donde s2 es un estimado del valor verdadero de
2, y los grados de libertad son
iguales a n 1 .
Los criterios para decidir en la prueba aparecen en la tabla 3
272
Tabla 3. Criterios para aceptar o rechazar la hipótesis nula en la comparación de
una varianza 2 con un valor hipotético 2
0
Hipótesis
nula
Hipótesis
alterna
Desechar la
hipótesis nula
Aceptar la hipótesis nula
o reservarse el juicio 2 2
0 2 2
0 2 2
1 2 2
1 2 2
0 2 2
0> 2 2> 2 2
2 2
0 2 2
0 2 2
1 / 2 ó 2 2
/ 2> 2 2 2
1 / 2 / 2
Donde:
2 2 2
2 2 2
1 1
2 2 2
/ 2 / 2
2 2 2
1 / 2 1 / 2
( )
1 ( )
/ 2 ( )
1 / 2 ( )
P
P
P
P
Estos mismos criterios están representados en las figuras 3, 4 y 5. En las figuras
está representado el criterio para rechazar la hipótesis nula, cuando el valor de 2
calculado u observado cae en las zonas rayadas en las figuras. La figura 3 para el
caso de hipótesis nula 2 2
0 , la figura 4 para la hipótesis nula 2 2
0 y la figura
5 para la hipótesis 2 2
0 .
-2 0 2 4 6 8 10 12
-2
0
2
2
0
2
f(2)
Y A
xis
Title
X Axis Title
Figura 3. Hipótesis alterna 0
273
Figura 4. Hipótesis alterna 0
-2 0 2 4 6 8 10 12
-2
0
2
2
0
2
2
f(2)
Y A
xis
Title
X Axis Title
Figura 5. Hipótesis alterna 0
Ejemplo 10: El espesor de una parte usada en un semiconductor tiene una dimensión crítica tal que su variación está dada por una desviación estándar no mayor que 0.60 milésimas de pulgada. Si de un proceso de manufactura de estas partes se tomaron 18 muestras cuya desviación estándar es s= 0.82 milésimas de pulgada, puede considerarse que el proceso está ajustado para satisfacer la calidad de las partes?. Para responder la pregunta se plantean como hipótesis:
274
H0:
2 2 2
0 (0.60)
H1: 2 2 2
0> (0.60)
El valor observado para 2 es:
22
2
22
0
1 17 0.82
0.60
n s
2 31.75
Con un nivel de significancia igual al 5% ( 5% ), para 17 grados de libertad se
obtiene de una tabla para la distribución chi-cuadrado:
2 27 587 . .
Como el valor observado es mayor que el valor leído 2 2
se descarta la
hipótesis nula, lo que implica que el proceso no satisface el requerimiento de dimensión crítica y por lo tanto debe ajustarse.
5.6.2.2. Comparación entre las varianzas de dos muestras De igual manera a la comparación de una varianza con un valor hipotético, en la comparación de dos varianzas de dos conjuntos de datos, las hipótesis se
formularán de acuerdo con lo que se requiere saber. Si 2
1 es el valor verdadero
de un conjunto de datos y 2
2 el valor verdadero correspondiente al otro conjunto,
los pares posibles de hipótesis que pueden formularse son:
Ho : 12 ≥ 2
2 y H1 : 12 2
2
Ho : 12 ≤ 2
2 y H1 : 12 > 2
2
Ho : 12 = 2
2 y H1 : 12 ≠ 2
2
El estadístico F se usa en los criterios para aceptar o rechazar la hipótesis nula. El valor calculado u observado de este estadístico esta dado por:
2
1
2
2
sF
s
donde 2
1s y 2
2s son estimados de las varianzas 12 y 2
2 , respectivamente.
Los criterios para decidir en la prueba aparecen en la tabla 4.
275
Tabla 4. Criterios para aceptar o rechazar la hipótesis nula en la comparación de
dos varianzas 12 y 2
2 , de datos normalmente distribuidos
Hipótesis nula Hipótesis
alterna
Desechar la hipótesis
nula
Aceptar la hipótesis nula
o reservarse el juicio
2 2
1 2 2 2
1 2 1F F 1F F
2 2
1 2 2 2
1 2 F F F F
2 2
1 2 2 2
1 2 1
2
F F ó F F
2
1 / 2 / 2F F F
Donde:
1 1
1 / 2 1 / 2
/ 2 / 2
1 ( )
( )
1 / 2 ( )
/ 2 ( )
F P F F
F P F F
F P F F
F P F F
F , 1F , / 2F y 1 /2F se obtienen de valores tabulados de la distribución F; los
cuales deben leerse teniendo en cuenta los grados de libertad del parámetro del
numerador ( 2
1s ) y los grados de libertad del parámetro del denominador ( 2
2s ). Por
economía en la escritura se han escrito estos valores sin los respectivos grados de libertad, pero estrictamente su representación es:
1 2( , )F F
donde:
1 : Grados de libertad asociados al numerador
2 : Grados de libertad asociados al denominador
Las tablas que registran valores de la distribución F, normalmente tabulan una de las colas para valores que dejan a la derecha probabilidades del 5%, 2.5% y 1%;
es decir valores de F y / 2F . Para encontrar los valores de 1F y 1 /2F se utiliza la
propiedad:
276
1 1 2
2 1
1 / 2 1 2
/ 2 2 1
1( , )
( , )
1( , )
( , )
FF
FF
Por ejemplo, de una tabla se lee F0.05 (7,9) = 3.29 y el valor de F0.95 (9,7) se obtiene como:
0.95
0.05
0.95
0.95
1(9,7)
(7,9)
1(9,7)
3.29
(9,7) 0.304
FF
F
F
Ejemplo 11: El rendimiento diario de un reactor determinado durante 10 días fue 92.30 con una desviación estándar de 0.65. Si cierto tiempo después se realizaron otras 10 pruebas para el reactor, con algunas modificaciones ligeras en él, en las cuales se obtuvo un rendimiento promedio de 92.59 con una desviación estándar de 0.37. Existe diferencia entre las desviaciones estándar de los dos conjuntos de medidas del rendimiento. Para responder la pregunta se formularán como hipótesis: H0: 1 2
H1: 1 2
La prueba se realizará con un nivel de significancia igual al 5%, es decir, 5% .
El estadístico que se usará es el estadístico F, calculado como:
Fs
s 1
2
2
2
2
2
0 65
0 373086
( . )
( . ). .
El valor de / 2F se lee en una tabla con grados de libertad en el numerador, n1-1, igual a 9 y grados de libertad en el denominador, n2-1, también igual a 9. F
2
= 4.03
El valor 1 / 2F se tiene haciendo uso de la propiedad de este estadístico:
277
1 / 2 1 2
/ 2 2 1
0.975
0.025
0.975
1( , )
( , )
1(9,9)
(9,9)
1(9,9) 0.248
4.03
FF
FF
F
o sea, 1 / 2F =0.248
Como el valor de F calculado está en el intervalo de 0.248 4.03F , se
acepta la hipótesis nula; es decir, se concluye que no hay diferencia en las desviaciones estándar o varianzas de los rendimientos del reactor Ejemplo 12: Un análisis realizado por dos procedimientos diferentes arroja los siguientes resultados:
x1 x2 x3 x4 x5 x
Procedimiento 1 55.3 56.9 55.8 57.3 57.7 56.6 Procedimiento 2 52.6 54.3 58.0 52.7 60 55.5
Determine si los dos procedimientos tienen la misma precisión. Para responder la pregunta se hará una prueba de hipótesis de varianza con las siguientes hipótesis:
H0: 2 2
1 2
H1: 2 2
1 2
La prueba se hará con un nivel de significancia del 5%. Con este valor de α se
obtiene de una tabla para la distribución F el valor de 0.025(4,4)F y con este valor se
calcula 0.975(4,4)F usando la propiedad que tiene esta distribución. Así, el valor de
0.025F es:
/ 2 0.025(4,4) 9.6F F
1 / 2 0.975
1(4,4) 0.104
9.6F F
El valor calculado de F es:
278
2
2
2
1
sF
s
Con:
2
2
1 ,1 1
1
4is x x
2 21(55.3 56.6) ... (57.7 56.6)
4
1.02
y
2
2
2 ,2 2
1
4is x x
2 21(52.6 55.5) ... (60 55.5)
4
11.02
11.0210.8
1.02F
Como el valor de F calculado cae fuera del intervalo 0.104 9.6F se descarta la
hipótesis nula; es decir, se concluye que hay diferencia en las desviaciones estándares de los dos procedimientos. Con este resultado de este ejemplo se confirma la suposición que se hizo sobre las varianzas de los dos procedimientos analíticos en el ejemplo 8; en consecuencia si era posible obtener el intervalo de confianza con el mejor valor de la media. Si el cálculo de F se hubiese hecho como:
2
1
2
2
1.020.092
11.02
sF
s
también se hubiera llegado a la misma conclusión, ya que este valor calculado esta igualmente por fuera del intervalo.
5.6.3 Comparación de medias También en la comparación de medias hay tres tipos básicos de comparaciones:
279
Entre la media de un conjunto y una media hipotética. Entre las medias de dos conjuntos de datos. Entre las medias de varios conjuntos de datos.
5.6.3.1 Comparación entre la media de un conjunto y una media hipotética La hipótesis nula, que denominaremos Ho, y la hipótesis alterna que se designará H1, se formulan de acuerdo con la pregunta que desee responderse. A cada
hipótesis nula le corresponde una hipótesis alterna. Si es el valor verdadero de la
media del conjunto de datos y o un valor hipotético de la media, las posibilidades que pueden construirse son:
Ho : ≥ o y H1 : o
Ho : ≤ o y H1 : > o
Ho : = o y H1 : ≠ o El estadístico que se usa en los criterios para aceptar la hipótesis nula o rechazarla
depende de si el valor de para la población de donde se tomó el conjunto de datos es conocido o no es conocido, y del número de datos de la muestra o conjunto de datos.
Cuando el valor de es conocido se usa el estadístico Z de la distribución normal y los criterios para decidir en la prueba se registran en la tabla 5.
Tabla 5. Criterios para aceptar o rechazar la hipótesis nula con conocido
Hipótesis
nula
Hipótesis
alterna
Desechar la hipótesis
nula
Aceptar la hipótesis nula
o reservarse el juicio
0 0 z z z z
0 0 z z z z
0 0 2
z z ó 2
z z 2 2
z z z
donde:
/ 22 2
( ) ( )
( ) ( )2
z
z
z P z z f z dz
z P z z f z dz
0
/
xz
n
n : número de datos en la muestra o conjunto de datos
280
Cuando el valor de de la población es desconocido se usa el estadístico z de la distribución normal para una muestra de tamaño grande, n > 30, y el estadístico de la distribución t student para una muestra pequeña, n ≤ 30. Los criterios para decidir en la prueba, en el caso de muestras grandes son los mismos que se registran en la tabla 5; mientras que para muestras pequeñas estos criterios aparecen en la tabla 6.
Tabla 6 Criterios para aceptar o rechazar la hipótesis nula con desconocido y n ≤ 30
Hipótesis
nula
Hipótesis
alterna
Desechar la hipótesis
nula
Aceptar la hipótesis nula
o reservarse el juicio
0 0 t t t t
0 0 t t t t
0 0 t t 2
ó t t 2
t t t 2 2
donde:
/ 22 2
( ) ( )
( ) ( )2
t
t
t P t t f t dt
t P t t f t dt
0
m
xt
s
con: n 1 para leer t o t
2
n : numero de datos de la muestra o conjunto de datos Los criterios registrados en las tablas 5 y 6 pueden mostrarse sobre una línea recta, en la que se representa el dominio del estadístico y los valores leídos del estadístico de acuerdo con las hipótesis formuladas. Simbolizados como θ (t o z) el estadístico usado en los criterios, en las siguientes gráficas se representan las
281
regiones donde se acepta la hipótesis nula o se rechaza, dependiendo donde se localice el valor calculado del estadístico Hipótesis nula Región de aceptación y rechazo de la hipótesis Ho
≥ o
≤ o
= o
Ejemplo 13:
El contenido de azufre de varias muestras de un crudo se reportan como: %s =
2.1, 1.9, 2.4, 2.3, 2.5, 2.4, 2.6, 2.5, 2.7, 2.3, 2.3, 2.4.
Θ = - Θα Θ = 0
Rechazar Ho Aceptar Ho
Reservarse el juicio
Θ = Θα Θ = 0
Aceptar Ho Rechazar Ho
Reservarse el juicio
Θ = Θα/2 Θ = 0
Rechazar Ho Rechazar Ho
Reservarse el juicio
Θ = - Θα/2
Aceptar Ho
282
Se desea saber si las muestras representan un crudo con un contenido de azufre menor que el 2.5%. Hipótesis nula H0 : 0 25%.
Hipótesis alterna H1 0: .
Para responder la pregunta sobre el contenido de azufre del crudo, es conveniente que una de las dos hipótesis, la nula o la alterna, represente lo que se quiere
saber; es decir, si el verdadero () es menor que el valor hipotético (o). En
términos matemáticos será o . Las hipótesis para realizar la prueba se formularán, entonces como:
Hipótesis nula H0: 0 = 2.5%
Hipótesis alterna H1: 0 = 2.5%
Como el valor del es desconocido y el número de datos que se tiene es menor que 30 se usará el estadístico t para decidir en la prueba. Cálculo de la media:
12
1
1 12.1 ... 2.4 2.37
12 12i
i
x x
Calculo del estimado de la varianza:
122 2
1
2 2 2 2
2
1( )
11
1(2.1 2.37) (1.9 2.37) ...... (2.4 2.37)
11
0.0326
i
i
s x x
s
s
Entonces:
22
2 3
0.0326
12
2.716 10
0.052
m
m
m
ss
n
s x
s
Valor de t calculado:
283
0 2.37 2.5
0.052
2.5
m
xt
s
t
El valor leído de t se obtiene, para 5% , con 11 de la tabla 2-1, de Mickley
and Sherwood, “Applied Mathematics in Chemical Engineering”, con P = 0.9. También puede obtenerse el mismo valor de una tabla de la distribución t de Student con una probabilidad
P ( t t )= 0.05.
t = 1.796
Como t t , o sea -2.5 1.796, se acepta la hipótesis nula. En consecuencia el
crudo tiene un contenido menor del 2.5% en azufre. Si se hubieran planteado como hipótesis:
H0: 0 = 2.5%
H1: 0 = 2.5%
se habría llegado a la misma conclusión, ya que t t , es decir -2.5 -1.796.
Si la prueba se hace con 2.5% , también se habría llegado a la misma
conclusión. El análisis también puede realizarse sobre una línea recta donde se ubiquen los valores del estadístico t. Para las hipótesis
H0: 0 = 2.5%
H1: 0 = 2.5%
Rechazar Ho
t =-2.5 0 tα=1.796
Aceptar Ho
284
Se observa en este gráfico que el valor de t cae en la zona donde se acepta la hipótesis nula. Los intervalos de confianza también pueden usarse para realizar la prueba. En este caso si se obtiene el intervalo de confianza del 95% asociado a las hipótesis
H0: 0 = 2.5%
H1: 0 = 2.5%
Con 2.5% , la decisión se toma observando si el valor de o cae dentro o fuera
del intervalo. Este intervalo está dado por:
2.37 2.201 0.052
2.37 0.114
2.256 2.484
mx t s
Como o =2.5 es mayor que el limite superior del intervalo, se concluye que es
menor que o. Es decir se acepta la hipótesis nula: El crudo tiene un contenido de azufre menor que el 2.5%
5.6.3.2 Comparación entre la media de un conjunto x1 y la media de otro
conjunto x2
De manera similar a la comparación de una media con un valor hipotético, en este caso también la hipótesis nula y alterna se formularán de acuerdo con la pregunta
que desee responderse. Si es el valor verdadero del conjunto cuya media es x1 y
el 2 el valor correspondiente al otro conjunto de media x2 , los pares posibles de
hipótesis que pueden plantearse son:
Ho : 1 ≥ 2 y H1 : 1 2
Ho : 1 ≤ 2 y H1 : 1 > 2
Ho : 1 = 2 y H1 : 1 ≠ 2 El estadístico que se usa en los criterios para decidir sobre las hipótesis depende
de si los valores de las , 1 y 2, son conocidos o desconocidos e iguales o diferentes, y del número de datos de las muestras o conjuntos de datos.
5.6.3.2.1 Comparación con 1 y 2 conocidos e iguales 1 = 2 =
Cuando es conocido e igual para los dos conjuntos de datos 1 = 2 = , se utiliza el estadístico z si el número de datos es mayor que 30 (n> 30), para cada
285
conjunto, y el estadístico t si es menor o igual que 30 (n ≤ 30). En el primer caso el valor de z se calcula con la ecuación:
1 2
1 21/ 1/
x xz
n n
En el segundo caso cuando (n ≤ 30) el valor de t se calcula con la ecuación:
1 2
1 2
1 1
x xt
n n
con:
. 221 nn grados de libertad
donde:
n1 : numero de datos del conjunto 1
n2 : numero de datos del conjunto 2 Los criterios para decidir sobre las hipótesis se encuentran registrados en las tablas 7 y 8.
5.6.3.2.2 Comparación con 1 y 2 conocidos y diferentes 1 ≠ 2.
Para valores de conocidos y diferentes, 1 ≠ 2, también se usa el estadístico z cuando el número de datos es mayor que 30 (n> 30) y el estadístico t cuando el número de datos es menor e igual a 30 (n ≤ 30). En el caso de n > 30 el valor de z se calcula como:
1 2
2 2
1 1 2 2/ /
x xz
n n
El valor de t, para diferentes y n ≤ 30, se obtiene como:
1 2
2 2
1 1 2 2/ /
x xt
n n
con:
286
221 nn grados de libertad
donde:
n1 : numero de datos del conjunto 1
n2 : numero de datos del conjunto 2 Los criterios para decidir sobre las hipótesis son los que se encuentran registrados en las tablas 7 y 8.
5.6.3.2.3 Comparación con 1 y 2 desconocidos e iguales 1 = 2.
El estadístico que se usa, como en las situaciones anteriores, igualmente depende del número de datos. En el caso de n> 30 se usa el estadístico z y el valor se calcula con la siguiente ecuación:
1 2
2 2
1 2
1 2
x xz
s sn n
donde s12 y s2
2 son los estimados de 1
2 y 2
2, respectivamente.
Para n ≤ 30 se utiliza el estadístico t y su valor se obtiene como:
1 2
1 2
1 1
x xt
sn n
donde:
2 22 1 1 2 2
1 2
( 1) ( 1)
2
n s n ss
n n
con:
221 nn grados de libertad
Los criterios para decidir son los mismos registrados en las tablas 7 y 8.
5.6.3.2.4. Comparación con 1 y 2 desconocidos y diferentes.
287
Para estas combinaciones se utiliza el estadístico t, independientemente del número de datos en los conjuntos. El valor de t se calcula como:
1 2
2 2
1 2
1 2
x xt
s sn n
con:
22 2
1 1 2 2
2 22 2
1 1 1 2 2 2
/ /
/ / n 1 / / n 1
s n s n
s n s n
También en las tablas 7 y 8 se registran los criterios para decidir sobre las hipótesis
Tabla 7. Criterios para aceptar o rechazar la hipótesis nula en la comparación de dos medias x1 y x2 ; para n> 30
Hipótesis
nula
Hipótesis
alterna
Desechar la hipótesis
nula
Aceptar la hipótesis nula
o reservarse el juicio
1 2 1 2 z z z z
1 2 1 2 z z z z
1 2 1 2 2
z z ó 2
z z 2 2
z z z
Tabla 8. Criterios para aceptar o rechazar la hipótesis nula en la comparación de dos medias, x1 y x2 para n ≤ 30
Hipótesis
nula
Hipótesis
alterna
Desechar la hipótesis
nula
Aceptar la hipótesis nula
o reservarse el juicio
1 2 1 2 t t t t
1 2 1 2 t t t t
1 2 1 2 t t 2
ó t t 2
t t t 2 2
Ejemplo 14:
288
El rendimiento diario de un reactor determinado durante 10 días (una prueba por dia) fue 92.30 con una desviación estándar de 0.65. Si cierto tiempo después se realizaron otras 10 pruebas para el reactor, con algunas modificaciones ligeras en él, en las cuales se obtuvo un rendimiento promedio de 92.59 con una desviación estándar de 0.37, afectó el rendimiento promedio las modificaciones realizadas?. Para responder la pregunta, las hipótesis apropiadas son: Hipótesis nula H0 1 2: .
Hipótesis alterna H1 1 2: .
ya que interesa saber si los rendimientos son iguales o no. Para realizar la prueba previamente se debe tener información sobre las varianzas; si ellas son conocidas, desconocidas, iguales o diferentes. Como se tienen estimados de las desviaciones estándar de los rendimientos, s1=0.65 y s2=0.37, y como en el ejemplo 11 se encontró que no había diferencias en las desviaciones estándar para los dos conjuntos de medidas 1 2 , la prueba que
se hará es para desviaciones desconocidas e iguales. Dado que el número de datos n1 y n2, es menor que 30, se usará el estadístico t para la prueba y su valor está dado por:
1 2
1 2
1 1
x xt
sn n
el valor de s
2 es:
2 2
2 1 1 2 2
1 2
( 1) ( 1)
2
n s n ss
n n
como n1 = n2
2 2 2 2 2
1 2
1 1( ) (0.65) (0.37) 0.28
2 2
0.53
92.3 92.591.22
20.5310
s s s
s
t
Si se toma α=5%, con 1 2 2 18n n , el valor de t2
=2.10
289
Al comparar t2
=2.10 con el valor de t calculado se observa que 2
t t , lo que
implica que se acepta la hipótesis nula H0 y por lo tanto se concluye que no hay evidencia estadística par afirmar que el rendimiento del reactor haya cambiado con las modificaciones realizadas.
5.6.3.3 Comparación entre las medias de dos conjuntos cuando se sospecha
que hay factores extraños que pueden influir en las determinaciones
individuales Los valores de xdi se generan así:
Conjunto 1 x 1,1 x 2,1 x 3,1 x 4,1 ……… x n-1,1 x n,1
Conjunto 2 x 1,2 x 2,2 x 3,2 x 4,2 ……… x n-1,1 x n,1
Diferencias x d1 x d2 x d3 x d4 ……….. x dn
x di = x i,1 – x i,2 La prueba se realiza con las siguientes hipótesis:
Ho: 0d ox
H1 : 0d ox
Con un número de datos menor que 30 en cada conjunto se utiliza el estadístico t, y se calcula como:
0d
md
xt
s
donde:
2
2 1
( )
( 1)
n
di d
imd
x x
sn n
n : número de datos en cada conjunto. n = n1 = n2.
dx : la medida de las diferencias de valores
290
1
1 n
d di
i
x xn
Con el nivel de significancia especifico, α, se obtiene de una tabla el valor
2 2
( ( ) / 2)t P t t
La hipótesis nula se acepta si t calculado está contenido en el intervalo
t t t 2 2
, y se descarta si esta fuera de este intervalo
5.6.3.4 Comparación entre varios valores de medias En esta comparación se utilizarán las siguientes hipótesis
Ho: 1 2 3...... in
H1 : 1 2 3...... in
donde ni es el número de medias que se requieren comparar. La prueba se realizará con el estadístico F y la condición de que las varianzas
sean todas iguales para los n conjuntos de datos. Es decir, 1 2 3 ...in ,
El valor de F se calcula como:
2
2
p
e
sF
s
donde sp
2 es un estimado de la varianza de la población de datos y se
2 es también
un estimado de la varianza 2. La diferencia es que se
2 es un mejor estimado en el
que no aparecen los errores de método, mas sí en el valor de sp
2 , si dichos errores
existen. Si no existieran variaciones no-aleatorios los estimados se
2 y sp
2 serían
iguales. La presencia de factores no aleatorios que causan las diferencias entre las
medias muestrales, hacen que sp
2 sea mucho mayor que se
2 .Así, la razón entre sp
2
y se
2 , el valor de F calculado, es una medida de si pueden o no acontecer
diferencias entre las medias muestrales.
El mejor estimado se
2 , se calcula como:
291
ni
i
iik
ni
i
nk
k
iik
e
nn
xx
s
1
1 1
2
2
)(
)(
donde: ni : número de conjuntos, número de medias.
( ) :nk i número de medidas en el conjunto i.
Los grados de libertad asociados con se
2 son:
( )n nk i i
i
ni
1
se
2 , también puede obtenerse a partir de las varianzas de error dentro de cada
muestra.
s
n s
n ne
k i
i
ni
i
k i i
i
ni
2 1
2
1
1
( )
( )
El estimado de la varianza de la población de medias está dada por:
2
2 1
( )
1
in
i p
imp
i
x x
sn
donde:
x
n x
n
p
k i i
i
n
k i
i
n
i
i
( )
( )
1
1
.
El estimado de la varianza de la población, sp
2 , se puede obtener a partir de la
varianza de la población de medias 2
mps :
s n sp mp
2
0
2
292
donde: n nk0 , si todos los conjuntos tienen el mismo tamaño.
n
nn
n
ni
k i
k i
i
n
k i
i
ni
n
i
i
i
0
2
1
1
1
1
1
( )
( )
( )
.
con sp
2 hay asociados ni 1 grados de libertad.
En cada muestra la magnitud de errores aleatorios está dada por si
2
, pero no es posible a partir de una sola muestra estimar el error debido al método o errores de método. Los valores de F que son significativamente mayores que 1.0, indican que la diferencia entre las medias se debe a factores no aleatorios. Para decidir sobre la
prueba con un valor de ( ) determinado, se obtiene el valor de 2
F de una tabla. Si
el valor observado o calculado de F es mayor que 2
F leído se descarta la
hipótesis nula, en caso contrario se acepta. .Ejemplo 15: Resuelva el ejemplo 14 utilizando la comparación entre varios valores de medias. La prueba puede plantearse como: Existe una diferencia significativa entre los dos rendimientos promedio?. Hipótesis nula H0 1 2:
Hipótesis alterna H1 1 2:
Se tiene:
1 2
1 2
92.30 92.59
0.65 0.37
x x
s s
El valor estimado de la varianza combinada está dada por:
2 22 1
0.65 0.37 0.282
es
293
El estimado de la varianza de la población de medias es:
22
1
1 2
2 22
1
1
92.3 92.5992.44
2 2
92.3 92.44 92.59 92.44
in
mp i p
ii
p
mp
s x xn
x xx
s
2
2 2
2
2
0.0421
10 0.421
0.4211.5
0.28
mp
p mp
p
e
s
s s
sF
s
De una tabla para distribución F se obtiene 2
5.98F para
5% , p e 1 18, .
Como el valor observado de F es menor que 2
F (1.5 5.98), se acepta la
hipótesis nula; es decir no hay diferencias significativas entre las medias o no hay evidencia estadística para decir que son diferentes.
Ejemplo 16: La empresa Petrochemical Products Co recibió los resultados finales de la determinación del coeficiente global de transferencia de calor de un intercambiador nuevo fabricado por Heat Exchanger Manufacter, bajo ciertas condiciones de operación. Los valores reportados por el fabricante, en Btu/hft
2°F, fueron: 58, 61,
69, 72, 74, 66, 62, 71, 65, 67. Mediciones posteriores hechas en el intercambiador funcionando bajo condiciones de proceso, arrojaron los siguientes resultados, en Btu/hft
2°F: 60, 63, 58, 68, 73, 71, 62, 74, 66, 65.
Se puede asegurar que el intercambiador está operando con la misma característica de diseño? Para responder la pregunta se debe hacer una prueba de hipótesis sobre el valor verdadero del coeficiente de transferencia de calor UD, para las dos conjuntos de
datos reportados. Con este propósito se llamará 1 el valor verdadero del
coeficiente reportado por el fabricante (UD de diseño) y 2, el valor verdadero de las determinaciones del coeficiente UD en condiciones de operación en planta.
294
Como el número de datos es menor que 30, n 30, se usará el estadístico t en la prueba. Para decidir sobre la fórmula con la que se calculará el valor de t, es necesario realizar previamente una prueba de hipótesis sobre las varianzas de los dos conjuntos de datos, ya que las fórmulas para el cálculo de este estadístico dependen de si las varianzas son iguales o diferentes. Cálculo de los estimados de las medias:
10
1 ,1
1
1
10i
i
x x
1
1
158 61 65 ... 67
10
66.5
x
x
10
2 ,2
1
1
10i
i
x x
2
2
160 63 ... 65
10
66.0
x
x
Cálculo de los estimados de las varianzas:
10
22
1 ,1 1
1
2 2 2
1
2
1
1
9
1(58 66.5) ... (67 66.5)
9
26.5
i
i
s x x
s
s
10
22
2 ,2 2
1
2 2 2
2
2
2
1
9
1(60 66) ... (65 66)
9
29.78
i
i
s x x
s
s
Para la prueba de las varianzas se formularán las siguientes hipótesis:
Hipótesis nula H0: 2 2
1 2
Hipótesis alterna H1: 2 2
1 2
295
La prueba se hará con un nivel de significancia del 5%, 5% . Para este nivel
de significancia se obtiene de una tabla para la distribución F el valor de 2
F , y con
este valor se calculará 1
2
F .
0.0252
(9,9) 4.03F F
0.9751
2
1(9,9) 0.248
4.03F F
El valor de F calculado es:
2
1
2
2
26.50.89
29.78
sF
s
Como el valor de F calculado esta en el intervalo 0.248 ≤ F ≤ 4.03, se acepta la hipótesis nula; es decir, las dos varianzas son iguales con una probabilidad del 95%. Para la prueba de las medias de los valores del coeficiente de transferencia de calor global, se formularán las siguientes hipótesis Hipótesis nula H0 1 2:
Hipótesis alterna H1 1 2:
La prueba también se hará con un nivel de significancia del 5%, 5% .
Como las 2 son iguales, 2 2
1 2 , el valor de t se calcula con la ecuación:
1 2
1 2
1 1
x xt
sn n
con:
2 22 1 1 2 2
1 2
( 1) ( 1)
2
n s n ss
n n
Calculo de s
2:
2
2
(10 1)26.5 (10 1)29.78
10 10 2
28.14
s
s
296
1/ 2
66.5 66.0
1 1(28.14)10 10
0.21
t
t
El valor de t
2
se lee en una tabla para la distribución t de student con
1 2 2 18n n , grados de libertad. Este valor es:
0.0252
2.101t t
Como el valor de t calculado está en el intervalo -2.1 ≤ t ≤ 2.1, se acepta la hipótesis nula; es decir, el intercambiador de calor está operando con la misma característica de diseño.
5.7. Ejercicios propuestos 1. En la producción de viscosa, se purificaron cuatro tortas producto por el método
convencional y otras cuatro por un método en prueba. Los resultados de la purificación se midieron en términos de un parámetro que mide el encogimiento de la torta viscosa (Tabla 5).
Tabla 9. Producción de viscosa por el proceso convencional y el de prueba
Torta Proceso Convencional Proceso Prueba
1 1.817 1.577
2 1.716 1.703
3 1.785 1.553
4 1.735 1.540
Promedio 1.763 1.593
¿Existe alguna diferencia entre el resultado obtenido con el procedimiento nuevo y el resultado del método convencional?
2. ¿Cuáles son los intervalos de confianza del 99% para la media del siguiente
grupo: 1.254, 2.532, 1.489, 3.371, 1.986? 3. Obtener un intervalo de confianza del 95% para el rendimiento diario de un
reactor de ácido sulfúrico, a partir de los rendimientos: 91.37%, 91.45%, 93.13%, 92.87%, 91.65%, 91.96%, 92.28%, 92.57%, 92.93% y 92.79%; si se supiera que =0.75.
4. Se han obtenido los siguientes conjuntos de datos:
297
Prueba A: 134, 146, 104, 119, 124, 161, 107, 83, 113, 129, 97, 123 Prueba B: 70, 118, 101, 85, 107, 132, 94 ¿Existe alguna diferencia?
5.9. Bibliografía
Lazik, Zivorad R., “Design of Experiments in Chemical Engineering”, Wiley-VCH, Germany, 2004 Mickley, H.S., Sherwood, T.S., Reed, C.E., "Applied Mathematics in Chemical Engineering". McGraw, New Delhi, 1975. Smith, C., Pike, R., Murril, P., "Formulation and optimization of mathematical models", International texbook Company, Scranton,1970. Andersen, L.B. "Statistical methods extend your data". Chem. Eng., october, 1962. Idem., "Probability theory provides simple statistical models", Chem. Eng. November 1962. Idem., "How to use statistical inference", Chem. Eng., December,1962. Idem., "Statistical estimation gives measures of probable error", Chem. Eng., January 1963. Idem., "Tests and estimates of statistical mean"., Chem, Eng., february 1963. Idem., "Tests and estimates on the statistical variance", Chem. Eng., March 1963. Idem., "Regression analysis correlates relationships between variables". Chem. Eng., May 1963. Idem., "Multiple regression techniques correlate experimental data", Chem. Eng., june 1963.
298