análisis de mezclas liquidas multicomponente...

49
Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas Titulación: E.T.I.E.I. AUTOR: Javier Martín Ferré. DIRECTOR: Eduardo Llobet Valero. FECHA: Agosto / 2006

Upload: buidang

Post on 19-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas

quimiométricas

Titulación: E.T.I.E.I.

AUTOR: Javier Martín Ferré. DIRECTOR: Eduardo Llobet Valero.

FECHA: Agosto / 2006

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

2

1. Índice

1. Índice 2. Objetivo 3. Introducción

3.1. El descubrimiento de la luz infrarroja 3.2. El espectro electromagnético 3.3. El infrarrojo cercano 3.4. Radiación en la materia 3.5. Transmitancia

4. Puesta a punto del sistema de medida con el espectrofotómetro IR del DEEEA 4.1. Información Espectral

4.2. Espectrofotómetro de Infrarrojo por transformada de Fourier VERTEX 70 4.2.1. General 4.2.2. Características

4.3. Omni-cell Specac 4.4. Elección de los compuestos a analizar

4.4.1. P-Xileno 4.4.2. Metanol

4.5. Frecuencia del cristal móvil y de la apertura del haz de luz 4.6. Elección de la frecuencia del cristal móvil y de la apertura del espectrofotómetro 5. Realización de las medidas experimentales 5.1. Elección de las concentraciones de los compuestos 5.2. Software OPUS 5.0 for QA/QC 5.3. Formato de los ficheros obtenidos en el laboratorio

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

3

6. Adecuación de los datos obtenidos en el laboratorio

6.1. Creación del fichero Microsoft Access Table Shortcut: nir_final, para uso con Matlab.

6.1.1. conc 6.1.2. lamda 6.1.3. spec

6.2. Orden de los espectros 6.3. Outliers 6.4. Muestras erróneas 6.5. Volumen de información obtenido

7. Procesamiento con técnicas quimiométricas 7.1. Utilización e Interpretación de las Técnicas de Regresión y Correlación 7.2. Procesamiento con técnicas quimiométricas

7.2.1. Principal Component regression 7.2.2. Partial Least Squares

7.3. Carga del fichero nir_final 7.4. Selección de datos para el entrenamiento del modelo de regresión

7.4.1. Datos para el Modelo de regresión tipo A (70% - 30%) 7.4.2. Datos para el Modelo de regresión tipo B (cruz)

7.5. Selección de datos para análisis con Metanol o p-Xileno 7.6. Centrado de los espectros 7.7. Creación de la matriz de regresión ‘b’ 7.8. Número de variables latentes 7.9. Creación de la matriz ‘y’ utilizando los datos de entrenamiento como datos de validación 7.10. Creación de la matriz ‘y’ utilizando datos no usados anteriormente para la validación 7.11. Código Básico 7.12. Tabla de resultados (Coeficiente de correlación)

8. Conclusiones 9. Bibliografía

9.1. Libros consultados 9.2. Páginas Web

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

4

2. Objetivo

En el “Departament d’Enginyeria Electrònica, Elèctrica i Automàtica” de la Universitat Rovira i Virgili de Tarragona. Exactamente, en el laboratorio 123 de la “Escola Tècnica Superior d’Enginyeria” se encuentra el espectrofotómetro Vertex 70 de la casa Bruker. El objetivo de este proyecto es el análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR.

Este propósito se alcanza realizando una serie de pasos intermedios que se han seguido. En primer lugar se ha realizado la puesta a punto del espectrofotómetro IR para el análisis de muestras liquidas, acoplando los accesorios adecuados para el soporte de las soluciones analizadas en el habitáculo del espectrofotómetro.

En segundo lugar se ha procedido a la realización de las medidas

experimentales utilizando el correspondiente software OPUS for QA/QC y el espectrofotómetro vertex 70 de Bruker.

En tercer lugar se ha procedido a la adecuación de los datos obtenidos en el

laboratorio modificando el formato de los ficheros que contienen la información espectral y realizando una selección de información.

En cuarto lugar se ha realizado la extracción de las características de los

espectros mediante el procesamiento con técnicas quimiométricas utilizando los métodos PLS (Partial Least Squares) y PCR (Principal Component Regresion).

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

5

3. Introducción

3.1. El descubrimiento de la luz infrarroja

En el año 1800 el astrónomo Friedrich Wilhelm Herschel analizó el espectro de

luz del sol. Herschel creó el espectro dirigiendo la luz del sol a través de un prisma de cristal de modo que la luz fuera dividida en sus diferentes colores. Midió la capacidad térmica que tenia cada color usando termómetros con bombillas ennegrecidas.

Cuando midió la temperatura notó una tipo de radiación invisible un poco más

allá de la parte roja del espectro. Cual fue su sorpresa cuando notó que el área cercana a la parte roja, en un área al parecer desprovista de la luz del sol, tenía la capacidad de calefacción más alta de todas.

Herschel concluyó que más allá de la parte roja del espectro debería haber una

clase diferente de luz, que no era visible al ojo humano. Esta clase de luz es conocida como luz "infrarroja". Herschel entonces colocó un contenedor lleno de agua entre el prisma y el

termómetro y observo que la temperatura era moderadamente inferior que la que había medido sin el agua.

Por consiguiente, el agua parcialmente debería absorber la radiación. Además, Herschel podría demostrar que dependiendo de como fuera colocado el

prisma, variaba moderadamente la temperatura para cada color. Este era el principio de la espectroscopia infrarroja que mide la luz infrarroja que

es absorbida por una sustancia. Esta absorción depende de la longitud de onda de la luz.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

6

3.2. El espectro electromagnético

La luz visible y la infrarroja son dos tipos de radiación electromagnética, pero con longitudes de onda o frecuencias diferentes. En general, la radiación electromagnética se define con la letra ‘l’ de longitud de onda o la ‘n’ de frecuencia lineal.

Figura 1. Radiación electromagnética

La longitud de onda es el distancia entre dos máximos sobre una onda

sinusoidal. La frecuencia es el número de longitudes de ondas por unidad de tiempo. Puesto

que todas las ondas electromagnéticas viajan a la misma velocidad, la velocidad de la luz, la frecuencia correspondiente a una longitud de onda puede ser calculada:

lcn /=

De acuerdo con la ley de radiación de Planck, la frecuencia de la radiación

electromagnética es proporcional a su energía:

nhE ⋅=

En la espectroscopia infrarroja, el número de onda, se usa para describir la radiación electromagnética.

El número de onda es el número de longitudes de onda por distancia de unidad. Para una longitud de onda en micras, ‘l’, el número de onda, da la n, en 1−cm :

ln /10000= para un número de onda ‘l’ en micras.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

7

3.3. El infrarrojo cercano

Las frecuencias del espectro electromagnético van desde las de menor longitud de onda, como son los rayos cósmicos, los rayos gamma y los rayos X, pasando por la luz ultravioleta, la luz visible y los rayos infrarrojos, hasta las ondas electromagnéticas de mayor longitud de onda, como son las ondas de radio. En cualquier caso, cada una de las categorías es de ondas de variación de campo electromagnético.

Existe un rango de frecuencias denominado infrarrojo cercano. Su rango en

número de onda es de 12500 1−cm a 4000 1−cm .

Figura 2. Espectro electromagnético

La medición de los espectros en el infrarrojo cercano es muy rápida y su análisis a través de técnicas quimiométricas es sencillo y efectivo. La aplicación principal del NIR es la identificación y el análisis cuantitativo de componentes que tengan agrupaciones funcionales formadas por uniones H-C, H-N, H-O entre otras.

Para cada frecuencia que absorbe la molécula corresponde cierto movimiento

molecular. De hecho se puede ver que clase de movimientos se producen midiendo su espectro.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

8

3.4. Radiación en la materia

Si la materia es expuesta a la radiación electromagnética, por ejemplo a la luz infrarroja, la radiación puede ser absorbida, transmitida, reflejada, dispersada o puede sufrir la fotoluminiscencia.

La fotoluminiscencia es un término que se usó para designar un tipo de efectos

como la fosforescencia y la dispersión de Raman.

Reflexión Transmisión

Figura 3. Reflexión. Figura 4. Transmisión

Absorción Dispersión

Figura 5. Absorción Figura 6. Dispersión

En el presente proyecto se va realizar un análisis de la transmitancia de los elementos que se van a usar, Metanol y Xileno.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

9

3.5. Transmitancia

La figura muestra un haz de radiación paralela antes y después de que ha pasado a través de una capa de solución que tiene un espesor de b cm. y una concentración c de una especie absorbente.

Figura 7. Transmitancia

Como consecuencia de interacciones entre los fotones y las partículas

absorbentes, la potencia del haz es atenuada. La transmitancia T de la solución es entonces la fracción de la radiación incidente transmitida por la solución:

oII

T =

La transmitancia se expresa a menudo como porcentaje:

100% ×=oII

T

Es más frecuente utilizar el concepto de absorbancia, o densidad óptica, la absorbancia es definida como:

A? = - log10(I / I0)

Donde I es la intensidad de la luz con una longitud de onda específica ? y que es pasada por una muestra (intensidad de la luz transmitida) y I0 es la intensidad de la luz antes que entre a la muestra (intensidad de la luz incidente). De acuerdo con estas expresiones, si la muestra no absorbe radiación, I y oI coinciden, por lo tanto A? = 0, y se transmite toda la radiación T = 1 (100% de transmitancia).

Si, en otro caso, se transmite solo un 1% de radiación (T=0.01), la absorción de radiación que ha tenido lugar corresponde a A=2. La absorbancia está relacionada con la concentración de la sustancia, c, por la ley de Lambert- Beer, que se resume con la ecuación: A = e b c, donde c se expresa en [ ]l

mol , b es la longitud del camino óptico

(anchura de la célula que contiene la disolución de la sustancia) y se expresa en [cm], y e es la absortividad molar, propiedad característica de cada sustancia correspondiente a la cantidad de radiación que absorbe a una longitud de onda determinada, siendo sus

unidades

⋅ cmmoll

.

Debido a que A y e varían con la longitud de onda es importante conocer para que longitudes de onda tienen su máximo valor, para ello es necesario obtener previamente el espectro de absorción de la sustancia, lo que se consigue representando gráficamente los valores de absorbancia frente a la longitud de onda expresada en manómetros.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

10

4. Puesta a punto del sistema de medida con el espectrofotómetro IR del DEEEA

4.1. Información Espectral

El diseño de la mayoría de interferómetros que se usan para la espectrometría IR están basados en el interferómetro original de dos rayos de luz originalmente diseñado por Michelson en 1891. Muchos otros interferómetros de dos rayos de luz han sido diseñados subsecuencialmente desde entonces y muy seguramente estos hayan sido dotados de mayor funcionalidad y aplicabilidad que el interferómetro original de Michelson. La forma mas simple del interferómetro de Michelson se muestra en la siguiente figura.

Figura 8. Interferómetro de Michelson

Consta de dos espejos perpendiculares. El espejo móvil se puede mover sobre el eje paralelo al plano del espejo fijo. El espejo móvil se mueve a una velocidad constante o se posiciona en diversos puntos sobre su eje durante periodos cortos de tiempo pasando de unos a otros a gran velocidad. Entre el espejo fijo y el móvil se encuentra el separador de luz, donde un haz de luz IR procedente de una fuente externa se refleja parcialmente hacia el espejo fijo (F). El resto de la luz se transmite parcialmente al espejo móvil (M). Cuando los haces de luz retornan al separador de luz, estos interfieren y son reflejados y transmitidos parcialmente.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

11

A causa del efecto de la interferencia, la intensidad del haz de luz que llega al detector y la intensidad del haz de luz que se devuelve a la fuente depende de la distancia que recorren los haces en los dos brazos del interferómetro. La variación entre la intensidad del haz de luz que llega al detector y la intensidad del haz de luz que retorna a la fuente como función de la distancia recorrida produce la información espectral.

La información espectral se ve concretada en los espectros. Un espectro es el

conjunto de ondas o más concretamente, la radiación lumínica que transmite la sustancia analizada.

Dicha radiación puede ser usada para identificar la sustancia analizada. Los

espectros se pueden observar mediante espectroscopios basados en el interferómetro original de Michelson que, además de permitirnos observar el espectro, permite realizar medidas sobre éste, como la longitud de onda o la frecuencia de la radiación.

Desde la creación del primer interferómetro, a principios del siglo XX, se ha

producido un desarrollo tecnológico rápido y considerable. Los espectrofotómetros de primera generación eran todos dispersivos. Inicialmente, los elementos dispersivos eran prismas, y posteriormente se cambiaron por rejillas.

A mitad de los años 60, la espectroscopia IR fue testigo de un mejoría puesto a que se empezó a utilizar la espectroscopia IR por transformada de Fourier (FT-IR). Esos fueron los espectrofotómetros de segunda generación. En su interior estaban provistos de un interferómetro de Michelson. Estaban dotados de grandes ventajas respecto a los espectrofotómetros dispersivos. Ventajas del FT-IR sobre los Dispersivos

- Mayor velocidad y sensibilidad. Un espectro completo se puede obtener mediante un solo barrido, ya que el detector observa todas las frecuencias de manera simultanea.

- Láser interno de referencia. La utilización de un láser de helio-neon como referencia interna proporciona una calibración automática con exactitud superior a 0.01 1−cm . Esto evita la necesidad de utilizar una calibración externa.

- Sistema de diseño sencillo, con pocas partes en movimiento que minimizan el desgaste.

- Elimina la mayor parte de las interferencias obteniéndose unos espectros mucho más limpios.

- Poseen sistemas informáticos con librerías y con procesamiento de datos rápido y eficaz

Hoy en día, todos los espectroscopios que realizan espectroscopia en el infrarrojo cercano lo hacen por transformada de Fourier. Su uso esta destinado a campos como la química analítica, la ciencia de la vida, procesos y muchos otros campos más.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

12

4.2. Espectrofotómetro de Infrarrojo por transformada de Fourier VERTEX 70

4.2.1 General

El Vertex 70 es un espectrofotómetro FT-IR totalmente digital usado para mediciones mediante funciones automáticas que permiten reconocer parámetros químicos de manera rápida.

Sus componentes ópticos tales como la fuente, el detector y el separador de haz

de luz, están controlados electrónicamente de modo que el firmware del espectrofotómetro puede reconocerlos.

Esta información se pasa al software de la aplicación que a su tiempo carga los

parámetros experimentales apropiados automáticamente. El chequeo permanente online de los componentes del espectrofotómetro facilita información continuada por defecto.

Figura 9.1. Vertex 70

La adquisición de datos se basa en un convertidor A/D de 24 bits de rango

dinámico. El convertidor A/D esta integrado en su detector electrónico de preamplificación. La tecnología DigiTec asegura una transmisión de señal libre de interferencias y garantiza el mayor proporción signal-to-noise ratio.

El Vertex 70 se controla por un equipo en el que su sistema operativo es

Microsft Windows y tiene instalado el software espectroscópico OPUS. La conexión Ethernet permite la posibilidad de controlar el espectrofotómetro vía Internet

La configuración estándar del espectrofotómetro esta pensada para la

adquisición de datos en la región media del IR. Opcionalmente, el Vertex 70 puede ser equipado con óptica adicional para cubrir todo el rango espectral desde el infrarrojo lejano a 30 1−cm hasta el canal visible a 25000 1−cm . El rango espectral puede ser cambiado fácilmente gracias a los componentes ópticos prealineados y al espectrofotómetro alineado permanentemente.

.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

13

4.2.2. Características

El VERTEX 70 es un espectrofotómetro versátil para aplicaciones exigentes en laboratorios analíticos y de investigación.

Su rango estándar es de 7.800 1−cm a 370 1−cm con posibilidad de expansión a IR

lejano y cercano de 25.000 1−cm a 30 1−cm . Su resolución es de 0,5 1−cm con opción para 0,2 1−cm . Con 8 velocidades de

barrido del espejo móvil seleccionadas mediante OPUS. Su opción "Rapid-scan" permite realizar hasta 40 espectros por segundo a 8 1−cm

de resolución. Posee la opción de "Step scan" para experimentos de modulación de fase y

resolución temporal. El equipo incluye una conexión ethernet con el PC de control del laboratorio. Admite hasta dos detectores MCT en el compartimiento de detectores y dispone

de compartimentos internos para fuentes y divisores de haz.

Figura 9.2. Vertex 70

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

14

4.3. Omni-cell Specac

Para el análisis de las muestras liquidas mediante el espectrofotómetro Vertex 70 es necesaria la utilización de un modulo o célula contenedora que permite realizar el análisis adecuado.

Se ha empleado la célula omni-cell de la casa Specac

para el análisis de las substancias utilizadas en el desarrollo de el presente proyecto.

Es ideal para el análisis de líquidos por transmitancia,

análisis cuantitativos y de líquidos volátiles tales como los que se usan en el proyecto.

Este módulo es fácil de montar y las ventanas se

pueden cambiar, así mismo, las ventanas y los espaciadores son compatibles con células antiguas.

Figura 10.1. Omnicell specac

Figura 10.2. Omnicell specac

El uso de la omni-cell es un sistema novedoso para el análisis de muestras

liquidas en la espectroscopia por transmitancia – una célula puede ser usada para todas las aplicaciones. El hecho de que esta célula sea desmontable es ideal para cualquier líquido. Su gran característica es la capacidad de desmontarse lo que permite limpiarlo fácilmente y cambiar las ventanas y los espaciadores.

La célula es compatible con el espectrofotómetro FT-IR Vertex 70 y también se podría usar para otros espectrofotómetros más antiguos.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

15

4.4. Elección de los compuestos a analizar

Se han elegido dos compuestos para la realización de las medidas experimentales: p-Xileno y Metanol. Los espectros de ambos compuestos se diferencian fácilmente a primera vista y son elementos que no reaccionan entre si.

4.4.1. P-Xileno

El Xileno es un líquido incoloro de olor dulce que se inflama fácilmente. Se encuentra naturalmente en el petróleo y en alquitrán. Las industrias químicas producen Xileno a partir del petróleo. El Xileno es una de las 30 sustancias químicas más producidas en los Estados Unidos en términos de volumen.

Figura 11. p-Xileno

Hay tres formas de Xileno en las que la posición de los grupos metilos en el

anillo de benceno varía: meta-Xileno, orto-Xileno y para-Xileno (m-, o- y p-Xileno), estas formas se conocen como isómeros. El Xileno se usa como disolvente en la imprenta y en las industrias de caucho y cuero. También se usa como agente de limpieza, diluyente de pintura y en pinturas y barnices. Pequeñas cantidades se encuentran en el combustible de aviones y en la gasolina.

4.4.2. Metanol

El compuesto químico Metanol (también conocido como alcohol metílico o alcohol de madera) es el alcohol más sencillo. Es un líquido ligero, incoloro, inflamable y tóxico que se emplea como anticongelante, disolvente y combustible. Su fórmula química es OHCH 3 .

Figura 12. Metanol

Es un disolvente industrial y se emplea como materia prima en la fabricación de formaldehído. El Metanol también se emplea como anticongelante en vehículos, combustible de bombonas de camping-gas, disolvente de tintas, tintes, resinas y adhesivos. El Metanol aunque es muy tóxico como su olor o ingerirlo, es muy importante también en la fabricación de medicinas: por eso la dependencia de él. Además el mundo desarrolla y apuesta por las pilas de combustible, se trabaja en su aplicación en base al Metanol que puede extraerse de productos vegetales e integraría un proceso de generación natural ecológica y sostenible.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

16

4.5. Frecuencia del cristal móvil y de la apertura del haz de luz

El software de control OPUS for QA/QC del espectrofotómetro Vertex 70 nos permite, además de muchas otras variables y características, controlar las siguientes condiciones de trabajo del espectrofotómetro.

- Apertura: La apertura del hueco por donde pasa el haz de luz desde la fuente emisora IR.

- Frecuencia: La velocidad que imprimiremos en el espejo móvil del espectrofotómetro.

La elección correcta del valor asignado a estas dos variables es importante puesto que en caso contrario la calidad de la información espectral obtenida puede ser alterada. Para obtener espectros con el máximo de información donde las curvas se vean bien marcadas y las características de los espectros no se confundan con ruido, se debe ajustar la apertura del paso de la luz desde la fuente lo mas abierta posible para recibir la información con la mayor claridad posible. En todo caso, va a ser en el análisis quimiométrico, donde se va a determinar la diferencia entre ruido e información y se va a seleccionar de entre toda la información la que más interese. Sucede que el hecho de abrir excesivamente esta apertura produce efectos negativos a causa de la saturación percibida en el detector. El detector percibe mayor intensidad lumínica de la que este puede recibir. Este es un grave problema y se debe rectificar ajustando correctamente la apertura del hueco por donde pasa el haz de luz IR. Para obtener espectros con rapidez y abarcar un amplio abanico de frecuencias, se debe ajustar la frecuencia del movimiento del espejo móvil del espectrofotómetro. Aumentado el valor de la frecuencia del escáner disminuimos el tiempo de ejecución de los espectros. La resolución de los espectros es inversamente proporcional a la frecuencia del escáner asignado.

4.6. Elección de la frecuencia del cristal móvil y de la apertura del espectrofotómetro

Con motivo de evitar los efectos de saturación explicados en el apartado anterior, se ha probado el análisis de los tres elementos que se usan en este proyecto. Se han tomado muestras de cada elemento por separado: Triclorotrifluoretano, Metanol, p-Xileno. Para cada uno se han realizado análisis a frecuencias y aperturas del haz diferentes y tras una mera observación del aspecto de los espectros se ha determinado la presencia o no de efectos de saturación. Para elegir una buena apertura y una buena velocidad del escáner se ha experimentado en primer lugar con el análisis de transmitancia del Triclorotrifluoretano. Se han realizado diversos escáneres cogiendo como “background” la propia transmitancia que produce la cela portadora de líquidos sin ningún compuesto en su interior con tal de escoger los valores adecuados sin que se produzca saturación.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

17

En la siguiente imagen se muestra el aspecto de los espectros y sus efectos de saturación de una solución que tan solo contiene Triclorotrifluoretano .

Los siguientes espectros se han realizado con los valores de apertura del haz de luz y de velocidad de escáner detallados en el cuadro siguiente. Cada uno de los espectros, con colores diferentes, corresponde a diferentes valores de apertura del haz de luz y de velocidad de escáner.

Figura 13. Triclorotrifluoretano

En el siguiente cuadro se muestra con que valores se satura el detector del

espectrofotómetro Vertex 70.

Apertura del haz de luz Velocidad Escáner en KHz

1 mm

1,5 mm

2 mm

2,5 mm

3 mm

6 mm

1.6 KHz

V

V

V

Sat

Sat

Sat

2,5 KHz

X(V)

V

V

V

V

X(Sat)

V: El resultado es apto. Sat: El resultado presenta efectos de saturación. X(V):Indica que no se ha realizado el análisis pero se supone resultado apto. X(sat): Indica que no se ha realizado el análisis pero se supone saturación.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

18

En segundo lugar, se ha experimentado con el análisis de admitancia del Triclorotrifluoretano con una concentración de Metanol del 10%.

Los siguientes espectros se han realizado con los valores de apertura del haz de luz y de velocidad de escáner detallados en el cuadro siguiente. Cada uno de los espectros con colores diferentes corresponde a diferentes valores de apertura del haz de luz y de velocidad de escáner.

Figura 14. Metanol 10%

En el siguiente cuadro se muestra con que valores se satura el detector del

espectrofotómetro Vertex 70.

Apertura del haz de luz Velocidad Escáner en KHz

1 mm

1,5 mm

2 mm

2,5 mm

3 mm

6 mm

1.6 KHz

V

V

V

Sat

X(Sat)

X(Sat)

2,5 KHz

X(V)

X(V)

V

V

Sat

X(Sat)

V: El resultado es apto. Sat: El resultado presenta efectos de saturación. X(V):Indica que no se ha realizado el análisis pero se supone resultado apto. X(sat): Indica que no se ha realizado el análisis pero se supone saturación.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

19

En tercer lugar, se ha experimentado con el análisis de admitancia del

Triclorotrifluoretano con una concentración de p-Xileno del 10%. Los siguientes espectros se han realizado con los valores de apertura del haz de

luz y de velocidad de escáner detallados en el cuadro siguiente. Cada uno de los espectros con colores diferentes corresponde a diferentes valores de apertura del haz de luz y de velocidad de escáner.

Figura 15. p-Xileno 10%

En el siguiente cuadro se muestra con que valores se satura el detector del

espectrofotómetro Vertex 70.

Apertura del haz de luz Velocidad Escáner en KHz

1 mm

1,5 mm

2 mm

2,5 mm

3 mm

6 mm

1.6 KHz

V

V

V

Sat

X(Sat)

X(Sat)

2,5 KHz

X(V)

X(V)

V

V

X(V)

X(V)

V: El resultado es apto. Sat: El resultado presenta efectos de saturación. X(V):Indica que no se ha realizado el análisis pero se supone resultado apto. X(sat): Indica que no se ha realizado el análisis pero se supone saturación.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

20

A continuación se muestra un cuadro en el que se resumen los tres cuadros anteriores; Triclorotrifluoretano, p-Xileno y Metanol para comprobar con que características no se producen problemas de saturación en ninguno de los tres elementos.

Apertura del haz de luz Velocidad Escáner en KHz

1 mm

1,5 mm

2 mm

2,5 mm

3 mm

6 mm

1,6 KHz

V

V

* V *

Sat

Sat

Sat

2,5 KHz

V

V

V

* V *

Sat

Sat

V: No se ha notado saturación en ninguno. Sat: Ha habido saturación al menos en uno.

Se pretende escoger la máxima apertura del hueco por donde pasa el haz de luz sin que se produzca saturación y al mismo tiempo se quiere usar una velocidad del escáner [KHz] lo más baja posible. Si el espectrofotómetro FT-IR vertex 70 fuera óptimamente ideal y no existieran efectos de saturación se escogería: apertura = 6mm y velocidad = 1.6 KHz.

Efectivamente, el espectrofotómetro FT-IR del laboratorio no es ideal por lo

tanto hay que escoger los valores mas cercanos al ideal. Como se ve en el cuadro anterior, las condiciones mas cercanas a la esquina

superior derecha del cuadro, máxima apertura y mínima velocidad, sin que se produzca saturación son las marcadas como * V *. Así, la decisión final se reduce a dos posibilidades:

2mm y 1,6KHz ó 2,5mm y 2,5KHz

Se ha dado mayor importancia a la apertura del hueco por donde pasa el haz de luz, esto permite obtener mayor intensidad de señal en el detector, ante la importancia de la velocidad del escáner. Una excesiva velocidad no daría tiempo al sistema detector a procesar tanta información. Por lo tanto, se ha escogido la opción con la que se trabaja con una mayor apertura: 2,5mm y 2,5KHz

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

21

5. Realización de las medidas experimentales

5.1. Realización de las medidas experimentales

Una vez puesto a punto el espectrofotómetro del DEEEA, se ha iniciado la realización de medidas experimentales. Se ha obtenido un conjunto de muestras que contienen uno o más de los tres disolventes puros que son estos: p-Xileno, Metanol y Triclorotrifluoretano.

Para cada tipo de concentración se han tomado unas 20 muestras aproximadamente. La intención es cuantificarlos en concentración a partir de sus respectivos espectros en el infrarrojo cercano.

El Triclorotrifluoretano es el disolvente que se utiliza como agregado para el análisis de las otras dos substancias, Metanol y p-Xileno, de este modo la suma de los tres compuestos forman el 100% de la muestra.

5.2. Software OPUS 5.0 for QA/QC

El software OPUS ofrece un sistema extenso de rutinas útiles para proceso espectrales tales como calculadora de espectro, rutina de conversión de la absorbencia a transmitancia, rutina de corrección automática de la línea de fondo, rutina de búsqueda de máximos y mínimos y el muchísimos más.

Todas las funciones pueden ser usadas para espectros múltiples y se pueden

manipular al mismo tiempo. El rastreo y el manejo de los datos espectrales obtenidos en el laboratorio del DEEEA es muy sencillo y útil y este software posee una variedad de funciones interactivas que hacen del OPUS la herramienta ideal a parte de ser extremadamente fácil de utilizar.

Las funciones básicas de manipulación y de evaluación de los espectros, tales

como selección de máximos y de mínimos, corrección de la línea de fondo, integración y substracción espectral para el trabajo cuantitativo de zonas de los espectros, son herramientas que se han usado a la hora de extraer la características de los espectros obtenidos.

El OPUS ha proporcionado las rutinas de proceso que han resuelto las demandas

en el laboratorio.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

22

5.3. Formato de los ficheros obtenidos en el laboratorio

El software de control del espectrofotómetro Vertex 70 es el OPUS for QA/QC y se usa de modo que proporciona ficheros del tipo “OPUS spectrum”.

Por cada muestra realizada se crea un fichero del tipo “OPUS spectrum”. Aquí

se muestra como ejemplo parte de la información que contiene un fichero: Espectro:

- Número de onda Tabla de datos [ 1−cm ] - Transmitancia Tabla de datos [%]

Parámetros del espectro:

- Dados por punto 1 - Número de datos 1141 - Frecuencia del primero 9990.602243 - Frecuencia del segundo 1195.786369 - Y – Factor de escala 1.000000 - Y – Valor máximo 1.048212 - Y – Valor mínimo 0.000074 - Hora 06/10/2005 - Fecha 16:26:51.020 (GMT+2)

Parámetros ópticos: - Apertura 2 mm

- Separador de haz de luz CaF2 - Canal de medicion Sample Compartment - Detector RT-DLaTGS [Internal Pos.1] - Filtro Paso alto Abierto - Filtro Paso bajo Abierto - Filtro Óptico 40.0 - Ganancia preamplificador 0 - Canal de medición de background Sample Compartment - Comprobación de iniciación OFF - Fuente NIR -Velocidad escáner 2.50 - Sincronización externa OFF Parámetros -Transformada de fourier-: - Función de apodización Blackman-Harris 3-Term - Limite final de frecuencia para fichero 1200.000000 - Limite inicial de frecuencia para fichero 10000.000000 - Resolución de fase 32.000000 - Modo de corrección de fase Power Spectrum - Modo acumulación de fase No - Factor de sensibilidad cero 2

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

23

Parámetros del instrumento: - Limite superior plegable 15799.809570 - Limite inferior plegable 0.000000 - Número de onda del láser 15799.810000 - Posición absoluta del láser 59461 - Divisor de espacio para muestras 1 - Ganancia del señal actual 2 - Amplitud pico 2º canal 1 - Localización pico 2º canal 1 - Atraso amplitud pico 2º canal 1 - Atraso localización pico 2º canal 1 - Adquisición de datos 4 - Ganancia del señal actual 2º canal 1 - Humedad interferómetro 8 - Multiplicador de espacio para muestra 1 - Nº de scanner erróneos 0 - Temperatura de scanner 30.600000 - Desviación de velocidad máxima 1.004984 - Tiempo de scanner (seg) 9.232000 - Amplitud pico -13501 - Localización pico 1919 - Número de scans FW 4 - Atraso amplitud pico 12709 - Atraso localización pico 1889 - Número de scans BW 4 - Tipo de instrumento Vertex 70 - longitud focal 100.000000 - Cheque de inicio ON - Nº de muestras por scanner 8 - Nº de background por scanner 8 - Nº de muestra 2370 Parámetros de adquisición: - Modo de adquisición Double Sided,Forward-Backward - Modo del test de correlación 0 - Retraso antes de medición 0 - Retraso de estabilización 0 - Limite de frecuencia máxima deseado 15000.000000 - Limite de frecuencia mínima deseado 0.000000 - Scanner de la muestra 8 - Resultado del espectro Transmitancia - Resolución 16.000000 - Lista 16777255 - Ganancia del señal de la muestra Automático - Ganancia del señal del background Automático - Ganancia del señal de la muestra 2º canal Automático - Ganancia del señal del background 2º canal Automático

Se ha seleccionado la información básica, número de onda [1−cm ] y

transmitancia [%], y se ha prescindido del amplio volumen de información contenido en cada fichero original: Parámetros de adquisición, parámetros del instrumento, parámetros -Transformada de fourier-, parámetros ópticos, parámetros del espectro…

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

24

5.4. Elección de las concentraciones de los compuestos

Se han elegido una serie de concentraciones de p-Xileno y de Metanol para disponer de un buen margen de información para crear un modelo de regresión. En la siguiente tabla se muestran el número de muestras tomadas para cada concentración en tanto por ciento de Metanol y p-Xileno:

0 %

0.1 %

0.5 %

1 %

10 %

0 %

No(1)

20

19

24

No(2)

0.1 %

19

38

38

19

19

0.5 %

20

20

20

19

19

1 %

22

19

19

No(5)

21

10 %

No(3)

20

20

22

No(4)

No(1) no se ha incluido en las medidas experimentales este tipo de concentración

puesto que se trata de Triclorotrifluoretano 100%. Esta concentración fue usada para la determinación de la apertura y frecuencia del haz de luz y del espejo móvil respectivamente.

No(2) esta formada por 0% p-Xileno, 10%, Metanol y 90% Triclorotrifluoretano

y No(3) esta formada por 10% p-Xileno, 0%, Metanol y 90% Triclorotrifluoretano. Estas concentraciones fueron usadas para la determinación de la apertura y frecuencia del haz de luz y del espejo móvil respectivamente. No se han incluido en las medidas experimentales.

No(4) esta formada por 10% p-Xileno, 10%, Metanol y 80% Triclorotrifluoretano

y No(5) esta formada por 1% p-Xileno, 1%, Metanol y 98% Triclorotrifluoretano. No se han incluido en las medidas experimentales.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

25

6. Adecuación de los datos obtenidos en el laboratorio

Se han tomado en el laboratorio todas las medidas experimentales de todas las muestras utilizadas en el presente proyecto. Pero la herramienta usada en el laboratorio (Vertex 70) no tiene relación directa con la herramienta utilizada para el posterior análisis quimiométrico (Matlab). Es por ello que es precisa la adecuación de todos los datos obtenidos en el laboratorio.

Se han creado ficheros compatibles con Matlab, se ha prescindido de datos

erróneos y se ha inspeccionado el contenido de todo el volumen de información obtenido.

6.1. Creación del fichero Microsoft Access Table Shortcut: nir_final, para uso con Matlab.

Matlab es la herramienta usada en el presente proyecto para el análisis mediante

técnicas quimiometricas. Los ficheros descritos en el apartado anterior no pueden ser leídos desde Matlab. Dichos ficheros solo pueden ser abiertos por el software OPUS.

Desde OPUS han sido copiados uno por uno al portapapeles de Windows y

posteriormente pegados directamente en tablas de datos en el programa Matlab para el correspondiente análisis.

Se han creado tres matrices: conc, spec y lamda.

6.1.1. conc Contiene una matriz con el valor de las concentraciones de Metanol y de

p-Xileno [2 Columnas] de cada elemento analizado [440 Filas].

6.1.2. lamda

Contiene el valor del número de onda [1 Columna] perteneciente a cada frecuencia de la muestra tomada [777 Filas].

6.1.3. spec Contiene el valor de la transmitancia detectada a cada frecuencia [777 Filas] de

cada muestra tomada [440 Columnas]. Es la matriz más importante, la que contiene el mayor volumen de información.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

27

6.2 Orden de los espectros

Saber el orden en que se ha ido almacenando la información adquirida en el

laboratorio es importante puesto que con posterioridad se va a seleccionar que datos formaran parte del grupo de entrenamiento y cuales formaran parte del grupo de validación del modelo de regresión:

En el siguiente cuadro se describe el orden en el que se ha ido almacenando en la tabla spec, los espectros adquiridos en el laboratorio, y en la tabla conc, las concentraciones de los espectros.

Gráficamente se puede detectar sin necesidad de análisis matemático la

existencia de muestras erróneas y outliers. Las diferentes curvas de los espectros representan el nivel de transmitancia

obtenida (Y) en los 777 valores de número de onda (X) con los que se ha trabajado:

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

28

Figura 16. Tabla spec [777 × 440]

Esta es la apariencia de la tabla spec mostrada de modo gráfico. Cada espectro,

representado con un color diferente, pertenece a cada uno de las muestras adquiridas en el laboratorio. A la hora del análisis se prescinde de los outliers y su extracción forma parte de la adecuación de los datos obtenidos en el laboratorio.

6.3. Outliers

Un outlier es una observación que está a una distancia anormal de otros valores

en una muestra arbitraria de una población. En cierto modo, esta observación se ha definido para decidir que datos serán considerados anormales.

Antes de que observaciones anormales puedan ser seleccionadas, es necesario caracterizar observaciones normales.

La metodología utilizada para la detección de posibles outliers consta de una comprobación de los datos obtenidos. Se ha seguido un proceso rápido y válido de descarte de todas aquellas muestras cuyas graficas muestran una tendencia diferente a la de la mayoría de muestras.

Como resultado de este proceso no se ha determinado ningún outlier. No obstante se ha detectado otro tipo de datos que deben ser adecuados. Son las muestras erróneas.

6.4. Muestras erróneas

Durante la toma de datos en el laboratorio se producen errores y descuidos humanos y es preciso prescindir de ellos una vez localizados después de un meticuloso control de los datos. Si no se prescinde de ellos, esto puede provocar distorsiones en el sucesivo análisis.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

29

6.5. Volumen de información obtenido

Se han analizado alrededor de 20 tipos diferentes de concentraciones tal i como se explica en el apartado 5.1. Cada una con un contenido de Metanol i p-Xileno diferente.

De cada combinación se han tomado alrededor de 20 muestras obteniendo sus respectivos espectros y se han analizado 20 combinaciones de concentraciones diferentes explicadas en el apartado 5.1. con lo cual la suma de información obtenida consta de 440 espectros de combinaciones de Metanol y p-Xileno conocidas. De cada espectro se han tomado las mismas longitudes de onda, en total 777 longitudes de onda dispuestas en el intervalo de 10000 1−cm - 4000 1−cm .

Se describe la transmitancia para cada punto en el margen de frecuencias. El volumen de información se calcula con una simple ecuación:

20 muestras * 20 espectros/muestras * 777 transmitancias / espectros = 310800 transmitancias

Idealmente el nivel de transmitancia existente en cada punto del espectro toma un valor entre 0 y 1 pero no siempre es así puesto que en algunos casos excede de estos márgenes. Se obtiene una transmitancia con valores comprendidos entre 0 y 1 para 310800 puntos de frecuencia en diferentes concentraciones de Metanol y p-Xileno.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

30

7. Procesamiento con técnicas quimiométricas

7.1. Utilización e Interpretación de las Técnicas de Regresión y Correlación

Se han usado métodos que se emplean para conocer las relaciones y significación entre series de datos. Cuando, simultáneamente, contemplamos dos variables, surgen preguntas y problemas específicos. Esencialmente, se emplean técnicas de contraste de hipótesis específicos para resolver dichos problemas. La mayoría de estos métodos están encuadrados en las técnicas regresión y correlación.

Si se parte de un modelo en el cual una de las dos variables continuas es

dependiente o respuesta (y) y la otra es independiente o explicativa (x), surgen nuevos estadísticos para describir los datos.

La nube de puntos resultante de la representación gráfica de los datos está

"concentrada" en la recta de regresión de mejor ajuste obtenida por el método de mínimos cuadrados. Una condición previa, en las técnicas lineales, es que la nube de puntos debe tender a la linealidad. Los coeficientes de la regresión lineal, la ordenada en el origen (a) y la pendiente de la recta (b) se suelen presentar de la forma y´ = a + bx.

En las técnicas de correlación lineal es posible definir otro estadístico a partir del

las dos pendientes teóricas de las dos posibles rectas de regresión (y) sobre(x) y de (x) sobre (y). Este estadístico es el coeficiente de correlación r. Su cuadrado r2 es el coeficiente de determinación y da una medida entre 0 y 1 de la cantidad de información compartida por dos características o variables continuas en los datos.

7.2. Procesamiento con técnicas quimiométricas Se ha realizado el análisis de los espectros utilizando la matriz spec (espectros) y la matriz conc (concentraciones). Se pretende determinar la correlación existente entre las concentraciones de los compuestos, analizados simultáneamente, con los resultados de los espectros obtenidos mediante el espectrofotómetro FT-IR.

Se va a usar el hecho de que existe una correlación entre los espectros y las concentraciones para construir modelos de regresión tanto PLS como PCR que usen ambas matrices.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

31

7.2.1. Principal Component regression

Esta función es ideal para regresiones con matrices no acondicionadas. La

regresión se realiza a partir de la matriz de scores (T) y la matriz de loadings (P) puesto que son ortogonales y por lo tanto acondicionadas. La regresión PCR forma la matriz inversa definida por:

TT TTTPX 1)( −+ =

En Matlab la función funciona con las siguientes E/S: Las entradas son:

- La matriz de espectros (x). Bloque predictor. - La matriz de concentraciones (y). Bloque predicho. - número máximo de componentes principales a considerar (PC). - Variable opcional para suprimir salida intermedia (out).

Las salidas son: - La matriz de coeficientes de regresión para cada número de

componentes principales(b). Cada bloque de filas ny corresponde al modelo de PCR para ese número de componentes principales.

- Suma de información de los cuadrados (ssq). - Scores de X-block (t). - Loadings de X-block (p).

Formato de entradas y salidas:

[b, ssq, t, p, eigs] = pcr (x, y, PC, out);

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

32

7.2.2. Partial Least Squares

Este tipo de regresión es un método a medio camino entre:

- Método que pretende encontrar factores que capturen grandes cantidades de variancia. - Método que pretende encontrar un solo factor que mejor correlacione los datos ‘X’ y ‘Y’.

Calcula loadings (P) y scores (T) similares a los usados en la regresión PCR. Genera una matriz adicional de vectores llamados weights (W). Estos vectores son requeridos para mantener la ortogonalidad de scores.

La regresión PLS forma la matriz inversa definida por:

TTT TTTWPWX 11 )()( −−+ =

Las entradas son: - La matriz de espectros escalada (x). Bloque predictor. - La matriz de concentraciones escalada (y). Bloque predicho. - Número máximo de variables latentes a considerar (maxlv). - Variable opcional para suprimir salida intermedia (out).

Las salidas son: - La matriz de los vectores de regresión o matrices (b). - Fracción de varianza usada en la matriz x y la matriz y (ssq). - Loadings x (p). - Loadings y (q). - Matriz de Weights (W). - Scores x (t). - Scores y (u). - Coeficientes de relación interna (bin).

Formato de entradas y salidas:

[b, ssq, p, q, W, t, u, bin] = pls (x, y, maxlv, out);

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

33

7.3.Carga del fichero nir_final

Al cargar el fichero nir_final obtenemos las tres matrices básicas descritas en el apartado 6.1.

load f:\proyecto\nir_final

De este modo cargamos en el workspace de Matlab dichas matrices.

Figura 17. Workspace

7.4. Selección de datos para el entrenamiento del modelo de regresión

Se ha empezado seleccionando los datos empleados para el entrenamiento de la matriz de regresión. Se ha prescindido de los datos que se sabe que son erroneos y se ha realizado un centrado de los datos. Se va ha realizar el análisis con datos del tipo A (70% - 30%) y datos del tipo B (cruz).

El análisis tipo A (70% entrenamiento-30% validación)se refiere a un análisis en

el que los datos de validación son los mismos que se han usado para el propio modelo de regresión.

El análisis tipo B (Cruz) se refiere a un análisis en el que los datos de validación

son datos diferentes a los que se han usado para realizar el modelo de regresión aunque las concentraciones de los datos para validación y regresión son iguales.

Las características de estos datos se describen en los siguientes apartados.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

34

7.4.1. Datos para el Modelo de regresión tipo A (70% - 30%)

El análisis tipo A (70% - 30%), utiliza el 70% aproximadamente de todos los

espectros de todas las concentraciones que contiene la matriz original spec para el entrenamiento y utiliza el 30% restante para la posterior validación del método de regresión.

La matriz de regresión se crea a partir de la matriz de entrenamiento tipo A (70%

- 30%) [entrenamientoA] y se comprueba su validez a partir de la matriz validacionA. entrenamientoA = [spec(:,1:14), spec(:,20:34), spec(:,40:54), spec(:,62:76), spec(:,82:108), spec(:,120:132), spec(:,134), spec(:,141:154), spec(:,160:174), spec(:,180:193), spec(:,199:225), spec(:,237:251), spec(:,257:270), spec(:,276:290), spec(:,296:313), spec(:,321:334), spec(:,340:353), spec(:,359:373), spec(:,381:394), spec(:,400:413), spec(:,419:433)]; validacionA = [spec(:,15:19), spec(:,35:39), spec(:,55:61), spec(:,77:81), spec(:,109:119), spec(:,135:140), spec(:,155:159), spec(:,175:179), spec(:,194:198), spec(:,226:236), spec(:,252:256), spec(:,271:275), spec(:,291:295), spec(:,314:319), spec(:,335:339), spec(:,354:358), spec(:,374:380), spec(:,395:399), spec(:,414:418), spec(:,434:440)]; También se han creado dos matrices a partir de la matriz original conc para el entrenamiento con datos del tipo A (70% - 30%). Ambas contienen las concentraciones de los espectros contenidos en las matrices entrenamientoA y validacionA. concentrenA = [conc(1:14,:); conc(20:34,:); conc(40:54,:); conc(62:76,:); conc(82:108,:); conc(120:132,:); conc(134,:); conc(141:154,:); conc(160:174,:); conc(180:193,:); conc(199:225,:); conc(237:251,:); conc(257:270,:); conc(276:290,:); conc(296:313,:); conc(321:334,:); conc(340:353,:); conc(359:373,:); conc(381:394,:); conc(400:413,:); conc(419:433,:)]; concvalidaA = [conc(15:19,:); conc(35:39,:); conc(55:61,:); conc(77:81,:); conc(109:119,:); conc(135:140,:); conc(155:159,:); conc(175:179,:); conc(194:198,:); conc(226:236,:); conc(252:256,:); conc(271:275,:); conc(291:295,:); conc(314:319,:); conc(335:339,:); conc(354:358,:); conc(374:380,:); conc(395:399,:); conc(414:418,:); conc(434:440,:)];

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

35

7.4.2. Datos para el Modelo de regresión tipo B (cruz) El análisis del tipo B (cruz) utiliza los espectros que se han obtenido con valores de concentración mas extremas para el entrenamiento del método de regresión y usa los espectros con valores de concentraciones mas intermedios para la validación. En la siguiente tabla se marca en negrita los espectros con las concentraciones utilizadas para la validación del modelo de regresión y las otras concentraciones se usan para crear el modelo. De esta manera se pretende, en el proceso de validación, comprobar si el modelo es capaz de deducir el valor de unas concentraciones que no se han usado para elaborar el propio modelo de regresión.

0 %

0.1 %

0.5 %

1 %

10 %

0 %

No(1)

20

19

24

No(2)

0.1 %

19

38

38

19

19

0.5 %

20

20

20

19

19

1 %

22

19

19

No(5)

21

10 %

No(3)

20

20

22

No(4)

El código para la creación de las matrices de entrenamiento y de validación tanto de los espectros como de las concentraciones de cada espectro en el modelo del tipo B (cruz) se muestra a continuación:

entrenamientoB = [spec(:,1:119), spec(:,141:198), spec(:,276:284), spec(:,288:319), spec(:,321:339), spec(:,359:440)]; validacionB = [spec(:,120:132), spec(:,134:140), spec(:,199:260), spec(:,262:275), spec(:,340:358)]; concentrenB = [ conc(1:119,:); conc(141:198,:); conc(276:284,:); conc(288:319,:); conc(321:339,:); conc(359:440,:)]; concvalidaB = [ conc(120:132,:); conc(134:140,:); conc(199:260,:); conc(262:275,:); conc(340:358,:)];

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

36

7.5. Selección de datos para análisis con Metanol o p-Xileno Se ha realizado la transpuesta de las matrices que contienen los espectros para reordenar la información y hacerla útil y compatible con las matrices de concentraciones.

entrenamientoA = entrenamientoA'; validacionA = validacionA'; entrenamientoB = entrenamientoB'; validacionB = validacionB';

Aquí se muestra el paso en el que se escoge el análisis de Metanol o de p-Xileno escogiendo la primera(Metanol) o la segunda(p-Xileno) columna de las matrices concentrenB y concvalidaB. Para Metanol:

xblock1 = entrenamientoB; yblock1 = concentrenB(:,1); xblock2 = validacionB yblock2 = concvalidaB(:,1);

Para p-Xileno:

xblock1 = entrenamientoB; yblock1 = concentrenB(:,2); xblock2 = validacionB yblock2 = concvalidaB(:,2);

7.6. Centrado de los espectros Después de haber prescindido de datos erroneos se procede al centrado de las matrices que contienen los espectros: xblock1 y yblock1. Aquí el centrado se hace notar porque todas las variables son del mismo tipo y se espera que las transmitancias con la mayor variancia tal vez sean las que a la postre sean las mas predictivas para determinar las concentraciones.

[mxblock1,mx] = mncn(xblock1); [myblock1,my] = mncn(yblock1);

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

37

7.7. Creación de la matriz de regresión ‘b’

Ahora que los datos están escalados podemos usar las rutinas PLS y PCR para hacer una calibración. Se empieza usando todos los datos para crear modelos y ver cuanta variancia captura los datos. Se crea la matriz de regresión ‘b’ tanto para regresión PCR o PLS.

PLS

bpls = pls(mxblock1,myblock1,10);

Percent Variance Captured by PLS Model -----X-Block----- -----Y-Block-----

LV # This LV Total This LV Total ---- ------- ------- ------- -------

1 91.70 91.70 79.07 79.07 2 6.06 97.76 19.95 99.02 3 1.95 99.70 0.19 99.21 4 0.16 99.87 0.42 99.63 5 0.03 99.90 0.11 99.75 6 0.03 99.93 0.05 99.80 7 0.03 99.96 0.01 99.81 8 0.01 99.97 0.04 99.85 9 0.02 99.99 0.02 99.87 10 0.00 99.99 0.04 99.91

PCR

bpcr = pcr(mxblock1,myblock1,10);

Percent Variance Captured by PCR Model

-----X-Block----- -----Y-Block----- LV # This PC Total This PC Total

---- ------- ------- ------- ------- 1 91.81 91.81 76.18 76.18 2 5.96 97.76 22.65 98.83 3 1.97 99.73 0.29 99.12 4 0.13 99.87 0.47 99.59 5 0.05 99.92 0.01 99.60 6 0.03 99.95 0.02 99.62 7 0.02 99.97 0.00 99.62 8 0.01 99.98 0.17 99.79 9 0.00 99.99 0.00 99.79 10 0.00 99.99 0.01 99.79

Mirando en las tablas anteriores se puede observar que en la varianza capturada

por los modelos PCR y PLS, 1 variable es muy buena opción y que con 4 o mas ya no se producen grandes incrementos de varianza. Sin embargo, se debe realizar una validación cruzada para determinar el número óptimo de variables latentes.

Para ello se usa la función CROSSVAL que puede ser usada para realizar validaciones cruzadas de modelos PCA, PCR y PLS usando variedad de métodos.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

38

7.8. Número de variables latentes

Para crear la matriz de regresión ‘b’, que se explica en el apartado 7.7, se debe escoger el número de variantes latentes apropiadas.

Para ello se ejecuta la función CROSSVAL. Esta función realiza una validación cruzada para análisis regresivos con variables latentes.

Se ha realizado una validación en la que se divide los datos en bloques

continuos. Este método en gran parte evita el problema de tener ruido en el juego de prueba al ser correlacionado con el ruido en el juego de entrenamiento

Antes de usar CROSSVAL debemos decidir cuantas veces reconstruir y probar

el modelo. Se ha escogido probar con valor 10 ya que es razonable esperar que cualquier perturbación en este tipo de sistema se haya desvanecido después de 30 muestras.

El número máximo de Variables latentes ha de ser menor o igual a 318 ya que es

el número de variables que contiene ‘mxblock1’ pero se ha puesto un valor mas coherente con el número de variables que suelen ser útiles. Se ha puesto a 16 por tomar un simple ejemplo.

Se introducen los siguientes datos: -La matriz predictiva escalada anteriormente ‘mxblock1’ -La matriz de datos a predecir escalada ‘myblock1’ -El método de regresión en nuestro caso pls rápido ‘sim’ -El método de validación: bloque continuo de datos ‘con’ -Número de variables latentes a calcular ‘16’ -Número de secciones en los que separar los datos ‘10’

Se obtienen los siguientes datos:

-Suma de los cuadrados del error residual de cada subconjunto ‘plspress’ -Sumatorio del punto anterior ‘plscumpress’ El función introducida es:

[plspress,plscumpress] = crossval(mxblock1,myblock1,'sim','con',16,10);

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

39

Se muestra el tanto por ciento de variancia capturada:

También se muestra la siguiente grafica de la “root mean square error of cross-validation” para cada número de variables latentes (RMSECV) y la “root mean square error of cross-validation” para cada número de variables latentes (RMSEC).

De esta gráfica se escoge el número de variables latentes siguiendo dos recomendaciones. El número de variables latentes a de ser el menor posible y el valor de (RMSECV) y de (RMSEC) ha de ser el menor posible. En esta gráfica seria bueno escoger entre 2 y 4 variables latentes.

Figura 18. (RMSECV) y (RMSEC) para cada LV

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

40

7.9. Creación de la matriz ‘y’ utilizando los datos de entrenamiento como datos de validación

Se procede al uso del vector de regresión ‘b’ para el calculo de las concentraciones de las muestras obtenidas a partir de los espectros centrados y almacenados en la matriz ‘mxblock1’.

yplsA = mxblock1*bpls(2,:)';

El valor se reescala para obtener el valor real de la aproximación realizada.

syplsA = rescale(yplsA,my);

En el caso ideal, los valores de la matriz ‘syplsA’ deberían ser iguales yblock1. Evidentemente el resultado mostrado en la matriz ‘syplsA’ no es exactamente igual al esperado pero existe un nivel de correlación que determina la validez o no de la aproximación calculada con el método de regresión utilizado.

En este apartado se realiza la validación del método a partir de datos ya usados a la hora de realizar la propia regresión. Esto quiere decir que en la validación no se le presentas variables nuevas.

7.10. Creación de la matriz ‘y’ utilizando datos no usados anteriormente para la

validación

Para usar la matriz de regresión ‘b’ para crear la matriz ‘y’ a partir de los datos no usados anteriormente antes se debe trabajar en la escala en la que se a realizado el método de regresión, para ello se usa el escalado del bloque ‘xblock2’ con el vector de medias mx.

sxblock2 = scale(xblock2,mx);

Se procede al uso del vector de regresión ‘b’ para el calculo de las

concentraciones de las muestras obtenidas a partir de los espectros almacenados en la matriz ‘mxblock1’. Estos espectros ya estan centrados, y no se han usado anteriormente para elaborar la matriz de regresión.

yplsB = sxblock2*bpls(2,:)';

El valor se reescala para obtener el valor real de la aproximación realizada.

syplsB = rescale(yplsB,my);

En el caso ideal, los valores de la matriz ‘syplsB’ deberían ser iguales a los de ‘yblock2’ al igual que pasaba en el apartado anterior pero evidentemente el resultado mostrado en la matriz ‘syplsB’ no es exactamente igual al esperado. Se destaca una dificultad mayor a la que se en el punto anterior por el hecho de realizar una regresión a partir de un volumen de datos con menor variedad de concentraciones. También se nota mayor dificultad en esta regresión puesto que se realiza la validación a partir de datos no usados anteriormente. Esto quiere decir que en la validación se presentan valores de las variables no usadas anteriormente.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

41

7.11 Código Básico

A la hora de comprobar los resultados del proceso de regresión, se ha realizado diversas regresiones con diversos parámetros. Se han realizado análisis con parámetros diversos variando adecuadamente el código básico que se muestra a continuación:

entrenamientoA = [spec(:,1:14), spec(:,20:34), spec(:,40:54), spec(:,62:76), spec(:,82:108), spec(:,120:132), spec(:,134), spec(:,141:154), spec(:,160:174), spec(:,180:193), spec(:,199:225), spec(:,237:251), spec(:,257:270), spec(:,276:290), spec(:,296:313), spec(:,321:334), spec(:,340:353), spec(:,359:373), spec(:,381:394), spec(:,400:413), spec(:,419:433)]; concentrenA = [conc(1:14,:); conc(20:34,:); conc(40:54,:); conc(62:76,:); conc(82:108,:); conc(120:132,:); conc(134,:); conc(141:154,:); conc(160:174,:); conc(180:193,:); conc(199:225,:); conc(237:251,:); conc(257:270,:); conc(276:290,:); conc(296:313,:); conc(321:334,:); conc(340:353,:); conc(359:373,:); conc(381:394,:); conc(400:413,:); conc(419:433,:)]; validacionA = [spec(:,15:19), spec(:,35:39), spec(:,55:61), spec(:,77:81), spec(:,109:119), spec(:,135:140), spec(:,155:159), spec(:,175:179), spec(:,194:198), spec(:,226:236), spec(:,252:256), spec(:,271:275), spec(:,291:295), spec(:,314:319), spec(:,335:339), spec(:,354:358), spec(:,374:380), spec(:,395:399), spec(:,414:418), spec(:,434:440)]; concvalidaA = [conc(15:19,:); conc(35:39,:); conc(55:61,:); conc(77:81,:); conc(109:119,:); conc(135:140,:); conc(155:159,:); conc(175:179,:); conc(194:198,:); conc(226:236,:); conc(252:256,:); conc(271:275,:); conc(291:295,:); conc(314:319,:); conc(335:339,:); conc(354:358,:); conc(374:380,:); conc(395:399,:); conc(414:418,:); conc(434:440,:)]; entrenamientoB = [spec(:,1:119), spec(:,141:198), spec(:,276:284), spec(:,288:319), spec(:,321:339), spec(:,359:440)]; concentrenB = [ conc(1:119,:); conc(141:198,:); conc(276:284,:); conc(288:319,:); conc(321:339,:); conc(359:440,:)]; validacionB = [spec(:,120:132), spec(:,134:140), spec(:,199:260), spec(:,262:275), spec(:,340:358)]; concvalidaB = [ conc(120:132,:); conc(134:140,:); conc(199:260,:); conc(262:275,:); conc(340:358,:)]; entrenamientoA = entrenamientoA'; validacionA = validacionA'; entrenamientoB = entrenamientoB'; validacionB = validacionB'; xblock1 = entrenamientoA; /* Datos tipo A (70% - 30%) o tipo B (cruz) */ yblock1 = concentrenA(:,1); /* 1 Metanol o 2 pXileno */ xblock2 = validacionA yblock2 = concvalidaA(:,1); [mxblock1,mx] = mncn(xblock1); [myblock1,my] = mncn(yblock1); bpls = pls(mxblock1,myblock1,2); /* pls o pcr */ yplsA = mxblock1*bpls(2,:)'; syplsA = rescale(yplsA,my); sxblock2 = scale(xblock2,mx); yplsB = sxblock2*bpls(2,:)'; syplsB = rescale(yplsB,my); figure(1) plot(yblock1,syplsA,'o'); coef(1)=min(min(corrcoef(yblock1,syplsA))) figure(2) plot(yblock2,syplsB,'o');coef(2)=min(min(corrcoef(yblock2,syplsB)))

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

42

Se ha programado el código básico a partir del cual, realizando pequeñas

modificaciones, se puede realizar el mismo proceso pero con diferentes características. El código básico se modifica según los parámetros que se quieren modificar. Se puede modificar el código para realizar el proceso para metanol o para p-

Xileno, se puede modificar la función de regresión PLS o PCR y se puede modificar el tipo de datos A o B.

Se han hecho todas las modificaciones necesarias para obtener todas las

combinaciones posibles. Tres parámetros o características que pueden ser de dos tipos crean 823 = combinaciones.

Según lo indicado por la función CROSSVAL, para cada combinación, se ha

ejecutado el código con un número de variables latentes diferente. Se ha probado con entre 4 y 5 variables latentes para las 8 combinaciones. En

concreto, para 2 combinaciones se ha realizado el análisis con 5 variables latentes diferentes y para las otras 6 se ha realizado el análisis con 4 variables latentes diferentes. por lo que se obtiene 345246 =×+× análisis diferentes.

No hay que olvidar que el código básico ofrece dos resultados:

- Coeficiente de correlación utilizando datos de entrenamiento como datos de validación.

- Coeficiente de correlación utilizando datos no usados anteriormente para validación.

Se han obtenido en total 68234 =× resultados correspondientes a dichas combinaciones. Con cada análisis se han obtenido los resultados numéricos de correlación acompañados de sus respectivas graficas. En el presente proyecto no se han incluido las 68 graficas que muestran la relación lineal entre los resultados esperados y los resultados obtenidos.

Para escoger el número de variables latentes se ha ejecutado la función crossval

para las combinaciones de Xileno o Metanol y datos tipo A (70% - 30%) o tipo B (cruz). A continuación se muestran las gráficas con las que se han escogido el número de variables latentes.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

43

Metanol tipo A (70% - 30%)

Figura 19. (RMSECV) y (RMSEC) para cada LV para Metanol tipo A

Se ha escogido realizar 4 regresiones con 2 Lv, con 4 Lv, con 15 Lv y con 25 Lv.

Xileno tipo A (70% - 30%)

Figura 20. (MSECV) y (RMSEC) para cada LV para p-Xileno tipo A

Se ha escogido realizar 5 regresiones con 2 Lv, con 4 Lv, con 6 Lv, con 10 Lv y con 20 Lv.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

44

Metanol tipo B (cruz)

Figura 21. (RMSECV) y (RMSEC) para cada LV para Metanol tipo B

Se ha escogido realizar 4 regresiones con 2 Lv, con 8 Lv, con 12 Lv y con 20 Lv.

Xileno tipo B (cruz)

Figura 22. (MSECV) y (RMSEC) para cada LV para p-Xileno tipo B

Se ha escogido realizar 4 regresiones con 2 Lv, con 4 Lv, con 16 Lv y con 25 Lv.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

45

7.12. Tabla de resultados (Coeficiente de correlación)

Para mayor simplicidad en la descripción de los parámetros de un análisis se ha usado el siguiente código de identificación:

Usando la siguiente tabla, la expresión corcoef_Met.PLS.A.25 es el nombre que se le otorga al análisis realizado de Metanol, utilizando la técnica PLS, utilizando datos del tipo A (70% - 30%) , realizando el análisis con 25 Pc’s.

De este modo podemos presentar una tabla de resultados mas compacta:

Parámetros del análisis

Coeficiente de correlación utilizando datos de

entrenamiento como datos de validación

Coeficiente de correlación utilizando datos no usados

anteriormente para validación

corcoef_Met.PLS.A.02 0.99508 0.99445 corcoef_Met.PLS.A.04 0.99816 0.99852 corcoef_Met.PLS.A.15 0.99991 0.99982 corcoef_Met.PLS.A.25 0.99999 0.99988 corcoef_Met.PLS.B.02 0.99519 0.49565 corcoef_Met.PLS.B.04 0.99876 0.75820 corcoef_Met.PLS.B.06 0.99949 0.64852 corcoef_Met.PLS.B.10 0.99979 0.72012 corcoef_Met.PLS.B.20 0.99998 0.73185 corcoef_Met.PCR.A.02 0.99414 0.99326 corcoef_Met.PCR.A.04 0.99793 0.99825 corcoef_Met.PCR.A.15 0.99925 0.99919 corcoef_Met.PCR.A.25 0.99987 0.99974 corcoef_Met.PCR.B.02 0.99448 0.42866 corcoef_Met.PCR.B.04 0.99861 0.76748 corcoef_Met.PCR.B.06 0.99864 0.76420 corcoef_Met.PCR.B.10 0.99946 0.63556 corcoef_Met.PCR.B.20 0.99988 0.73185 corcoef_Xil.PLS.A.02 0.97619 0.97874 corcoef_Xil.PLS.A.08 0.99394 0.99443 corcoef_Xil.PLS.A.12 0.99753 0.99796 corcoef_Xil.PLS.A.20 0.99979 0.99962 corcoef_Xil.PLS.B.02 0.98169 0.92364 corcoef_Xil.PLS.B.04 0.98905 0.84462 corcoef_Xil.PLS.B.16 0.99970 0.80699 corcoef_Xil.PLS.B.25 0.99995 0.87727 corcoef_Xil.PCR.A.02 0.97481 0.97625 corcoef_Xil.PCR.A.08 0.98162 0.98661 corcoef_Xil.PCR.A.12 0.99340 0.99441 corcoef_Xil.PCR.A.20 0.99739 0.99799 corcoef_Xil.PCR.B.02 0.98053 0.91906 corcoef_Xil.PCR.B.04 0.98270 0.93450 corcoef_Xil.PCR.B.16 0.99766 0.79975 corcoef_Xil.PCR.B.25 0.99941 0.81374

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

46

En estas tablas resumen aparecen los resultados máximos y mínimos dependiendo del número de variables latentes del coeficiente de correlación obtenido después del proceso de regresión. Se indica el coeficiente de correlación y el número de lv con el que se ha realizado el análisis.

Coeficientes de correlación utilizando datos de entrenamiento como datos de validación

Coeficientes de correlación utilizando datos no usados anteriormente para validación

(Variables Latentes): Entre paréntesis se muestra el número de variables latentes con el que se ha procesado la función de regresión.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

47

Se puede ver en las tablas de coeficientes de correlación que por regla general el resultado es mejor, coeficiente de correlación ≈ 1, cuando se trata de analizar Metanol.

Esto es debido a la naturaleza de dicho compuesto. El espectro del Metanol presenta más picos y más irregularidades debido a su estructura molecular. Esta diferencia responde al hecho de que los enlaces simples tienen más capacidad de vibración. Por lo tanto, al recibir la luz infrarroja presenta mayor número de absorciones a diferentes longitudes de onda. Estas irregularidades benefician al modelo de regresión que permite distinguir los diferentes niveles de concentración de una forma mas clara que en el caso del p-Xileno.

Figura 23. Enlaces simples También se puede ver que los resultados en los que se ha aplicado el modelo de regresión PLS obtienen mejores resultados que aquellos en los que se ha aplicado el modelo de regresión PCR.

Esto es debido al hecho de que la regresión PLS es más precisa ya que tiene en cuenta la matriz de concentraciones y la de transmitancias (espectros) para crear la matriz de regresión ‘b’. En el caso de la regresión PCR, solo se usa la matriz de transmitancias (espectros) para crear la matriz de regresión ‘b’.

Por último, se puede comprobar que en todos los casos en que se ha realizado la

validación con datos cuya concentración era diferente a las concentraciones que se han utilizado para crear la matriz de regresión, el resultado es peor que los casos en que se las concentraciones, y no los datos, eran igual tanto para entrenamiento como para validación.

Esto es obvio pues siempre va ha ser mas fácil para un modelo de regresión

trabajar con concentraciones iguales a las que se han usado para crear el propio modelo de regresión.

En las regresiones en las que se han usado datos de validación con

concentraciones diferentes a la de los datos de entrenamiento se han obtenido algunos resultados muy malos. Sobretodo en las regresiones en la que se han usado distribución de datos tipo B (cruz).

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

48

8. Conclusiones

El objetivo inicial de este proyecto era realizar la puesta a punto del

espectrofotómetro FT-IR del DEEEA para el posterior análisis de muestras líquidas mediante técnicas quimiometricas. Se presentaba en frente un trabajo experimental cuyo objetivo era aplicar de manera práctica dos técnicas de regresión quimiométrica, PLS (Partial Least Squares) y PCR (Principal Component Regression), con datos reales obtenidos en el laboratorio.

Se ha puesto a punto el espectrofotómetro regulando sus parámetros de

funcionamiento interno y acoplando la célula contenedora de muestras liquidas en el habitáculo del espectrofotómetro. Se han tomado muestras experimentales mediante el uso del Software de Control una vez elegidas las concentraciones de los compuestos químicos ha analizar.

Se ha llevado a cabo la adecuación de los datos obtenidos en el laboratorio,

creando las matrices necesarias para su uso con las técnicas mencionadas. Finalmente se ha realizado el análisis con técnicas quimiometricas.

Se han presentado varias dificultades a lo largo de todo el proceso. Las primeras

dificultades se han superado a la hora de poner a punto el espectrofotómetro. Se ha tenido que encontrar el valor adecuado para los parámetros que controlan las condiciones de análisis. Para ello se han tomado muestras de prueba hasta obtener unas condiciones adecuadas. El deposito de las muestras líquidas en el hueco del espectrofotómetro se ha solucionado fácilmente acoplando el modulo omni-cell de specac para muestras liquidas.

Otra dificultad que se ha presentado ha sido la adecuación de los datos obtenidos

en el laboratorio. El formato de los ficheros se ha modificado, espectro a espectro, uno por uno, teniendo que prestar gran atención al orden en que se iban almacenando. Un fallo en este proceso podría haber sido la causa de la no obtención de los resultados esperados.

Finalmente se ha procedido al análisis utilizando la técnicas quimiométricas PLS

(Partial Least Squares) y PCR (Principal Component Regression).

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

49

El resultado obtenido para la regresión utilizando datos de validación con las

mismas concentraciones que los datos de entrenamiento ha sido ciertamente aceptable. De los 34 análisis realizados con este tipo de datos solo se ha obtenido niveles de

correlación menores a 0.99 en 7 ocasiones. Esto representa un 20% de los análisis realizados. Sin embargo, con unos parámetros de análisis adecuados se ha llegado a obtener el 0.99999 de correlación.

No se puede decir lo mismo en la regresión utilizando datos de validación con

concentraciones diferentes a las concentraciones de los datos de entrenamiento. De los otros 34 análisis realizados con este tipo de datos se ha obtenido niveles

de correlación menores a 0.99 en 20 ocasiones. Esto representa un 58% de los análisis realizados. En este caso el análisis con un valor de correlación mayor ha sido de 0.99988.

Muchos pueden haber sido los factores que hayan incluido en los resultados

obtenidos. - Es posible que no se haya sido lo suficientemente estricto en la

preparación de las muestras en cuanto al valor real de las concentraciones de los diferentes compuestos. (Método muy rudimentario)

- Tal vez se debería haber realizado una adecuación más exhaustiva de los datos obtenidos en el laboratorio.

- Es posible que se haya cometido algún error a la hora de crear las matrices de concentraciones y de espectros.

De todas maneras, el resultado no se considera malo ni tampoco excelente. El valor de los resultados obtenidos entra dentro de unos márgenes ciertamente aceptables. Como regla general se ha notado un nivel de correlación alto sin llegar a considerar que los resultados hayan sido excelentes.

Análisis de mezclas liquidas multicomponente mediante un espectrofotómetro IR i técnicas quimiométricas

50

9. Bibliografía

9.1. Libros consultados

[1] R.T. CONLEY versión española DE J. CALDERÓN MARTÍNEZ, R. AVENDAÑO RUIZ Espectroscopia infrarroja Madrid Alhambra 1979 ISBN 84-205-0657-5 [2] PETER R. GRIFFITHS, JAMES A. DE HASETH Fourier transform infrared spectrometry New York [etc.] : Wiley, cop. 1986 ISBN 0-471-09902-3 (cart) [3] VIDI SAPTARI Fourier transform spectroscopy instrumentation engineering Bellingham, Washington : SPIE Optical Engineering Press, cop. 2004 ISBN 0-8194-5164-9

9.2. Páginas Web [1] http://es.wikipedia.org

[2] http://www.atsdr.cdc.gov/es

[3] http://www.e-biometria.com