monografía vision artificial

5
UNIVERSIDAD CATÓLICA BOLIVIANA “SAN PABLO” FACULTAD DE CIENCIAS EXACTAS E INEGIERÍA DIPLOMADO EN AUTOMATIZACIÓN Y CONTROL DE PROCESOS MECATRÓNICOS MONOGRAFÍA ADQUISICIÓN DE UNA IMAGEN DIGITAL Alvaro Reynaldo Latorre Rada 1. Introducción En un sistema de visión artificial se incluyen diversas técnicas, tales como elprocesamiento de imágenes (captura, transformación, codificación de imágenes) ocomo el reconocimiento de formas (teoría estadística de decisiones, enfoquessintácticas y neuronales aplicados a la clasificación de patrones). Para la implementación de un sistema de visión artificial la principal tarea es la adquisición de imágenes, la formación de imágenes es un proceso mediante el cual una información luminosa 3D (escena) es proyectada en un plano 2D (imagen), para posteriormente digitalizarse. La presente monografía trata sobre este proceso de digitalización de imagenes. 2. Adquisición de la imagen El sistema que permite la captura y/o adquisición de la imagen, está formado por lossiguientes elementos: Cámara y digitalizador 2.1. Cámara Es el dispositivo encargado de transformar las señales luminosas que aparecen en laescena, en señales analógicas capaces de ser transmitidas por un cable coaxial. Se divideen dos partes, el sensor, que captura las propiedades del objeto en forma de señalesluminosas y lo transforma en señales analógicas, y la óptica que se encarga de proyectarlos elementos adecuados de la escena ajustando una distancia focal adecuada. 2.1.1. Modelo ideal de cámara El modelo ideal de cámara se basa en la cámara estenopeica, es una cámara fotográfica sin lente, que consiste en una caja a prueba de luz con un pequeño orificio por donde entra la luz. Para producir una imagen nítida es necesario que esta apertura sea muy pequeña, del orden de 0,5 mm (1/50 pulgadas), la imagen puede ser proyectada sobre una pantalla translúcida, una película o un sensor digital, para su respectivo tratamiento.

Upload: alvaro-latorre-rada

Post on 10-Aug-2015

52 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Monografía Vision Artificial

UNIVERSIDAD CATÓLICA BOLIVIANA “SAN PABLO” FACULTAD DE CIENCIAS EXACTAS E INEGIERÍA

DIPLOMADO EN AUTOMATIZACIÓN Y CONTROL DE PROCESOS MECATRÓNICOS

MONOGRAFÍA

ADQUISICIÓN DE UNA IMAGEN DIGITAL

Alvaro Reynaldo Latorre Rada

1. Introducción En un sistema de visión artificial se incluyen diversas técnicas, tales como elprocesamiento de imágenes (captura, transformación, codificación de imágenes) ocomo el reconocimiento de formas (teoría estadística de decisiones, enfoquessintácticas y neuronales aplicados a la clasificación de patrones). Para la implementación de un sistema de visión artificial la principal tarea es la adquisición de imágenes, la formación de imágenes es un proceso mediante el cual una información luminosa 3D (escena) es proyectada en un plano 2D (imagen), para posteriormente digitalizarse. La presente monografía trata sobre este proceso de digitalización de imagenes. 2. Adquisición de la imagen El sistema que permite la captura y/o adquisición de la imagen, está formado por lossiguientes elementos: Cámara y digitalizador 2.1. Cámara Es el dispositivo encargado de transformar las señales luminosas que aparecen en laescena, en señales analógicas capaces de ser transmitidas por un cable coaxial. Se divideen dos partes, el sensor, que captura las propiedades del objeto en forma de señalesluminosas y lo transforma en señales analógicas, y la óptica que se encarga de proyectarlos elementos adecuados de la escena ajustando una distancia focal adecuada. 2.1.1. Modelo ideal de cámara El modelo ideal de cámara se basa en la cámara estenopeica, es una cámara fotográfica sin lente, que consiste en una caja a prueba de luz con un pequeño orificio por donde entra la luz. Para producir una imagen nítida es necesario que esta apertura sea muy pequeña, del orden de 0,5 mm (1/50 pulgadas), la imagen puede ser proyectada sobre una pantalla translúcida, una película o un sensor digital, para su respectivo tratamiento.

Page 2: Monografía Vision Artificial

En el proceso de formación de imágenes se destacan cuatro factores, que están presentes a la vez en todos los sistemas fotográficos:

• Tamaño de apertura (o abertura del diafragma). • Tiempo de exposición (o velocidad de obturación). • Sensibilidad de los fotodetectores (o valor ISO). • Óptica utilizada (sistema de lentes). Dos funciones:

- Enfoque: su ajuste, junto con la apertura, determina la profundidad de campo.

- Aumento (zoom): establece el ángulo de visión y la distancia focal.

2.1.1.1. Abertura del diafragma • El diafragma es una imitación del iris de un ojo humano. • La apertura se expresa en relación a la constante f. Típico entre f/1,4 y f/64. • Cuanto menor es la apertura, más profundidad de campo pero entra menos

luz. El pinhole sería f/GRANDE 2.1.1.2. Velocidad de obturación

• Es el tiempo durante el cual se deja pasar la luz al fotodetector. • Se mide en segundos. Normalmente entre 1/8000 y 30 segundos. Lo

habitual en fotografía es ~1/125 s. • Junto con la apertura, determina la cantidad de luz que entra. • Otro problema es el movimiento. Si el tiempo es muy grande, la imagen

puede aparecer movida. – Objetos que se mueven rápido en condiciones normales. – Movimiento involuntario en escenas nocturnas u oscuras

2.1.1.3. Sensibilidad de los fotodetectores

• En fotografía analógica, está relacionada con la composición y grosor de la película: estándares ISOsegún el nivel de sensibilidad.

• En fotografía digital, la sensibilidad está relacionada con la ganancia (voltios por fotón). Se hace un equivalente ISO.

• 2.1.1.4. Óptica de enfoque

• Junto con el tamaño de apertura determina la profundidad de campo. Cuanto más amplia mejor.

• La p.c. es un rango definido por dos valores: la distancia más próxima enfocada y la más lejana.

• Suele estar entre unos pocos centímetros (modo macro) e infinito (paisajes, astronomía, etc.).

• Tipos de sistemas de enfoque: – Enfoque fijo (sin lentes de enfoque): cámaras pinhole, video-

vigilancia,..., no muy habitual. – Enfoque manual: controlado por el usuario. – Enfoque automático: requiere un motor y una lógica de control.

Normalmente basado en el punto central. 2.1.2. Dispositivos de captación Dentro estos dispositivos se tienen dos tipos de cámaras basados en Sensores CCD y multicapa CMOS

Page 3: Monografía Vision Artificial

2.1.2.1. Cámaras CCD Los sensores de visión usados en el ámbito industrial son los basados en matrices dedispositivos acoplados por carga CCD(Charge-CoupledDevices); estos transductores proporcionan una señal conamplitud proporcional a la luminosidad de la escena y realizan una digitalizaciónespacial completa en dos dimensiones (líneas y columnas), pues descomponen la imagenen una matriz de puntos.La codificación de la brillantez de cada elemento de imagen o pixel, obtenido de ladigitalización espacial, se hace generalmente en 8 bits, mientras que la resolución de ladiscretización espacial de una imagen puede ser por ejemplo de 320*240 pixeles. La tecnología CCD interline transfer (IT) y frameinterline transfer (FIT) identifica eltipo de CCD, cada uno de ellos tiene aspectos positivos y negativos. En la práctica elfabricante tiene optimizado el diseño y el tipo de CCD usado raramente determina elfuncionamiento completo de la cámara. • CCD tipo IT: la tecnología IT (interline transfer) tiene registros separados,protegidos de la luz con una máscara de aluminio opaco ópticamente, como seobserva en la figura 2.1. Las cargas proporcionales al contenido de la escena seacumulan en cada elemento del arreglo del sensor. Durante el intervalo vertical, lospaquetes de carga son desplazados al arreglo de almacenamiento adyacente. Luego,los elementos del sensor ahora vacíos, capturan el próximo campo mientras lainformación del arreglo de almacenamiento se transmite fuera para formar la señal de video de salida.

CCD tipo IT (Interline Transfer)

CCD tipo FIT: la parte superior de este dispositivo opera como un CCD IT. Sinembargo las cargas son rápidamente desplazadas desde el registro dealmacenamiento interlineal registro de almacenamiento protegido totalmente. Lospaquetes de carga son mantenidos en el registro interlinesolo por un corto tiempo

Page 4: Monografía Vision Artificial

CCD tipo FIT (Frame Interline Transfer) Cámara 3CCD: Las cámaras 3CCD son cámaras digitales de video y fotográficas con triple sensor CCD. En este tipo de diseño, la luz es descompuesta por prismas dicroicosen los canales R, G y B y cada haz se desvía para ser captado por surespectivo sensor CCD, uno por cada canal. Los sensores para el verde yel rojo suelen ser iguales, pero el sensor azul suele estar optimizado. Hasta el momentose considera que las cámaras con arquitectura 3CCD son una buena opción para procesos colorimétricos, aplicaciones científicas y técnicas, porque permiten captarimágenes con una gran resolución y calidad cromática. 2.1.2.2. Cámaras multicapa La cámara de sensor multicapa es una cámara fotográfica digitalcon un sensor CMOS multicapa, Se basa en registrar, en cada píxel, losestímulos de los tres canales básicos R, G, B en un conjunto de sensores situados enprofundidad (multicapa), de manera similar a como se efectuaba en las antiguaspelículas fotográficas de diapositiva. En este caso, no hay necesidad de descomponer laluz en tres haces espacialmente separados R, G, B. En cuanto a la resolución, elresultado es, teóricamente, similar a una imagen capturada con sensores en laarquitectura 3CCD ya que en cada píxel se transporta la información de los tres canalesRGB. Esta arquitectura sólo requiere un sensor en lugar de tres, y nogenera efectos indeseados del tipo moiré, como sucede con las cámaras con filtros tipomosaico y patrones de distribución espacial de píxeles R, G, y B. Las cámaras con un únicosensor (CMOS) multicapa son poco sensibles por lo que requieren una mayoriluminación. • CMOS - Complementary Metal-Oxide-Semiconductor. – También basados en semiconductores de silicio. – Diferencia con CCD: cada píxel incorpora su propia circuitería, se pueden leer

y seleccionar independientemente (sin necesidad de desplazamientos). 2.2. Digitalizador.

El digitalizador (framegrabber), es el encargado de transformar la señal de vídeo,cualquiera que sea el formato utilizado (NTSC, PAL), en una señal digital capaz de sercapturada, almacenada en memoria y procesada por una computadora. Las principalescaracterísticas de las tarjetas digitalizadoras son precio, controlabilidad, resolución,velocidad y almacenaje, en el sentido de sí los algoritmos de visión pueden tener accesorápido y fácilmente a los datos. Existen tarjetas que proporcionan sus propios buffers de memoria y otras que utilizan lamemoria del ordenador (vía DMA). Muchas de ellas permiten un pre-procesamientoprevio de las imágenes, donde el número de tareas implementadas en hardware es muy variable. La resolución de las tarjetas digitalizadoras y la de las cámaras (sensor) no tiene porquecoincidir. Por lo tanto, es importante (sobre todo cuando se emplean técnicas de medición) saber que ocurre con los puntos que faltan o sobran.

Page 5: Monografía Vision Artificial

Formatos de almacenamiento de imágenes Una imagen digitales un tipo de archivo en el que se ha descompuesto la imagen real en un conjunto de puntos y se almacena la información cromática de dichos puntos. Cuantos más puntos se utilicen para descomponer la imagen física, más fiel podrá ser luego la reconstrucción de la misma (aunque no siempre es así debido a aberraciones cromáticas, distorsiones por lente irregular u otro tipo de imperfecciones). Este aumento de puntos implicará que el archivo que los contiene tendrá también un tamaño mayor.

Los formatos más habituales utilizados para almacenar las imágenes digitales son:

• TIFF. • RAW • GIF. • PNG. • PSD.

Conclusiones • Una imagen digital no es más que una matriz de números. • Las imágenes digitales son muestreos discretos de señales continuas

bidimensionales. • Discretización en el espacio: ancho y alto. • Discretización en el valor: profundidad de píxel. • El procesamiento de imágenes recibe imágenes como entrada y produce

imágenes en la salida. • Las tecnologíasutilizadas son los dispositivosbasados en CCD y CMOS. • Ambos consisten en arrays de fotodetectores construidos sobre un

semiconductor de silicio. • Parámetros más relevantes: número de píxeles del array y nivel de ruido. • Otros parámetros (zoom, enfoque, distancia focal, etc.) dependen de la óptica

de la cámara. Referencias y bibliografía - http://en.wikipedia.org/wiki/Image_sensor - http://www.dummies.com/how-to/photography-video/digital-photography/using-

the-camera.html - Curso: Procesamiento Digital de Imágenes, Luis Gerardo de la Fraga -

http://delta.cs.cinvestav.mx/~fraga/Cursos/PDI/cap1.pdf - Procesamiento Digital de ImágenesDr. Boris Escalante Ramírez –

Fundamentos de la Imagen Digital