extracción de características 1
Extracción de características
Gonzalez & Woods, Digital Image Processing, cap. 8
extracción de características 2
Propiedades de las características
• Tienen que ser robustos: la extracción debe ser insensible al ruido de captura e iluminación.
• Discriminantes (clasificación): las características deben servir para distinguir objetos de clases distintas.
• Tienen que poseer determinadas invarianzas dependientes de la aplicación:– Traslación: los valores de las características son independientes de
la posición.
– Rotación y escalado: idem de la orientación del objeto y de su tamaño.
– Transformación no lineales de deformación (perspectiva).
extracción de características 3
Códigos de cadena: consiste en representar mediante un código incremental la frontera (1-pixel, cerrada) del objeto.
Se escoge un punto inicial y se recorre la frontera en el sentido de las agujas del reloj indicando la dirección que sigue la frontera.
Sensibilidad al ruido: para aumentarla se submuestrea la frontera con una malla más basta.
Invarianza a traslación: es inmediata.
Invarianza a rotación: es preciso poder determinar un punto inicial que pueda ser detectado robustamente en el objeto rotado
Invarianza a escalado: depende del submuestreo de la frontera.
Invarianza a deformaciones: no existe en general
Capacidad discriminante: reducida, exige métodos eficientes de clasificación de secuencias.
extracción de características 4
Codificación de las direcciones, en el caso 4y 8 conectado
Ejemplo de frontera y su submuestreo para disminuir el efecto del ruido.
Representación gráfica de las cadenas en el caso 4 y 8 conectado.
extracción de características 5
Las primeras diferencias de los códigos de cadena son invariantes a rotación.
extracción de características 6
Se obtienen representaciones mas robustas frente a rotaciones, alineando la malla de discretización con los ejes principales del objeto, o sometiendolo a una transformación de Hollerit previamente a la discretización.
extracción de características 7
Aproximaciones poligonales: se describe la frontera con el polígono que la aproxima, dado un cierto error tolerado.
El proceso comienza detectado el eje de mayor elongación y prosigue añadiendo vértices hasta obtener una cierta precisión prefijada.
extracción de características 8
Signaturas: representaciónes de la frontera del objeto como funciones con soporte unidimensional. Usualmente consiste en un mapa de las coordenadas polares de la frontera tomando como origen el centro de masa del objeto.
Invarianza a traslación: inmediata
La rotación se convierte en la traslación de una función periódica, el escalado se convierte en la variación de amplitud de la función 1D.
Capacidad discriminante: depende de la capacidad de reconocer secuencias 1D.
extracción de características 9
Ejemplos de signaturas de dos objetos sencillos.
extracción de características 10
Esqueleto (eje medial) (Medial Axis transform MAT):
Se define el esqueleto como el conjunto de pixeles equidistantes de la frontera del objeto. Sirve de base para la descripción estructural del objeto y su reconocimiento. Es robusto frente a ruido, invariante a translación y rotación. El escalado no varia su estructura y es bastante robusto frente a deformaciones.
extracción de características 11
Un algoritmo eficiente para MAT•Paso 1: marcar para borrado pixeles del contorno (al menos un vecino con valor 0) que cumplen condiciones a,b,c,d.
•Paso 2: Borrar pixeles marcados en el paso 1.
•Paso 3: Marcar para borrado pixeles del contorno que cumplen condiciones a,b,c’.d’
•Paso 4: Borrar pixeles marcados en el paso 3.
CondicionesDisposición de los pixeles en el vecindario
extracción de características 12
Ejemplos del cálculo del esqueleto o eje medial.
extracción de características 13
Coeficientes de Fourier de la frontera. Se basan en la transformación de la secuencia de puntos frontera considerados como números complejos.
Con transformada discreta de Fourier
extracción de características 14
Ejemplo de reconstrucción de la frontera usando descriptores de Fourier.
extracción de características 15
Algunas propiedades de los descriptores de Fourier:
Son invariantes a traslación, excepto el descriptor a(0).
La rotación y el escalado se preservan en el dominio transformado.
La variación del punto inicial corresponde a un factor constante multiplicando los coeficientes de Fourier.
extracción de características 16
Generalización de la signatura: la frontera puede representarse como una función 1D de una variable r arbitraria.
Se puede considerar g(r) como una variable aleatoria v, calcular su histograma p(vi), y=1,..,K y usar los momentos centrales como discriminantes
Alternativamente, se puede normalizar g(r) y utilizar sus momentos
extracción de características 17
Momento de orden (p+q) de f(x,y).
En ciertas condiciones, f(x,y) determina unicamente la secuencia de todos los momentos (mpq) y a la inversa (mpq) determina f(x,y).
Momentos centrales
Caso digital:
Momentos centrales hasta orden 3
extracción de características 18
Momentos centrales normalizados: son invariantes a escalado en la magnitud de la función f(x,y).
Invariantes de Hu a escalado, rotación y traslación
extracción de características 19
Ejemplo de cálculo de los invariantes de Hu sobre una imagen en escala de grises
extracción de características 20
Invariantes proyectivoscap 11, Duda & Hart, Pattern Classification and Scene Analysis, Wiley 1973
Considerando un objeto descrito por un conjunto de puntos que pueden ser identificados en la imagen, el problema es determinar relaciones invariantes a las deformaciones de perspectiva que permitan distinguir objetos distintos independientemente del punto de vista
extracción de características 21
Un lápiz (pencil) es un conjunto de líneas que pasan por un punto (el centro del lapiz).Rango de puntos: cjto de puntos en una línea.
Los rangos son correspondientes bajo perspectiva si son secciones de un mismo lapiz. i.e: Son los puntos de un objeto y sus proyecciones en la imagen.
extracción de características 22
Los rangos Z y X están en correspondencia proyectiva puesto que comparten la correspondencia perspectiva con Y.
Dados dos rangos proyectivos (vistas, imágenes) siempre existe un tercer rango (objeto) en perspectiva con los dos
Dados dos rangos la condición necesaria y suficiente para que sean imágenes del mismo objeto es que estén en correspondencia proyectiva.
extracción de características 23
Rangos X e Y en perspectiva, pueden considerarse como ejes de un sistema de coordenadas no ortogonales.
Coordenadas del centro del lapiz. Coordenadas de los rangos.
Se cumple para cada línea:
Restando por pares se obtienen las ecuaciones (j,i)
extracción de características 24
Cross-ratio o cociente cruzado:
Se obtiene como [(3,1)x(2,4)]/[(2,1)x(3,4)]
Es independiente de las coordenadas (a,b) del centro del lápiz (centro de proyección).
Caracteriza el lápiz: todas las secciones (rangos) de un lápiz tienen el mismo ratio.
Si dos lápices tienen el mismo cross ratio deben tener alguna seccion (rango) común.
El cross ratio es un invariante proyectivo: dos rangos son proyectivos si tienen el mismo cross ratio.
Una condición necesaria para que dos vistas correspondan a un mismo objeto es que el cross ratio de todos los conjuntos de 4 puntos coincidan. Podemos discriminar objetos bajo distintas vistas utilizando el cross ratio.
extracción de características 25
El cross ratio es independiente del origen de coordenadas.
Lápices en distintos planos pueden tener el mismo cross ratio.
La definición del cross ratio depende del etiquetado de los puntos. De las 24 formas de etiquetarlos, solo 6 dan definiciones distintas del cross ratio.
extracción de características 26
Coordenadas proyectivas:
Dados puntos A,B,C,U (U punto unitario) y un punto P cualquiera, la coordenada proyectiva de P en el eje AC viene dad por el cociente cruzado (análogamente para los ejes AB y BC):
El conocimiento de dos de las tres coordenadas proyectivas determina completamente el punto P, excepto para puntos en los lados del triangulo de referencia.
extracción de características 27
Invarianza proyectiva de las coordenadas proyectivas
Centro de la lente
Plano imagen
Plano objeto
Las coordenadas proyectivas de P’ en A’,B’,C’,U’ son las mismas que las de P en A,B,C,U.
CR(A, X, Y, C) es la coordenada de P en AC.
En el plano ALC se cumple
Por tanto, la coordenada proyectiva de P en AC es la misma que la de P’ en A’C’. Analogamente para los restantes ejes.
extracción de características 28
Procedimiento para el reconocimiento invariante a proyección de objetos planos basado en las coordenadas proyectivas.
-Selección de 5 o mas puntos (coplanares)
- Seleccionados los 4 ptos de referencia, se calculan las coordenadas proyectivas de los restantes puntos.
La condición necesaria para que dos imágenes muestren el mismo objeto es que puntos correspondientes tengan coordenadas proyectivas identicas.
extracción de características 29
Propiedades cuasi proyectivas: responden a la cuestión de la segunda vista de forma limitada, no general.
Dadas imágenes A,B,C la aproximación cuasi proyectiva solo puede responder si
un par (A y B ó C y B) son imágenes del mismo objeto
Las líneas que unen los puntos de proyección de un punto del objeto y los puntos donde la linea interlentes atraviesan los planos imagen se interesecan en la linea XZ de intersección de los planos imagen.
extracción de características 30
Dados cuatro puntos de un mismo objeto 3D existen dos lapices C1 y C2 que tienen un rango comun, por tanto tienen los mismos cocientes cruzados y son correspondientes en perspectiva los puntos de las imágenes que forman estos lápices.
En la práctica, dados puntos especificos en las imagen, se trata de encontrar los centros de los lápices que hagan correspondientes en perspectiva a todos los posibles conjuntos de 4 puntos.