Download - Extracción de características1 Extracción de características Gonzalez & Woods, Digital Image Processing, cap. 8

extracción de características 1

Extracción de características

Gonzalez & Woods, Digital Image Processing, cap. 8


Propiedades de las características

• Tienen que ser robustos: la extracción debe ser insensible al ruido de captura e iluminación.

• Discriminantes (clasificación): las características deben servir para distinguir objetos de clases distintas.

• Tienen que poseer determinadas invarianzas dependientes de la aplicación:– Traslación: los valores de las características son independientes de

la posición.

– Rotación y escalado: idem de la orientación del objeto y de su tamaño.

– Transformación no lineales de deformación (perspectiva).


Códigos de cadena: consiste en representar mediante un código incremental la frontera (1-pixel, cerrada) del objeto.

Se escoge un punto inicial y se recorre la frontera en el sentido de las agujas del reloj indicando la dirección que sigue la frontera.

Sensibilidad al ruido: para aumentarla se submuestrea la frontera con una malla más basta.

Invarianza a traslación: es inmediata.

Invarianza a rotación: es preciso poder determinar un punto inicial que pueda ser detectado robustamente en el objeto rotado

Invarianza a escalado: depende del submuestreo de la frontera.

Invarianza a deformaciones: no existe en general

Capacidad discriminante: reducida, exige métodos eficientes de clasificación de secuencias.


Codificación de las direcciones, en el caso 4y 8 conectado

Ejemplo de frontera y su submuestreo para disminuir el efecto del ruido.

Representación gráfica de las cadenas en el caso 4 y 8 conectado.


Las primeras diferencias de los códigos de cadena son invariantes a rotación.


Se obtienen representaciones mas robustas frente a rotaciones, alineando la malla de discretización con los ejes principales del objeto, o sometiendolo a una transformación de Hollerit previamente a la discretización.


Aproximaciones poligonales: se describe la frontera con el polígono que la aproxima, dado un cierto error tolerado.

El proceso comienza detectado el eje de mayor elongación y prosigue añadiendo vértices hasta obtener una cierta precisión prefijada.


Signaturas: representaciónes de la frontera del objeto como funciones con soporte unidimensional. Usualmente consiste en un mapa de las coordenadas polares de la frontera tomando como origen el centro de masa del objeto.

Invarianza a traslación: inmediata

La rotación se convierte en la traslación de una función periódica, el escalado se convierte en la variación de amplitud de la función 1D.

Capacidad discriminante: depende de la capacidad de reconocer secuencias 1D.


Ejemplos de signaturas de dos objetos sencillos.


Esqueleto (eje medial) (Medial Axis transform MAT):

Se define el esqueleto como el conjunto de pixeles equidistantes de la frontera del objeto. Sirve de base para la descripción estructural del objeto y su reconocimiento. Es robusto frente a ruido, invariante a translación y rotación. El escalado no varia su estructura y es bastante robusto frente a deformaciones.


Un algoritmo eficiente para MAT•Paso 1: marcar para borrado pixeles del contorno (al menos un vecino con valor 0) que cumplen condiciones a,b,c,d.

•Paso 2: Borrar pixeles marcados en el paso 1.

•Paso 3: Marcar para borrado pixeles del contorno que cumplen condiciones a,b,c’.d’

•Paso 4: Borrar pixeles marcados en el paso 3.

CondicionesDisposición de los pixeles en el vecindario


Ejemplos del cálculo del esqueleto o eje medial.


Coeficientes de Fourier de la frontera. Se basan en la transformación de la secuencia de puntos frontera considerados como números complejos.

Con transformada discreta de Fourier


Ejemplo de reconstrucción de la frontera usando descriptores de Fourier.


Algunas propiedades de los descriptores de Fourier:

Son invariantes a traslación, excepto el descriptor a(0).

La rotación y el escalado se preservan en el dominio transformado.

La variación del punto inicial corresponde a un factor constante multiplicando los coeficientes de Fourier.


Generalización de la signatura: la frontera puede representarse como una función 1D de una variable r arbitraria.

Se puede considerar g(r) como una variable aleatoria v, calcular su histograma p(vi), y=1,..,K y usar los momentos centrales como discriminantes

Alternativamente, se puede normalizar g(r) y utilizar sus momentos


Momento de orden (p+q) de f(x,y).

En ciertas condiciones, f(x,y) determina unicamente la secuencia de todos los momentos (mpq) y a la inversa (mpq) determina f(x,y).

Momentos centrales

Caso digital:

Momentos centrales hasta orden 3


Momentos centrales normalizados: son invariantes a escalado en la magnitud de la función f(x,y).

Invariantes de Hu a escalado, rotación y traslación


Ejemplo de cálculo de los invariantes de Hu sobre una imagen en escala de grises


Invariantes proyectivoscap 11, Duda & Hart, Pattern Classification and Scene Analysis, Wiley 1973

Considerando un objeto descrito por un conjunto de puntos que pueden ser identificados en la imagen, el problema es determinar relaciones invariantes a las deformaciones de perspectiva que permitan distinguir objetos distintos independientemente del punto de vista


Un lápiz (pencil) es un conjunto de líneas que pasan por un punto (el centro del lapiz).Rango de puntos: cjto de puntos en una línea.

Los rangos son correspondientes bajo perspectiva si son secciones de un mismo lapiz. i.e: Son los puntos de un objeto y sus proyecciones en la imagen.


Los rangos Z y X están en correspondencia proyectiva puesto que comparten la correspondencia perspectiva con Y.

Dados dos rangos proyectivos (vistas, imágenes) siempre existe un tercer rango (objeto) en perspectiva con los dos

Dados dos rangos la condición necesaria y suficiente para que sean imágenes del mismo objeto es que estén en correspondencia proyectiva.


Rangos X e Y en perspectiva, pueden considerarse como ejes de un sistema de coordenadas no ortogonales.

Coordenadas del centro del lapiz. Coordenadas de los rangos.

Se cumple para cada línea:

Restando por pares se obtienen las ecuaciones (j,i)


Cross-ratio o cociente cruzado:

Se obtiene como [(3,1)x(2,4)]/[(2,1)x(3,4)]

Es independiente de las coordenadas (a,b) del centro del lápiz (centro de proyección).

Caracteriza el lápiz: todas las secciones (rangos) de un lápiz tienen el mismo ratio.

Si dos lápices tienen el mismo cross ratio deben tener alguna seccion (rango) común.

El cross ratio es un invariante proyectivo: dos rangos son proyectivos si tienen el mismo cross ratio.

Una condición necesaria para que dos vistas correspondan a un mismo objeto es que el cross ratio de todos los conjuntos de 4 puntos coincidan. Podemos discriminar objetos bajo distintas vistas utilizando el cross ratio.


El cross ratio es independiente del origen de coordenadas.

Lápices en distintos planos pueden tener el mismo cross ratio.

La definición del cross ratio depende del etiquetado de los puntos. De las 24 formas de etiquetarlos, solo 6 dan definiciones distintas del cross ratio.


Coordenadas proyectivas:

Dados puntos A,B,C,U (U punto unitario) y un punto P cualquiera, la coordenada proyectiva de P en el eje AC viene dad por el cociente cruzado (análogamente para los ejes AB y BC):

El conocimiento de dos de las tres coordenadas proyectivas determina completamente el punto P, excepto para puntos en los lados del triangulo de referencia.


Invarianza proyectiva de las coordenadas proyectivas

Centro de la lente

Plano imagen

Plano objeto

Las coordenadas proyectivas de P’ en A’,B’,C’,U’ son las mismas que las de P en A,B,C,U.

CR(A, X, Y, C) es la coordenada de P en AC.

En el plano ALC se cumple

Por tanto, la coordenada proyectiva de P en AC es la misma que la de P’ en A’C’. Analogamente para los restantes ejes.


Procedimiento para el reconocimiento invariante a proyección de objetos planos basado en las coordenadas proyectivas.

-Selección de 5 o mas puntos (coplanares)

- Seleccionados los 4 ptos de referencia, se calculan las coordenadas proyectivas de los restantes puntos.

La condición necesaria para que dos imágenes muestren el mismo objeto es que puntos correspondientes tengan coordenadas proyectivas identicas.


Propiedades cuasi proyectivas: responden a la cuestión de la segunda vista de forma limitada, no general.

Dadas imágenes A,B,C la aproximación cuasi proyectiva solo puede responder si

un par (A y B ó C y B) son imágenes del mismo objeto

Las líneas que unen los puntos de proyección de un punto del objeto y los puntos donde la linea interlentes atraviesan los planos imagen se interesecan en la linea XZ de intersección de los planos imagen.


Dados cuatro puntos de un mismo objeto 3D existen dos lapices C1 y C2 que tienen un rango comun, por tanto tienen los mismos cocientes cruzados y son correspondientes en perspectiva los puntos de las imágenes que forman estos lápices.

En la práctica, dados puntos especificos en las imagen, se trata de encontrar los centros de los lápices que hagan correspondientes en perspectiva a todos los posibles conjuntos de 4 puntos.

Download - Extracción de características1 Extracción de características Gonzalez & Woods, Digital Image Processing, cap. 8

Top Related