recuperaci ó n basada en contenido m. andrea rodríguez tastets diic - universidad de concepción...
TRANSCRIPT
![Page 1: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/1.jpg)
Recuperación Basada en Contenido
M. Andrea Rodríguez TastetsDIIC - Universidad de Concepción
http://www.inf.udec.cl/~andrea
![Page 2: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/2.jpg)
Búsqueda por contenido
Es una metodología de recuperación de información basada en el contenido con respecto al dominio de aplicación del proceso de recuperación. Usa un análisis y procesamiento digital para general descriptores (meta-data) a partir de los datos. Los méritos principales de sistemas basados en el contenido son:
Soporta el procesamiento de consultas visuales (o audio) La consulta es intuitiva y amistosa al usuario La generación de los descriptores es automática, siendo
objetiva y consistente.
![Page 3: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/3.jpg)
Media
Definición: Media se refiera a todo medio de comunicación. Multimedia entonces, se refiere a la combinación de medios de comunicación, tales como imágenes, video, gráficos, señales de audio, texto, símbolos, etc. Desde una perspectiva de computación, información multimedial puede ser representada usando estructuras de datos o clases de objetos.
![Page 4: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/4.jpg)
CBR
CBR puede ser clasificada en tres categorias, correspondiendo a auto-asociación, hetero-asociación, y combinación de las dos primeras. Estos tres tipos de recuperación son: búsqueda dentro de una clase de objetos, navegación entre clases de objetos, correspondencia parcial de objetos complejos.
![Page 5: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/5.jpg)
CBR versus Clasificación
Un área relacionada a CBR es el reconocimiento de patrones, clasificación de patrones ya que ambas disciplinas usan descriptores y medidas de similitud. Clasificación de patrones particiona el espacio de descriptores en subespacios, posiblemente disjuntos para clases de patrones distintos. En CBR, por otro lado, lo central en el objeto. La similaridad tiene un rol principal y no cumple sólo la función de entrenamiento que apoya la clasificación, si no que es objetivo final.
![Page 6: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/6.jpg)
CBR versus Clasificación
Clasificación Recuperación por Similaridad Función discriminadora Función de Similaridad Entrenamiento Aprendizaje Selección de Descriptores Selección de Descriptores Medida de Separabilidad Medida de Relatividad Conjunto de Medidas de Descriptores
Multimedia Objetos
![Page 7: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/7.jpg)
Recuperación de Imágenes
Búsqueda por histogramas: La imagen es caracterizada por el histograma de colores. El histograma entrega la relativa cantidad de color sin considerar la localización, forma y textura de los objetos.
![Page 8: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/8.jpg)
Recuperación de Imágenes
Búsqueda por color layout: Las imágenes son divididas en bloques y el color promedio a cada bloque es almacenado. Cada búsqueda basada en color layout es sensitiva a rotación y cambio de tamaño porque las imágenes son caracterizadas por propiedades locales. La similitud entre imágenes ese basa en comparar la signatura de ellas. Textura y forma no son consideradas y está limitada a la representación de imágenes en términos de niveles de intensidad.
![Page 9: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/9.jpg)
Recuperación de Imágenes
Búsqueda basada en regiones: Los objetos en las imágenes son obtenidos a partir de un proceso de segmentación. A cada objeto se le pueden agregar color, textura, localización o una combinación de ellos.
![Page 10: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/10.jpg)
¿Existe
en la Base de Datos?
Búsqueda de Configuraciones
![Page 11: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/11.jpg)
Consulta
![Page 12: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/12.jpg)
Consulta
Una consulta Q es un conjunto de n variables con un conjunto de m ≤ n(n-1)/2 restricciones.
![Page 13: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/13.jpg)
Base de Datos de Imágenes
![Page 14: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/14.jpg)
QuickTime™ and aGIF decompressor
are needed to see this picture.
Base de Datos Espacial
![Page 15: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/15.jpg)
Satisfacción de Restricciones
• Dado un conjunto de variables {x1…xn}• Un dominio discreto y finito por cada variable
{D1…Dm}
• Un conjunto {Rk} de restricciones definidas sobre un dominio de variables
RjDi1x…Dij
• Encontrar una asignación de variables tal que las restricciones sean satisfechas
![Page 16: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/16.jpg)
Restricciones: Topologías
![Page 17: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/17.jpg)
Restricciones: Métrica
![Page 18: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/18.jpg)
Restricciones: Métrica
![Page 19: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/19.jpg)
Restricciones: Métrica
![Page 20: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/20.jpg)
Restricciones: Métrica
![Page 21: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/21.jpg)
Restricciones: Orientación
![Page 22: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/22.jpg)
Problema: Comparar
aa
?
![Page 23: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/23.jpg)
Descripción Contenido
![Page 24: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/24.jpg)
Caracterización MBR
aa
AreaDiagonalAB
CD
![Page 25: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/25.jpg)
Caracterización de MBRs
Real Fárea (MBR)
Real Fdiagonal (MBR)
aa
AreaDiagonalAB
CD
![Page 26: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/26.jpg)
Caracterización de pares de MBRs
MBR Funión (MBR, MBR)
MBR Fintersección (MBR, MBR)
aa
ABA∪BC DC∩D
![Page 27: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/27.jpg)
Caracterización de pares de MBRs
Real F d_exterior (MBR, MBR)
Real F d_interior (MBR, MBR)
aaa
ABdexteriorDCd interior
![Page 28: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/28.jpg)
Indice de Contenido
aaaa
F(A,B)=area(A)−2area(A∩B)area(A) +distance(δA,δB)(δA)diagonal
![Page 29: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/29.jpg)
Indice de Contenido
![Page 30: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/30.jpg)
Indexación
• Evitar la revisión exhaustiva de una base de datos.
• Dado n objetos en la base de datos y m restricciones en la consulta, la revisión exhaustiva implica m permutaciones de n objetos O(nm), con n >>>> m.
![Page 31: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/31.jpg)
Indexación
• Indexación espacial:
1. Indexación sobre objetos
2. Indexación sobre relaciones
![Page 32: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/32.jpg)
Condición de Búsqueda
aaa
d(R(vi,vj),R(ui,uj))<τ(R(vi,vj))d(R(vj,vi),R(uj,ui))<τ(R(vj,vi))
•Una restricción entre variables de una consulta R(vi,vj) será satisfecha por la restricción entre instancias en la base de datos R(ui,uj) si:
![Page 33: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/33.jpg)
Condición de Búsqueda
aaa
τ(R(vi,vj))=abs(1−abs(R(vi,vj)))⋅a,a<1.0
![Page 34: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/34.jpg)
Preprocesamiento
• Eliminar restricciones
• Ordenar restricciones
![Page 35: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/35.jpg)
Eliminación de Restricciones
• Relaciones entre objetos cercanos
• Satisfacción de consistencia basada en la composición de relaciones
![Page 36: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/36.jpg)
Composición
R ; S (oi, ok) |
oj tal que (oi, oj) R y (oj, ok) S
A dentro B; B dentro CA dentro C
![Page 37: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/37.jpg)
Composición
![Page 38: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/38.jpg)
Composición
aa
;
![Page 39: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/39.jpg)
Composición
a
;
![Page 40: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/40.jpg)
disjoint meet overlap coveredBy inside covers contains equal
disjoint
equal
contains
covers
inside
coveredBy
overlap
meet
![Page 41: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/41.jpg)
Grafo de Consistencia
aaa
∀i,jR''ij=R'ij∩R'ji∀i,jR'''ij=∩k=anR''ik;R''kj
∀iR'ii=Rii∩equal∀i,j|i≠jR'ij=Rij
![Page 42: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/42.jpg)
Grafo de Consistencia
Una relación es derivable si es el único resultado de la intersección de composiciones usando todos los caminos en el grafo de configuración
![Page 43: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/43.jpg)
Eliminación de restricciones
• El grafo resultante es único
• Ej: Existen ~2.245.000 consultas consistentes
con 5 objetos, lo que significa 25 relaciones posibles. De ellas, se pueden derivar 16 relaciones en promedio
![Page 44: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/44.jpg)
Algoritmos de Búsqueda
• Forward-Checking Strategy
• Similitud:
aaa
D(Q,S)= Fm(vk,vl)−Fm(uk,ul)( )2+Fm(vl,vk)−Fm(ul,uk)( )2vi∈Q,uj∈S∑D(Q,S)= Fm(vk,vl)−Fm(uk,ul)( )2+Fm(vl,vk)−Fm(ul,uk)( )2vi∈Q,uj∈S∑
![Page 45: Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción andrea](https://reader035.vdocuments.net/reader035/viewer/2022062315/5665b4351a28abb57c90039f/html5/thumbnails/45.jpg)
Algoritmos de Búsqueda
• Determinísticos: • Basado en permutaciones
• Algoritmos heurísticos:• Hill Climbing• Genéticos