la web semántica y su impacto en la recuperación de información rosenda ruiz figueroa 3er...
TRANSCRIPT
![Page 1: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/1.jpg)
La web semántica y su impacto en la recuperación
de información
Rosenda Ruiz Figueroa3er Seminario Internacional
De la transparencia a los archivosMéxico 2010
![Page 2: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/2.jpg)
El proceso de recuperación de información en la Web
Reporta
El usuario transforma en
El usuario transforma en
![Page 3: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/3.jpg)
¿Qué es la web semántica?
Semántica
Relativa al significado de las palabras o vocablos en función de una lengua y un contexto. Es decir, las palabras tienen un significado particular para una
comunidad establecida
Por tanto, la web semántica es, por definición, aquélla donde los contenidos tienen un significado preciso para
una comunidad determinada
![Page 4: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/4.jpg)
¿Qué es la web semántica?• Una ampliación de la web actual• Un espacio donde los datos tienen un significado bien definido en función
de su contexto• Los datos se convierten, mediante un proceso de organización, en
información llena de significado• La organización puede ser realizada por humanos o por procesos
computarizados• La información puede ser usada por diferentes softwares (uso de una
infraestructura común), permitiendo la búsqueda, recuperación e integración de manera más eficiente durante los procesos de búsqueda y recuperación (interoperabilidad)
• El usuario puede encontrar respuesta a sus cuestionamientos de manera más rápida y sencilla (eficiencia) porque la información puede ser interpretada tanto por personas como por procesos computacionales (agentes)
![Page 5: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/5.jpg)
Condiciones para que funcione la Web Semántica
Significado
![Page 6: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/6.jpg)
El proceso de recuperación de información en la Web semántica
Organización
Conversión a
Reporta
El usuario transforma en
![Page 7: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/7.jpg)
Organización
Descriptiva
• Forma• Soporte• Creación• Obra• Ubicación• Propiedad• Representación
Contenido
• Contenido intelectual del documento
• Clasificación• Indización• Puntos de acceso• Representación
Metadatos
![Page 8: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/8.jpg)
Dado lo anterior, la web semántica no puede funcionar sin una herramienta que de significado al contenido a través de un vocabulario específico y las relaciones de
los términos en función de un contexto
Los lenguajes documentales
![Page 9: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/9.jpg)
Los lenguajes documentales
Libres (naturales)
• Descriptores libres• Palabras clave• Folksonomías
Controlados• Vocabularios• Encabezamientos de
materia• Sistemas de clasificación• Taxonomías• Tesauros• Ontologías
• Mapas conceptuales• Mapas de tópicos o
mapas temáticos
![Page 10: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/10.jpg)
Los lenguajes documentales
Libres (naturales)
Características:•Exhaustivos•Imprecisos•Polisemia•Sinonimia•Sin contexto•No relacionales
Controlados
Características:• Preciso• Menor polisemia• Menor sinonimia• Contextuales• Representan un área (o
varias) del conocimiento• Relacionales• Facetados
![Page 11: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/11.jpg)
Lenguajes controlados
• Herramientas para la representación y organización del conocimiento
• Enfatizan los aspectos fundamentales del contenido del objeto de información
• Facilitan la búsqueda precisa pero también la búsqueda de contexto
![Page 12: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/12.jpg)
• Permite al usuario buscar sin tener que conocer la estructura del propio lenguaje
• Usa términos que son adecuados al contexto y conocidos en el ambiente del usuario (uso)
• Permite conocer las relaciones preestablecidas en el propio lenguaje de manera que obtenga un panorama más amplio (precoordinación)
• Permite al usuario establecer relaciones durante el proceso de búsqueda (postcoordinación)
Un buen lenguaje controlado es aquel que:
![Page 13: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/13.jpg)
Los lenguajes controlados• Vocabularios – Listado de términos. Finalidad: agrupar y
controlar
• Encabezamientos de materia – Lenguaje precoordinado con sintaxis no natural. Representación de una colección a partir de conceptos, formas, etc., y sus relaciones jerárquicas. Finalidad: localizar
• Sistemas de clasificación – Organización del conocimiento mediante la categorización y la jerarquización, uso de nomenclatura natural o artificial. Relaciones al mismo nivel: difusas, a menos que sean facetados. Finalidad: clasificar y localizar
![Page 14: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/14.jpg)
Los lenguajes controlados
• Taxonomías – Organización del conocimiento mediante la categorización y la jerarquización en estructura plana. Normalmente basadas en conceptos. Finalidad: clasificar
• Tesauros – Sintaxis natural. Organización del conocimiento en base a conceptos y sus relaciones jerárquicas, equivalencias y asociaciones. Términos preferentes. Multijerárquicos. Finalidad: localizar
![Page 15: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/15.jpg)
Los lenguajes controlados• Ontologías –
– Diversos tipos: Terminológicas y de Información– Tesauros más avanzados. – Incluyen taxonomías. – Representación del conocimiento a partir de los
conceptos y sus relaciones– Delimita propiedades, características: rasgos y atributos– Facetas– Mayor variedad de relaciones– Modelos conceptuales– Finalidad: Almacenamiento de conocimiento (vertido en
términos que representan conceptos) para ser usado por varios sistemas automáticos (reusabilidad)
![Page 16: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/16.jpg)
Los lenguajes controlados
• Ontologías – – “En teoría, son una de las piezas clave para la
comunicación entre organizaciones, personas y aplicaciones y así facilitar la interoperabilidad entre sistemas. Gracias al conocimiento almacenado en las ontologías, los agentes inteligentes podrían extraer directamente datos de las páginas web, procesarlos y hacer inferencias. Sin embargo, esta funcionalidad actualmente aún no está disponible fuera de dominios reducidos.” (Vallez, Mari, 2010)
![Page 17: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/17.jpg)
Parámetros de la indización de los documentos
• Pertinencia – Utilidad real de los resultados de búsqueda• Exhaustividad – Representación suficiente de los
contenidos• Especificidad – Eliminación de ambigüedades,
asociación de términos correcta y jerarquización adecuada
• Uniformidad – Coincidencia de los términos de búsqueda con los términos usados para la descripción
![Page 18: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/18.jpg)
Entonces…Bien desarrollados, los lenguajes controlados optimizan la recuperación de la información porque:
1.Evitan la dispersión de la información debido a la estructuración del conocimiento
2.Evitan la polisemia y la sinonimia porque establecen relaciones entre los términos con significados diferentes y significados iguales
3.Dan significado a los términos con los que se describe el contenido de un recurso porque son sistemas semánticos
4.Establecen las relaciones entre los términos de búsqueda, no la tiene que hacer el usuario
![Page 19: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/19.jpg)
En conclusión
• Una búsqueda en la web utilizando un buscador normal, tipo Google, reporta un número infinito de resultados; la gran mayoría de ellos no tienen ni relevancia ni pertinencia
• El uso de un lenguaje controlado en la web semántica, que permite la búsqueda contextual, equivale, según los estudios realizados, a la reducción de más del 70% del número de resultados
• Así, el acceso a la información se hace más eficiente y expedito, proporcionando resultados a través de búsquedas más sencillas usando términos que corresponden al contexto del interesado
![Page 20: La web semántica y su impacto en la recuperación de información Rosenda Ruiz Figueroa 3er Seminario Internacional De la transparencia a los archivos México](https://reader036.vdocuments.net/reader036/viewer/2022062618/55019f154a795996568b4922/html5/thumbnails/20.jpg)
Si y solo sí
Derecho de acceso a la información
Transparencia
• Disponibilidad• Suficiencia• Claridad• Oportunidad• Facilidad de
acceso
Organización
Representación
Requiere