l ingÜÍstica computacional unidad 2. anÁlisis semÁntico ana maría tangarife patiño

24
LINGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

Upload: maria-concepcion-prado-sosa

Post on 03-Feb-2016

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

LINGÜÍSTICA COMPUTACIONALUNIDAD 2. ANÁLISIS SEMÁNTICO

Ana María Tangarife Patiño

Page 2: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

ANÁLISIS SEMÁNTICO El análisis semántico está encaminado a la resolución de

problemas con respecto a los sentidos de las palabras o las expresiones usadas de manera automática

Dentro de la LC la semántica pretender estructurar representaciones automáticas del lenguaje natural en máquinas a partir de plantillas de sentido para ejecutar inferencias.

Permite expresar significados lingüísticos, enlazar información gramatical con otras clases, procesar significados, validar equivalencias.

A partir de clasificaciones y categorizaciones de distintos elementos de la lengua, se generan esquemas conceptuales para realizar inferencias Traducción automática Recuperación de información

Page 3: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

RELACIONES SEMÁNTICAS

Se definen a partir de roles temáticos en donde se representan cada uno de los componentes de la oración.

Son graficadas a partir de un marco de casos partiendo de la premisa de que un grupo de estos casos es suficiente para modelar el lenguaje.

Estos marcos se han hecho principalmente para los verbos.

Page 4: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

CLASIFICACIONES VERBALES

Determinar verbos que corresponden al mismo prototipo.

LPPO: Lógica de Predicados de Primer Orden Parte de la lógica matemática estableciendo una

lógica preposicional empleando variables, predicados y cuantificadores.

Se establecen reglas de formación de oraciones y de inferencia que siguen axiomas lógicos.

Gramática de casos de Fillmore Relaciones entre el verbo y demás elementos de

la oración a partir de las cuales se establecen roles semánticos.

Page 5: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MODELOS DE ANÁLISIS SEMÁNTICOLÓGICA DE PREDICADOS DE PRIMER ORDEN

Sirve para representar el lenguaje de manera formal Hace uso de:

Reglas de formación o fórmulas Reglas de inferencia Axiomas lógicos

Emplea variables, predicados y cuantificadores (lógica proposicional o lógica simbólica), usando los siguientes símbolos:

Negación ( ) Conjunción ( ) Disyunción ( ) Implicación ( ) Coimplicación ( )

Page 6: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MODELOS DE ANÁLISIS SEMÁNTICOLÓGICA DE PREDICADOS DE PRIMER ORDEN

Page 7: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MODELOS DE ANÁLISIS SEMÁNTICOCÁLCULO DE LAMBA

Formalismo matemático, base de la computación.

Permite construir fórmulas semánticas a partir de representaciones sintácticas.

Unas expresiones X representan un algoritmo y su entrada, la expresión Y está sujeta a una serie de reglas de reescritura.

Page 8: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MODELOS DE ANÁLISIS SEMÁNTICOGRAMÁTICA SINTAGMÁTICA NUCLEAR

Representación gráfica matemática de información sintáctica y semántica.

Usa grafos para representar información lingüística como secuencia de características.

Incluye principales reglas gramaticales basados en entradas léxicas (palabras o frases) que son marcadas en forma jerárquica.

Cada entrada léxica contiene información fonética (PHON) y sintáctico-semántica (SYNSEM).

Page 9: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MODELOS DE ANÁLISIS SEMÁNTICOGRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO

Page 10: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MODELOS DE ANÁLISIS SEMÁNTICOGRAMÁTICA SINTAGMÁTICA NUCLEAR. EJEMPLO

Page 11: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MODELOS DE ANÁLISIS SEMÁNTICOMRS MINIMAL RECURSION SEMANTICS

Usa para representaciones en las cuales se presenten problemas de ambigüedades.

Este modelo parte del enfoque de que una estructura mínima del lenguaje representa y describe léxica y semánticamente la lengua general.

Page 12: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MODELOS DE ANÁLISIS SEMÁNTICOMTT MEANING TEXT THEORY

Representa reglas lingüísticas de acuerdo a significados específicos en un texto.

Usa patrones de manejo para combinar un lexema con otros objetos.

Permite representar equivalentes gráficos que son legibles por computador puesto que se basan en redes semánticas..

Este modelo establece una correspondencia entre posibles significados y un conjunto de posibles textos.

Page 13: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

AMBIGUACIÓN Y DESAMBIGUACIÓN

Ambigüedad: Que puede entenderse de varios modos o admitir distintas interpretaciones y dar, por consiguiente, motivo a dudas, incertidumbre o confusión.

Este es un problema mayor puesto que es difícil representar todas las variables que pueden presentarse en el lenguaje natural.

Se presenta cuando ocurren diferentes fenómenos, que podrían resolverse en contexto, pero que es necesario prever en la implementación de herramientas computacionales.

Page 14: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

FENÓMENOS DE AMBIGÜEDAD

Significados o sentidos de palabras o expresiones de acuerdo a contextos particulares de conocimiento.

Puede presentarse por las siguientes situaciones: Palabra que tiene más de un significado de acuerdo a

la categoría o al tiempo gramatical Sinonimia

Dos o más palabras que representan el mismo concepto Homonimia

Dos o más palabras con la misma forma gráfica y distinto significado según el contexto

Polisemia Una palabra cuyo sentido varía según el contexto

Page 15: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

PROBLEMAS EN EL TRATAMIENTO AUTOMÁTICO QUE TIENEN QUE VER CON LA AMBIGÜEDAD

Dudas, incertidumbre o confusión.

En sistemas automáticos de representación de conocimiento es necesario minimizar estos problemas representando los casos más comunes en el lenguaje natural para proveerle a la máquina métodos que le permitan inferir sobre posibles sentidos y decidir las respuestas más adecuadas

Otra clasificación de tipos de ambigüedad: Léxica Sintáctica Semántica Textual Pragmática Referencial.

Page 16: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

La desambigüación se realiza principalmente en tareas de: Traducción automática Recuperación de información

Solución: determinar automáticamente los sentidos de una palabra de acuerdo a contextos específicos.

Para lograr esto se llevan a cabo diferentes métodos que están basados bien sea en el conocimiento, en el corpus o métodos híbridos.

Page 17: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MÉTODOS BASADOS EN CONOCIMIENTO

Los métodos basados en conocimiento utilizan herramientas como diccionarios, tesauros, ontologías.

Ayudan a especificar los sentidos de acuerdo a usos particulares de las palabras en contextos específicos (lenguaje natural o lenguaje especializado).

El propósito de estas herramientas es proveer de significados, definiciones y ejemplos típicos de uso de las palabras.

Ejemplo: Wordnet

Page 18: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MÉTODOS BASADOS EN CORPUS Usan conjuntos de datos que proveen ejemplos de

oraciones y de usos de las palabras de tal forma que puedan utilizarse en algoritmos de aprendizaje automático.

Estos métodos están divididos en dos tipos: corpus etiquetado y corpus no etiquetado.

Corpus etiquetado: Clasificadores para darle sentido apropiado a una palabra

dentro de un contexto determinado. Se encuentran automáticamente relaciones o patrones entre

las palabras y luego evalúan y comparan los sentidos para realizar la desambiguación correcta

Tiene en cuenta: Co-ocurrencia, N-gramas, Colocaciones. Corpus no etiquetado:

Patrones que se definen para armar grupos de palabras con características comunes que se relacionan de alguna manera.

Page 19: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

MÉTODOS COMBINADOSGENERACIÓN AUTOMÁTICA DE ESQUEMAS CONCEPTUALES

Permiten la interacción en lenguaje natural entre el usuario y el computador.

Facilitan tareas de recuperación y extracción automática de textos en corpus específicos, así como otros modelos o sistemas de etiquetaje, análisis y desambiguación

Algunas herramientas: Extracción automática de contextos definitorios: http://

swesum.nada.kth.se/index-eng.html Anotaciones semánticas Ayuda en la escritura (corrección) Extracción automática de terminología Indexación automática Data mining textual Patrones y tendencias del discurso

Page 20: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

ESQUEMAS PRECONCEPTUALES

Representaciones gráficas y textuales que permiten una interpretación cercana a la realidad conceptual de un dominio.

Identifica las características estructurales y dinámicas de una lengua, ofreciendo a cada elemento una única categoría gramatical, lo que permitiría una mayor precisión de sentidos.

Page 21: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

ESQUEMAS PRECONCEPTUALES

Identificación Nombre

ObjetoAgente 1

Predicado

Agente 2

tiene tiene

Verbo Verbo

Page 22: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

UN-LECEP

Lenguaje controlado en español para la especificación de esquemas preconceptuales, generación de plantillas para la escritura de dichos esquemas.

Page 23: L INGÜÍSTICA COMPUTACIONAL UNIDAD 2. ANÁLISIS SEMÁNTICO Ana María Tangarife Patiño

RETOS…

Implementación y desarrollo de esquemas o categorías conceptuales en dominios específicos

Aplicaciones que no queden restringidas a la aplicación en otras lenguas. Hace falta más desarrollo y divulgación de aplicaciones en lengua castellana.

Construcción de ontologías que faciliten la estructuración y haga una marcación semántica de los documentos en la web a través del uso de términos específicos y la representación de las relaciones conceptuales entre ellos.

Utilización de métodos de análisis combinados (estadísticos y cualitativos)