lenguaje natural
DESCRIPTION
Lógica Computacional Revista Singularidad Ciencias de la Computacion 1 Cohorte Grupo SchemeTRANSCRIPT
.
Introducción ......................................................................................... 4
Lenguaje ............................................................................................. 5
Lenguaje Natural ................................................................................. 6
Características de las lenguas naturales .......................................... 7
Procesamiento del Lenguaje Natural ................................................... 9
Origen .............................................................................................. 9
Niveles del Procesamiento del Lenguaje Natural .............................10
Nivel fonológico: ...........................................................................10
Nivel morfológico: .........................................................................10
Nivel sintáctico: ............................................................................11
Nivel semántico: ...........................................................................11
Nivel pragmático: ..........................................................................11
Arquitectura de un sistema de PLN .................................................11
Aplicaciones del Procesamiento de Lenguajes Naturales ................12
Traducción automática .................................................................13
Recuperación de la información: ..................................................13
Resolución cooperativa de problemas: .........................................13
Reconocimiento de voz: ...............................................................14
Referencias Bibliográficas ..................................................................15
Poder vincular el lenguaje cotidiano a una interacción matemática con un ordenador es una tarea ardua y paradójicamente fascinante, requiere un pensamiento
abstracto que vaya más allá de los simples supuestos de tomar las reglas gramaticales más simples, sobrentenderlas, tratar de implementarlos en las computadoras y fallar miserablemente. Esto es en parte dado que los estudios científicos enfocados al conjunto de los lenguajes naturales y la inteligencia artificial no han resonado de la manera más armoniosa posible.
Y como culparlos de no trabajar armoniosamente si sus campos de estudio son en teoría diametralmente opuestos, son como agua y aceite, no se mezclan, ¿o tal vez si? Entrando como catalizador a esta mezcla surgen hasta hace poco el procesamiento de los lenguajes naturales, mediante un análisis del contexto de una oración pueden dar con un resultado de una búsqueda, bajo el uso de un algoritmo que estudia la semántica lógica de la oración el ordenador da con el resultado en cuestión de instantes.
El PLN si bien es un logro, es una ciencia que todavía se encuentra en etapas tempranas de desarrollo, todavía no ha logrado complementar exitosamente a la inteligencia artificial de manera de hacerla posible en la práctica, pero como dice un famoso refrán chino un viaje de un millón de leguas empieza con dar el primer paso. Así que habrá que esperar un tiempo mas.
Revista Singularidad
Director Luis Enrique Rangel. Redacción Manuel Martino Del Molino Consejo Académico Asesor
Yamila Gascón
Nelsy Vivenes
Jonathan Vásquez Editor Responsable: Luis E. Rangel y Manuel Martino Del Molino. Las ideas y opiniones expresadas en esta revista son responsabilidad única y exclusiva de los autores, la revista no se responsabilizara por dichas opiniones. Avenida Universidad Los Guaritos. Maturín, Monagas, Venezuela Teléfono: +58 (0291) 6417755 Correo electrónico: [email protected]
RIF: G-20000052-0
Actualmente vivimos en un mundo con un alto auge por la creación de
nuevas formas de comunicación, y por ende adaptar el lenguaje con el que nos
comunicamos normalmente, pero como lograr eso depende exclusivamente en
que tan bien comprendamos nuestro propio lenguaje, que comprendamos el
origen, su estructura, sus ineficiencias, comprender todo de una manera holística,
para al final dar con una cosmovisión de la realidad del lenguaje y poder aplicar
las el conocimiento al mejoramiento de los métodos de comunicación.
Aquí se estudiara que es el lenguaje natural, en toda la extensión de su
palabra y como ese puede ser adaptado a las necesidades que surgen de los
sistemas computacionales, siendo un campo relacionado intrínsecamente con el
paradigma de la cibernética, que busca mejorar las relaciones entre las máquinas
y el hombre, y por supuesto un campo fundamental es la comunicación e
interacción entre las máquinas y el hombre.
Es el empleo de la palabra
para expresar ideas, comunicarse,
establecer relaciones entre los seres
humanos. Un lenguaje es un conjunto
de palabras, su pronunciación y los
métodos para combinarlas en frases
y oraciones, generalmente infinito y
que se forma mediante
combinaciones de palabras definidas
en un diccionario terminológico
previamente establecido. Las
combinaciones posibles deben
respetar un conjunto de reglas
sintácticas establecidas, a ello se le
conoce con el nombre de Sintaxis.
Además, las palabras deben tener
determinado sentido,
deben ser comprendidas
por un grupo humano en
un contexto dado, a ello se
le denomina Semántica.
Posiblemente los primero humanos utilizaban una suerte
de fonogramas que contribuyeron a la creación de
las primeras lenguas
A lo largo de la historia el ser humano
ha utilizado el lenguaje para trasmitir
sus conocimientos, sentimientos,
emociones, sensaciones,
comunicarse con el resto de los
humanos y esta función del lenguaje
la ha desarrollado de manera oral,
gráfica, escrita o por señas. [1]
Desde un punto de vista más
amplio, el lenguaje indica una
característica común al hombre y a
los animales para expresar sus
experiencias y comunicarlas a otros
mediante el uso de símbolos, señales
y sonidos registrados por los órganos
de los sentidos. El ser humano
emplea un lenguaje complejo que se
expresa con secuencias sonoras y
signos gráficos. Los animales, por su
parte, se comunican a través de
signos sonoros y corporales y en
muchos casos distan de ser
sencillos.[2]
Entre los tipos de lenguajes cabe
destacar mencionar
que existen dos tipos:
Los lenguajes
naturales como
el español, el
ruso, el inglés,
el francés, etc.
Los lenguajes
formales como
los lenguajes de programación,
el lenguaje de la lógica
matemática, etc.[1]
Lenguaje Natural
El término lengua natural designa una
variedad lingüística o forma de
lenguaje humano con fines
comunicativos que está dotado de
una sintaxis y que obedece
supuestamente a los principios de
economía y optimidad. Las lenguas
naturales usualmente están basadas
en símbolos sonoros pero también
pueden existir lenguas basadas en
signos.
En la sociolingüística, el término
lengua natural también se
utiliza a veces como
lengua étnica en
contraposición a las
lenguas planificadas
(como el esperanto). La
lengua étnica evoluciona
enmarcada por una
cultura de hablantes
nativos que utilizan dicha lengua con
una finalidad comunicativa. De esta
forma, se distingue entre idiomas
tales como el chino mandarín, el
español y el inglés, las cuales son
lenguas étnicas; y el esperanto, ido,
interlingua, a las cuales se les
denomina lenguas planificadas. Sin
embargo, una lengua planificada
también puede adquirir una cultura y
hablantes nativos, como es el caso
del esperanto. Además, formalmente
las lenguas planificadas y las lenguas
étnicas pueden cumplir igualmente
Charles F. Hockett
con los requisitos de poseer sintaxis y
principios de economía que las hagan
aptas para la comunicación humana
general.
Características de las lenguas
naturales
Varios autores han redactado
listas de características definitorias de
qué es una lengua natural, algunas
de las cuales están presentes en la
comunicación animal y los lenguajes
formales. Sin embargo, sólo las
lenguas naturales tienen estos quince
rasgos de
Hockett y, por
tanto, esta lista
caracteriza lo
que es una
lengua natural.
Entre los rasgos más
definitorios están la
arbitrariedad (de la relación entre el
signo y el significado), la
productividad (que permite producir
nuevos mensajes nunca antes
realizados) y la estructura jerárquica
(según la cual, las lenguas humanas
poseen reglas o principios sintácticos
y gramaticales, por lo que las
producciones no son aleatorias).[3]
Según el lingüista Charles Hockett,
existen seis rasgos fundamentales de
las lenguas naturales:
1. Desplazamiento: nos permite
hablar sobre elementos que no
están presentes en el contexto
y sucesos que no ocurren en el
momento. Es decir, tenemos
conciencia del tiempo: pasado,
presente y futuro. Va unido al
concepto de la muerte, cuya
angustia previa es eclipsada
por las religiones.
2. Arbitrariedad: en los animales
parece haber conexión entre el
mensaje y la señal, los signos
no son arbitrarios. Las señales
son un inventario limitado en
casi todas las especies. La
relación entre una palabra y su
representación es casual.
3. Productividad: cuando surgen
nuevas situaciones u objetos
que han de ser descritos, los
usuarios manipulan el lenguaje
para producir nuevas
expresiones y proposiciones.
Somos capaces de producir
nuevas palabras, expresiones,
cosas que los demás no han
sido capaces de crear.
4. Transmisión cultural: aunque
los humanos
nacemos
con una
capacidad
innata para
el lenguaje,
la realización
concreta de
este y sus conexiones
semánticas son un producto
cultural que se transmite por
tradición. Nuestro lenguaje se
transmite dentro de una
sociedad, culturalmente, para
que se active.
5. Elementos discretos: cada
sonido de la lengua es
discriminable del resto y el
conjunto tiende a ser
interpretado como un sonido
de la lengua con un significado
específico. Entre todos los
sonidos posibles de alrededor,
identificamos los que sabemos
descodificar y darles
significado.
6. Dualidad: dos niveles de
realización; por un lado, el que
permite decir los sonidos y, por
otro, pronunciar esos sonidos
como una o varias
palabras con
significado (c-a-l-o:
loca, cola...). Nuestro
lenguaje puede
referirse a sonidos que
combinados son
palabras y forman
frases a su vez.
7. Canal vocal-auditivo: el habla
se genera en las cuerdas y se
percibe por los oídos.
8. Intercambiabilidad: cualquier
emisor se puede convertir en
receptor.
9. Especialización: las señales
lingüísticas solo sirven para
comunicarse, para transmitir
significados.
10. Transmisión irradiada: la
señal no se puede dirigir y la
puede interceptar cualquiera.
11. Evanescencia: las señales
desaparecen en el mismo
momento de emitirlas.
Test de Turing
12. Retroalimentación: el propio
hablante oye todo lo que dice y
puede reflexionar sobre ello.
13. Semanticidad: los signos
tienen significado porque se
asocian de forma estable a
elementos de la vida real.
Las 7 últimas propiedades son
compartidas con algunos animales.
Estas caracterizan al lenguaje
humano, pero no lo distinguen de
otros sistemas de comunicación.[5]
Procesamiento del
Lenguaje Natural
Por Procesamiento de Lenguaje
Natural (PLN, denominado también
NLP por sus siglas en inglés) se
entiende la habilidad de la máquina
para procesar la información
comunicada, no simplemente las
letras o los sonidos del lenguaje.
El procesamiento del lenguaje es de
manera general, el conjunto de
instrucciones que una computadora
recibe en un lenguaje de
programación dado (formal), que le
permitirán comunicarse con un
humano en su propio lenguaje,
(inglés, francés, español, etc.)
Origen
La historia del PLN empieza desde
1950, aunque existe trabajo
encontrado desde periodos
anteriores. En 1950, Alan Turing
publicó Computing machinery and
intelligence el cual proponía lo que
Noam Chomsky
hoy llamamos test de turing como
criterio de inteligencia. El experimento
de Georgetown en 1954 involucro
traducción automática de más de
sesenta oraciones del ruso al inglés.
Los autores clamaron que en tres o
cinco años la traducción automática
sería un problema resuelto. El
progreso real en traducción
automática fue más lento y después
del reporte ALPAC en 1996, el cual
demostró que la investigación había
tenido un bajo desempeño. Más tarde
investigación a
menor escala en
traducción
automática se llevó a
cabo hasta finales de
1980, cuando se
desarrollaron los
primeros sistemas de
traducción
automática
estadística. Esto se debió tanto
al aumento constante del poder
de cómputo resultante de la Ley de
Moore y la disminución gradual del
predominio de las teorías lingüísticas
de Noam Chomsky (por ejemplo, la
Gramática Transformacional), cuyos
fundamentos teóricos desalentaron el
tipo de lingüística de corpus, que se
basa el enfoque de aprendizaje de
máquinas para el procesamiento del
lenguaje. Algunos de los primeros
algoritmos de aprendizaje automático
utilizados, tales como árboles de
decisión, sistemas producidos de
sentencias si-entonces similares a las
reglas escritas a mano.
Niveles del Procesamiento del
Lenguaje Natural
Nivel fonológico:
trata de cómo las
palabras se
relacionan con los
sonidos que
representan.
Ejemplo:
Rápida + mente ==
rápidamente
Nivel morfológico: trata de cómo
las palabras se construyen a partir de
unas unidades de significado más
pequeñas llamadas morfemas.
Ejemplos:
teléfono: tele (morfema prefijo) + fono
(lexema)
Nivel sintáctico: trata de cómo las
palabras pueden unirse para formar
oraciones, fijando el papel estructural
que cada palabra juega en la oración
y que sintagmas son parte de otros
sintagmas.
Nivel semántico: trata del
significado de las palabras y
de cómo los significados se
unen para dar significado a
una oración, también se
refiere al significado
independiente del contexto,
es decir de la oración aislada.
Nivel pragmático: trata de cómo
las oraciones se usan en distintas
situaciones y de cómo el uso afecta el
significado de las oraciones. Se suele
reconocer un sub-nivel recursivo:
discursivo, que trata de cómo el
significado de una oración se ve
afectado por las oraciones
inmediatamente anteriores.[8]
Arquitectura de un sistema de
Procesamiento del Lenguaje
Natural
Uno de los elementos fundamentales
en el diseño de un sistema PLN es
sin lugar a dudas la determinación de
la arquitectura del sistema, es decir,
computadora y como ella interpreta y
analiza las
oraciones
que le
sean
proporcionadas. A continuación se
muestra un esquema del análisis
léxico/ sintáctico por computadora. El
sistema consiste de:
a. El usuario le expresa (de
alguna forma) a la
computadora que tipo de
procesamiento desea hacer;
b. La computadora analiza las
oraciones proporcionadas, en
Arquitectura de un Sistema PLN
el sentido morfológico y
sintáctico;
c. Luego, se analizan las
oraciones semánticamente, es
decir se determina el
significado de cada oración;
d. Se realiza el análisis
pragmático del texto. Así, se
obtiene una expresión final.
Se ejecuta la expresión final y se
entrega al usuario para su
consideración.[1]
Aplicaciones del Procesamiento
de Lenguajes Naturales
Las aplicaciones del procesamiento
de lenguajes naturales son muy
variadas, ya que su alcance es muy
grande, algunas de las aplicaciones
son:
Traducción automática
Se refiere más que nada a la
traducción correcta de un lenguaje a
otro, tomando en cuenta lo que se
quiere expresar en cada oración, y no
solo palabra por palabra.
Recuperación de la información:
En esta aplicación, un claro ejemplo
seria el siguiente: una persona llega a
la computadora y le dice (en lenguaje
natural) que es lo que busca, esta
busca y le dice que es lo que tiene
referente al tema.
Resolución cooperativa de
problemas:
La computadora debe tener la
capacidad de cooperar con los
humanos para la solución de
problemas complejos,
proporcionando datos e información,
incluyendo también, la demanda de
información por parte del ordenador
al usuario, debiendo existir una
excelente interactividad entre el
usuario y el ordenador.
Reconocimiento de voz:
Esta es una aplicación del
Procesamiento de Lenguajes
Naturales que más éxito ha obtenido
en la actualidad, ya que las
computadoras de hoy ya tienen esta
característica, el reconocimiento de
voz puede tener dos posibles usos:
para identificar al usuario o para
procesar lo que el usuario dicte,
existiendo ya programas comerciales,
que son accesibles por la mayoría de
los usuarios, ejemplo: viavoice.[6]
Referencias Bibliográficas
[1]-González Díaz, E. (Noviembre de 2006). Monografias.com. Recuperado el 26
de Marzo de 2015, de http://goo.gl/Z6v2Wr
[2]- Lenguaje. (2015, 21 de marzo). Wikipedia, La enciclopedia libre. Fecha de
consulta: 04:24, marzo 27, 2015 desde http://goo.gl/Un5R34
[3]- Lengua natural. (2014, 11 de noviembre). Wikipedia, La enciclopedia libre.
Fecha de consulta: 04:26, marzo 27, 2015 desde http://goo.gl/jnzxgx
[4]- Perez Hernandez, S. R. (13 de Feberero de 2011). saylerrene.blogspot.com. Recuperado el 26 de Marzo de 2015, de http://goo.gl/xpFPh0
[5]- descubriendoelenguaje.blogspot.com. (11 de Mayo de 2008). Recuperado el 26 de Marzo de 2015, de http://goo.gl/zKVHJY
[6]- Procesamiento de lenguajes naturales. (2015, 20 de marzo). Wikipedia, La
enciclopedia libre. Fecha de consulta: 04:33, marzo 27, 2015 desde
http://goo.gl/jiiDWp
[7]- Rodriguez Correa, S., & Benavides Cañon, P. A. (23 de Mayo de 2007). eprints.rclis.org/. Recuperado el 26 de Marzo de 2015, de http://goo.gl/Fsok34
[8]-Muñoz Fernandez, S. (2007). procesamientolenguajerecuperacion.50webs.org. Recuperado el 26 de Marzo de 2015, de http://goo.gl/x8Crsy