You are on page 1of 7

Procesamiento del Lenguaje Natural medio de comunicacin persona-ordenador

Autores: Ing. Alexander Gmez Betancourt, Ing. Ingrid Viamontes de Armas, Ing. Alexei Daz Soto.
La Habana, Septiembre 2015

Resumen
El Procesamiento del Lenguaje Natural, como disciplina de la Inteligencia Artificial ha
brindado al hombre un acercamiento hacia la comunicacin con las mquinas. Tambin ha
posibilitado que estas ltimas puedan ser capaces de generar conocimientos a partir de los
datos introducidos en los sistemas. El presente artculo muestra una revisin de la
bibliografa de los autores que abordan esta temtica, realizando una comparacin entre las
distintas definiciones con el objetivo de evidenciar la evolucin de los conceptos y
aplicaciones de esta disciplina.
Palabras Claves: Lenguaje natural, procesamiento, inteligencia artificial, comunicacin.
Abstract
The Natural Language Processing, as a discipline of Artificial Intelligence has given the man
an approach to communication with machines. It has also enabled the latter to be able to
generate knowledge from data entered in the systems. This article presents a review of the
literature of authors investigate this subject, making a comparison between the different
definitions in order to demonstrate the evolution of the concepts and applications of this
discipline.
Keywords: Natural language, processing, artificial intelligence, communication.
Introduccin
La comunicacin es una facultad principalmente de los seres humanos, que ha contribuido
enormemente en la organizacin y desarrollo de la sociedad (Chavez & Zulueta, 2014). La
misma es expresada mediante el lenguaje natural, trmino definido por varios autores como:
una de las manifestaciones de la capacidad cognitiva del ser humano en la que da curso a
la exteriorizacin de sus pensamientos a sus semejantes (Ayala, 2006). Por su parte
(Hernndez & Gmez, 2013) lo definen como el instrumento que los seres utilizamos para
comunicar el conocimiento. En los aos 50 el britnico Alain Turing hablaba de la inteligencia

artificial. Sus trabajos y publicaciones fueron fundamentales para el desarrollo de esta


materia. Este importante hombre de ciencia postul lo que se conoce como el Test de
Turing. Definiendo que: si una mquina era capaz de responder con inteligencia, sus
respuestas podan ser indistinguibles de las de un ser humano. (Turing, 1950). Abriendo as
la brecha de la comunicacin entre el humano y la mquina; estableciendo preguntas,
respuestas y con ello una comunicacin entendible; de all surgen incgnitas: ser esto
posible? Hasta dnde se ha avanzado en tal sentido? Sobre el tema versa en el presente
artculo abordando conceptos y aplicaciones, de lo que se define como Procesamiento del
Lenguaje Natural.
Procesamiento del Lenguaje Natural
Uno de los bienes ms preciados de la humanidad es el conocimiento, afirma (Gelbukh,
2010), siendo los libros un registro del mismo. Muchos de estos libros se encuentran
almacenados en formato digital ayudando al almacenamiento e indexacin del conocimiento.
Al respecto seala (Vsquez & Huayna, 2009) la computadora permite almacenar datos e
informacin en archivos, los que puede copiar, respaldar, transmitir, borrar, pero no puede
buscar las respuestas a preguntas formuladas, hacer inferencias lgicas sobre su contenido,
generalizar y resumirlo, es decir, hacer todo lo que las personas normalmente hacemos
con el texto. Es por ello que surge el Procesamiento del Lenguaje Natural (PLN) una rama
muy importante de la Inteligencia Artificial y una de las ms antiguas, las primeras
traducciones automticas iniciaron en la dcada de los 40`s a la par que la II Guerra mundial,
sin embargo a causa de la escasa potencia computacional los intentos fracasaron, pero a
pesar de ello, a partir de la dcada del 60 el PLN resurgi nuevamente.
Como parte de la evolucin de la solucin al problema de la comprensin del lenguaje natural
por parte de las mquinas encontramos a Terry Winograd, creador del programa SHRDLU.
Este programa fue desarrollado en los ltimos aos de la dcada de los 60. Estaba diseado
para comprender el lenguaje natural (Fang, 1966). SHRDLU es un programa que trabaja en
un micro mundo donde solo existe una mesa, y unos bloques de diferentes colores, tamaos
y formas; donde un interlocutor le va ordenando la ejecucin de rdenes sobre los objetos
que maneja, siendo capaz de entender ciertas definiciones y manejarse de una manera
impresionante, llevndolas a cabo de forma ingeniosa (Martn, 2002). Estamos ante una de
las primeras veces que un hombre se comunica con una mquina mediante lenguaje natural
de modo totalmente coherente. Sin embargo, las ambiciones que se ocultaban tras SHRDLU

fueron, rpidamente truncadas. Se disearon como el comienzo de algo grandioso.


Winograd pensaba que la nica dificultad para que su programa consiguiera manejar
plenamente la totalidad del lenguaje natural era ir progresivamente agrandando su mundo,
aspecto que no fue de esa forma, sino que se convierte en algo ms complejo (Perin
Pascual, 2012).
Para entablar una conversacin entendible entre hombre mquina fue necesario abrir las
lneas de investigacin del Procesamiento del Lenguaje Natural (Hernndez M.). Segn
(Hernndez & Gmez, 2013) el procesamiento del lenguaje involucra una transformacin a
una representacin formal, manipula esta representacin y por ltimo, si es necesario, lleva
los resultados nuevamente a lenguaje natural. Encontramos tambin que (Gelbukh, 2010)
define el PLN como la habilidad de la mquina para procesar la informacin comunicada, no
simplemente las letras o los sonidos del lenguaje. En este sentido continua (Gelbukh, 2010),
un perico no es un animal parlante; as, una contestadora telefnica comn, una impresora
o un procesador de palabras como Microsoft Word tampoco son dispositivos o software de
PLN, mientras que un traductor automtico sin duda lo es.
Para (Mitkov, 2003) el punto de partida para el procesamiento del lenguaje natural es el
anlisis sintctico. ste es el encargado de realizar la verificacin de las distintas reglas de
formacin de un lenguaje y de generar, como resultado de este proceso, representaciones
grficas en forma de estructura jerrquica o rbol sintctico. Con estos rboles se define si
una expresin pertenece o no a un lenguaje. Por lo que podra decirse que el procesamiento
del lenguaje natural conlleva a un anlisis previo de la sintaxis del lenguaje y sus reglas para
transformarlo en un lenguaje que pueda ser entendido por los programas informticos con
el fin de alcanzar un resultado.
Para el desarrollo del Procesamiento del Lenguaje Natural debido a su complejidad se hizo
necesario la separacin en varios campos de estudios, segn autores revisados
encontramos:

La recuperacin y extraccin de informacin segn (Manning, Raghavan, & Schtze,


2008), es el proceso de encontrar en un repositorio grande de datos y material,
usualmente documentos, de naturaleza no estructurada, usualmente texto o
semiestructurada, como pginas Web, que satisfaga una necesidad de informacin.

La minera de datos proporciona herramientas poderosas para descubrir patrones


ocultos y relaciones en datos estructurados (Hernndez & Gmez, 2013).

La traduccin automtica tiene objetivos claros: tomar el texto escrito en un lenguaje


y traducirlo a otro, manteniendo el mismo significado (Hernndez & Gmez, 2013).

Los sistemas de bsquedas de respuestas Son sistemas diseados para tomar una
pregunta en lenguaje natural y proporcionar una respuesta (Hernndez & Gmez,
2013).

Generacin de resmenes automticos son mtodos que se basan en los mismos


principios usados en la identificacin de trminos, frases o prrafos significativos que
definen el significado del texto original. (Hernndez & Gmez, 2013)

El anlisis de sentimientos en textos es la identificacin y extraccin de informacin


subjetiva (Feldman & Sanger, 2006). La forma bsica de anlisis de sentimientos es
una clasificacin polarizada de sentimientos que puede asignar calificaciones de en
un rango de -10 a 10 que se basa en el aprendizaje para evaluar emociones tanto
negativas como positivas en corpus etiquetados de entrenamiento (Hernndez &
Gmez, 2013).

Todos estos campos de estudio indican lo complicado que resulta el tema del Procesamiento
del Lenguaje Natural, as como la gran aplicacin en diferentes esferas de la vida. Segn la
International Data Corporation, el mundo gener 1,8 Zetabytes de informacin digital en 2011
y se espera que para el 2020 se genere 50 veces esa cantidad (Reinsel, 2011). Con la
llegada de internet y la gran cantidad de volmenes de textos, en lugar de introspeccin e
intuicin, se convirti en el estudio estadstico directo de los datos disponibles. La lingstica
computacional, en su etapa actual de desarrollo, es principalmente una rama de las
tecnologas de aprendizaje automtico, una parte de la inteligencia artificial y la estadstica.
(Gelbukh, 2010)
Aplicaciones
Todos estos avances paralelos hacen que esta rama de la inteligencia artificial contenga un
nmero de aplicaciones inimaginables. Estas ramas de aplicaciones del PLN se pueden
agrupar en:

Comunicacin y transmisin del conocimiento: (Gelbukh, 2010) El conocimiento se


almacena y se transmite en forma de lenguaje humano o los textos escritos. La

digitalizacin, la bsqueda, la presentacin de la informacin y su uso directo por el


software son componentes esenciales en su uso eficiente.

Traduccin (Gelbukh, 2010)

La calidad de la traduccin automtica se mejor

dramticamente en la ltima dcada. Estos sistemas son actualmente deficientes en


la calidad del texto que producen y la traduccin incorrecta.

Robtica (Geographic, 2010) Segn el gobierno de Corea del Sur, cada familia
coreana en el ao 2020 tendr un robot ayudante en la casa con el cual las familias
se podrn comunicar en forma de rdenes.

Composicin de textos (Sierra, 2001) Proporcionan ayuda al usuario para escribir


documentos: verifican la ortografa, la gramtica y el estilo; completan las palabras o
frases que empieza a escribir el usuario, brindan traducciones, sinnimos y
explicaciones de las palabras o sugieren palabras segn su descripcin

Publicaciones recientes evidencian la importancia y avances logrados en la tecnologa para


un mejor Procesamiento del Lenguaje Natural. Un ejemplo es un androide hecho a mano por
David Hanson que se asemeja al famoso y fallecido escritor de ciencia ficcin Philip K. Dick.
Lo que hace que el androide Dick tan notable no es tanto su aspecto como es su capacidad
de mantener una conversacin inteligente (Dufty, 2012).
Tambin el sistema ACAT, recientemente fue liberado. Este sistema es usado por el profesor
Hawking y consiste en capturar los movimientos del msculo de la mejilla, estos movimientos
se traducen en palabras, que son dictadas en tiempo real por el programa de sntesis de
voz. Parte importante de este sistema, es que ha sido creado especialmente para Hawking,
gran parte est basado en el sistema de prediccin SwiftKey. (lvarez, 2015).

Conclusiones
El estudio asociado al Lenguaje natural y su procesamiento estn orientado a desarrollar
aplicaciones y recursos de ingeniera lingstica que permitan a los usuarios no expertos
acceder a ellos de manera adecuada. Adems de propiciar una comunicacin mucho ms
fluida y menos rgida que la permitida por los lenguajes formales entre la persona y el
ordenador. A pesar de tener grandes avances tecnolgicos se requiere de muchos ms
esfuerzos y recursos por parte de la comunidad cientfica, para mejorar la precisin y
rendimiento de las aplicaciones. Lo que permitira el desarrollo de las investigaciones que

giran en torno al PLN, rama de la Inteligencia Artificial de vital importancia para la evolucin
de la sociedad actual.

Referencias
lvarez, R. (2015). El software que usa Stephen Hawking para comunicarse ya est
disponible para todos. Weblogs S.L. Xataka. Retrieved from
Ayala, A. P. (2006). Lenguaje Natural: Descripcin de las Etapas para su Tratamiento.
Mxico DF, Mxico: Instituto Politcnico Nacional.
Dufty, D. F. (2012). How to Build an Android: The True Story of Philip K. Dick's Robotic
Resurrection: Henry Holt and Company.
Fang, I. E. (1966). It Isn't Etaoin Shrdlu; It's Etaoni Rshdlc. Journalism & Mass
Communication Quarterly, 43(4), 761-762. doi:10.1177/107769906604300418
Feldman, R., & Sanger, J. (2006). The text mining handbook. Londres: Cambridge University
Press.
Gelbukh, A. (2010). Procesamiento de Lenguaje Natural y sus Aplicaciones. Komputer
Sapiens, I, 6-11.
Geographic, N. (2010). A Robot in Every Home by 2020, South Korea Says.
Hernndez, M., & Gmez, J. (2013). Aplicaciones de Procesamiento de Lenguaje Natural.
Revista Politcnica, 87-96.
Manning, C. D., Raghavan, P., & Schtze, H. (2008). Introduction to information retrieval.
Londres: Cambridge University Press.
Martn, J. M. M. (2002). Conocimiento de los computadores: Anlisis de programas clsicos
Contrastes: revista internacional de filosofa, VII, 177-189.
Mitkov, R. (2003). The Oxford Handbook of Computational Linguistics. New York: Oxford
University Press.
Perin Pascual, J. C. (2012). En defensa del procesamiento del lenguaje natural
fundamentado en la lingstica terica. Revista de Lingstica, Filologa y Traduccin,
26, 13-48.
Reinsel, J. F. G. y. D. (2011). Extracting value from chaos. Retrieved from
S.A., E. (2015). Industria destina 6 millones a procesamiento del lenguaje natural para
tecnologas aplicadas al espaol. El Economista.

Sierra, G. (2001). Busqueda de palabras a partir de las definiciones en los diccionarios de


lengua automatizados. Actas de 70 Simposio Internacional de Comunicacin Social
Santiago de Cuba, 2.
Turing, A. M. (1950). Computing Machinery and Intelligence. Mind, 59(236), 433-460.
doi:10.2307/2251299

You might also like