TAZ-PFC-2011-075


Modelo de comprensión de frases en un micromundo y posible aplicación al campo de la traducción máquina

Ramón Letosa, Jorge
Honkela, Timo (dir.)

González Bedia, Manuel (ponente)

Universidad de Zaragoza, CPS, 2011
Informática e Ingeniería de Sistemas department, Lenguajes y Sistemas Informáticos area

Ingeniero en Informática

Abstract: El trabajo realizado está dividido en dos fases principales. Primero se estudia la comprensibilidad de sentencias escritas y la representación en planos bidimensionales de las situaciones referidas por dichas sentencias. Posteriormente, el modelo desarrollado se utiliza para estudiar su adecuación en tareas de Traducción Máquina en las que se ha de tener en cuenta información contextual. En la primera fase del proyecto se desarrolla un modelo que posibilita la representación de situaciones en un micromundo utilizando el mapa auto-organizativo SOM y el procesamiento de frases sencillas que describen dichas situaciones mediante el uso de una red neuronal recurrente simple (SRN). El mapa SOM es entrenado sobre un conjunto de situaciones ejemplo que conforman la experiencia del sistema y posibilitan la representación en el espacio de salida SOM del modelo cualquier situación posible. A continuación, un conjunto de frases es entrenado mediante la red SRN para posibilitar la transformación de frases a situaciones, resultando en su conjunto un modelo que recibe como valor de entrada una frase describiendo una determinada situación y muestra como salida, en el caso ideal, la representación de dicha situación sobre el mapa SOM. La red SRN permite contar con información contextual basada en la información recibida en entradas previas, por lo que el modelo desarrollado resulta adecuado para tareas relacionadas con el procesamiento de lenguaje y, más concretamente, con la comprensión de frases e historias. Además, el espacio SOM de salida del modelo resulta ser independiente tanto del lenguaje utilizado en la entrada y su estructura proposicional como del número de situaciones que forman el conjunto de entrenamiento o experiencia, posibilitando la formación de un espacio sobre el cual poder realizar razonamientos lógicos básicos como si de un diagrama Venn se tratara. En los experimentos realizados se muestra cómo el modelo no sólo es capaz de comprender frases a las que había sido entrenado, sino que también es capaz de generalizar, comprendiendo frases que no habían sido presentadas en el entrenamiento y que describen situaciones nuevas. En la segunda fase del proyecto se diseña e implementa un sistema basado en el trabajo realizado en la primera fase con el que se pretende estudiar qué posibilidades ofrece el modelo siendo base o componente de un modelo que permita llevar a cabo tareas de Traducción Máquina (MT), prestando especial atención a aquellos casos donde la frase o palabra de entrada puede presentar diversas traducciones y esta ambigüedad ha de resolverse atendiendo al contexto de la situación. El espacio de salida SOM se utiliza ahora como espacio único de representación conceptual compartido por dos microlenguajes que difieren en la manera en la que relacionan los símbolos léxicos con los conceptos, uno de ellos basado en el español y el otro en el inglés. Dicho espacio situacional compartido por ambos microlenguajes realiza la función de componente intermedio en la tarea de traducción a partir del cual se extrae información contextual y conceptual de la situación descrita por la frase de entrada, útil para producir como salida la nueva frase traducida. De manera paralela al entrenamiento del espacio SOM, dos nuevos mapas SOM de mismo tamaño, uno para cada microlenguaje, son entrenados tomando como entrada la información conceptual presente en las situaciones del conjunto experiencia. Cada uno de estos mapas presenta la organización de las palabras del microlenguaje en base a su relación conceptual, de forma que aquellas palabras que poseen mayor similitud conceptual y/o son utilizadas para expresar situaciones similares aparecen dispuestas más próximas en estos mapas de vocabulario, que se utilizan en el proceso de producción de la frase traducida. Este proyecto es una extensión de un trabajo publicado junto con el profesor Timo Honkela en la Conferencia Internacional de Redes Neuronales Artificiales (ICANN) de Septiembre de 2010: Elementary Logical Reasoning in the SOM Output Space.


Free keyword(s): traducción máquina ; representación del conocimiento ; SOM ; SRN ; redes neuronales ; comprensión de frases ; traducción
Tipo de Trabajo Académico: Proyecto Fin de Carrera
Notas: Realizado en la Universidad Aalto (Espoo, Finlandia).

Creative Commons License

El registro pertenece a las siguientes colecciones:
Academic Works > Trabajos Académicos por Centro > centro-politecnico-superior
Academic Works > Final Degree Projects




Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)