TAZ-TFM-2017-1342


Desarrollos de modelos de Deep Learning para comprensión de textos usando técnicas NLP

Aguilar Ibáñez, Andrea
Esteban Escaño, Luis Mariano (dir.) ; Peña Larena, Paula (dir.) ; Sanz Saiz, Gerardo (dir.)

Universidad de Zaragoza, CIEN, 2017
Departamento de Métodos Estadísticos, Área de Estadística e Investigación Operativa

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación

Resumen: La necesidad de tratar con grandes volúmenes de datos plantea ciertas dificultades a la hora de su procesamiento y almacenamiento por parte del software y los sistemas de gestión de bases de datos tradicionales, más aún si estos datos son no estructurados, como ocurre con los datos textuales, que son los tratados en este Trabajo Fin de Máster. La utilización de métodos de Deep Learning es cada vez más habitual cuando se trabaja con conjuntos de datos de gran tamaño, ya que permiten una mejor representación de los mismos y por lo tanto mejores resultados. Se ha trabajo sobre estos métodos en el área particular de la minería de textos, y el procesamiento del lenguaje natural (NLP). El objetivo del presente trabajo es estudiar el aunamiento de los sistemas basados en el conocimiento y los sistemas de almacenamiento, así como estudiarlos desde un punto de vista analítico y de optimización que permitiese conocer a fondo su funcionamiento para así poder obtener un mayor rendimiento. Estos sistemas, conocidos como "redes de memoria", combinan algoritmos de aprendizaje automático, en particular las redes neuronales, con una memoria que permita almacenar y recuperar información de forma relevante según el objetivo buscado. La recuperación de información relevante es la técnica de la minería de textos en la que se centran los modelos que se van a estudiar, con la aplicación de la "búsqueda de respuestas" (Question Answering). La búsqueda de respuestas consiste en que dada una cierta cantidad de documentos con datos en forma de texto, el sistema debe ser capaz de generar respuestas a preguntas planteadas en lenguaje natural, a partir de la información disponible. Además, también se han analizado diferentes formas de representación de la información para mejorar la eficiencia de las redes estudiadas: las Redes de Memoria End-to-End (MemN2N) y las Redes de Memoria Clave-Valor (KV-MemNN). Como parte práctica del trabajo, se presentan los análisis realizados y los mejores resultados obtenidos en la validación de los modelos con consideraciones sobre la influencia de los parámetros en la construcción de estos modelos. Finalmente, se exponen futuras líneas de trabajo a seguir y posibles aplicaciones.

Tipo de Trabajo Académico: Trabajo Fin de Master
Notas: Con la colaboración del Instituto Tecnológico de Aragón (ITAINNOVA).

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Facultad de Ciencias
Trabajos académicos > Trabajos fin de máster




Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)