TAZ-TFM-2016-1123


Minería de textos

Aznar Gimeno, Rocío
Esteban Escaño, Luis Mariano (dir.) ; Vea-Murguía Merck, Jorge (dir.)

Sanz Sáiz, Gerardo (ponente)

Universidad de Zaragoza, CIEN, 2016
Departamento de Métodos Estadísticos, Área de Estadística e Investigación Operativa

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación

Resumen: La Minería de textos es una disciplina emergente y con un gran impacto a día de hoy. Busca extraer la información que no se encuentra de forma explícita en un texto. Surge por analogía a la Minería de datos, pero con un problema latente, la dificultad de la codificación de la información. Entre las posibles tareas de la Minería de textos, la que se aborda en este trabajo es el reconocimiento y clasificación de entidades nombradas. El propósito de esta tarea es detectar y clasificar de forma automatizada las entidades nombradas en un texto. En nuestro caso, cuando hablemos de entidades nombradas nos referimos a los nombres propios. En primer lugar, se hace un análisis de clasificación binaria y después se aborda una tarea más compleja como es la clasificación multiclase de nombres propios, distinguiendo las categorías de: organización, persona, localización y miscelánea. El objetivo del trabajo es resolver estos problemas mediante la construcción de modelos de redes neuronales, en particular, el perceptrón multicapa y las redes recurrentes (LSTM). En la estimación de estos modelos se ha analizado cómo diversos parámetros pueden influir en la mejora de los resultados de clasificación. Se introduce también la herramienta Word2vec, basada en redes neuronales, que permite la codificación continua de las palabras y que se ha aplicado para mejorar el problema de clasificación multiclase. Como parte práctica del trabajo, se presentan los mejores resultados obtenidos en la validación de los modelos con consideraciones sobre la influencia de los parámetros en la construcción de estos modelos. Finalmente, se exponen las posibles mejoras para un trabajo futuro en el campo.

Tipo de Trabajo Académico: Trabajo Fin de Master
Notas: Con la colaboración del Instituto Tecnológico de Aragón (Itainnova).

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Facultad de Ciencias
Trabajos académicos > Trabajos fin de máster




Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)