000058610 001__ 58610
000058610 005__ 20170831220642.0
000058610 037__ $$aTAZ-TFM-2016-1123
000058610 041__ $$aspa
000058610 1001_ $$aAznar Gimeno, Rocío
000058610 24200 $$aText Mining
000058610 24500 $$aMinería de textos
000058610 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2016
000058610 500__ $$aCon la colaboración del Instituto Tecnológico de Aragón (Itainnova).
000058610 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000058610 520__ $$aLa Minería de textos es una disciplina emergente y con un gran impacto a día de hoy. Busca extraer la información que no se encuentra de forma explícita en un texto. Surge por analogía a la Minería de datos, pero con un problema latente, la dificultad de la codificación de la información. Entre las posibles tareas de la Minería de textos, la que se aborda en este trabajo es el reconocimiento y clasificación de entidades nombradas. El propósito de esta tarea es detectar y clasificar de forma automatizada las entidades nombradas en un texto. En nuestro caso, cuando hablemos de  entidades nombradas nos referimos a los nombres propios. En primer lugar, se hace un análisis de clasificación binaria y después se aborda una tarea más compleja como es la clasificación multiclase de nombres propios, distinguiendo las categorías de: organización, persona, localización y miscelánea. El objetivo del trabajo es resolver estos problemas mediante la construcción de modelos de redes neuronales, en particular, el perceptrón multicapa y las redes recurrentes (LSTM). En la estimación de estos modelos se ha analizado cómo diversos parámetros pueden influir en la mejora de los resultados de clasificación. Se introduce también la herramienta Word2vec, basada en redes neuronales, que permite la codificación continua de las palabras y que se ha aplicado para mejorar el problema de clasificación multiclase. Como parte práctica del trabajo, se presentan los mejores resultados obtenidos en la validación de los modelos con consideraciones sobre la influencia de los parámetros en la construcción de estos modelos.  Finalmente, se exponen las posibles mejoras para un trabajo futuro en el campo.
000058610 521__ $$aMáster Universitario en Modelización e Investigación Matemática, Estadística y Computación
000058610 540__ $$aDerechos regulados por licencia Creative Commons
000058610 700__ $$aEsteban Escaño, Luis Mariano$$edir.
000058610 700__ $$aVea-Murguía Merck, Jorge$$edir.
000058610 7102_ $$aUniversidad de Zaragoza$$bMétodos Estadísticos$$cEstadística e Investigación Operativa
000058610 7202_ $$aSanz Sáiz, Gerardo$$eponente
000058610 8560_ $$f648807@celes.unizar.es
000058610 8564_ $$s1277922$$uhttps://zaguan.unizar.es/record/58610/files/TAZ-TFM-2016-1123.pdf$$yMemoria (spa)
000058610 909CO $$ooai:zaguan.unizar.es:58610$$pdriver$$ptrabajos-fin-master
000058610 950__ $$a
000058610 951__ $$adeposita:2017-01-26
000058610 980__ $$aTAZ$$bTFM$$cCIEN