000047425 001__ 47425
000047425 005__ 20190219123634.0
000047425 037__ $$aTESIS-2016-033
000047425 041__ $$aeng
000047425 080__ $$a004:007
000047425 1001_ $$aMoncla, Ludovic
000047425 24500 $$aAutomatic reconstruction of itineraries from descriptive texts
000047425 260__ $$aZaragoza$$bUniversidad de Zaragoza, Prensas de la Universidad$$c2015
000047425 300__ $$a216
000047425 4900_ $$aTesis de la Universidad de Zaragoza$$v2016-33$$x2254-7606
000047425 500__ $$aPresentado:  03 12 2015
000047425 502__ $$aTesis-Univ. Zaragoza, Informática e Ingeniería de Sistemas, 2015$$bZaragoza, Universidad de Zaragoza$$c2015
000047425 506__ $$aby-nc-nd$$bCreative Commons$$c3.0$$uhttps://creativecommons.org/licenses/by-nc-nd/3.0/
000047425 520__ $$aEsta tesis se inscribe dentro del marco del proyecto PERDIDO donde los objetivos son la extracción y reconstrucción de itinerarios a partir de documentos textuales. Este trabajo se ha realizado en colaboración entre el laboratorio LIUPPA de l' Université de Pau et des Pays de l' Adour (France), el grupo de Sistemas de Información Avanzados (IAAA) de la Universidad de Zaragoza y el laboratorio COGIT de l' IGN (France). El objetivo de esta tesis es concebir un sistema automático que permita extraer, a partir de guías de viaje o descripciones de itinerarios, los desplazamientos, además de representarlos sobre un mapa. Se propone una aproximación para la representación automática de itinerarios descritos en lenguaje natural. Nuestra propuesta se divide en dos tareas principales. La primera pretende identificar y extraer de los textos describiendo itinerarios información como entidades espaciales y expresiones de desplazamiento o percepción. El objetivo de la segunda tarea es la reconstrucción del itinerario. Nuestra propuesta combina información local extraída gracias al procesamiento del lenguaje natural con datos extraídos de fuentes geográficas externas (por ejemplo, gazetteers). La etapa de anotación de informaciones espaciales se realiza mediante una aproximación que combina el etiquetado morfo-sintáctico y los patrones léxico-sintácticos (cascada de transductores) con el fin de anotar entidades nombradas espaciales y expresiones de desplazamiento y percepción. Una primera contribución a la primera tarea es la desambiguación de topónimos, que es un problema todavía mal resuelto dentro del reconocimiento de entidades nombradas (Named Entity Recognition - NER) y esencial en la recuperación de información geográfica. Se plantea un algoritmo no supervisado de georreferenciación basado en una técnica de clustering capaz de proponer una solución para desambiguar los topónimos los topónimos encontrados en recursos geográficos externos, y al mismo tiempo, la localización de topónimos no referenciados. Se propone un modelo de grafo genérico para la reconstrucción automática de itinerarios, donde cada nodo representa un lugar y cada arista representa un camino enlazando dos lugares. La originalidad de nuestro modelo es que además de tener en cuenta los elementos habituales (caminos y puntos del recorrido), permite representar otros elementos involucrados en la descripción de un itinerario, como por ejemplo los puntos de referencia visual. Se calcula de un árbol de recubrimiento mínimo a partir de un grafo ponderado para obtener automáticamente un itinerario bajo la forma de un grafo. Cada arista del grafo inicial se pondera mediante un método de análisis multicriterio que combina criterios cualitativos y cuantitativos. El valor de estos criterios se determina a partir de informaciones extraídas del texto e informaciones provenientes de recursos geográficos externos.  Por ejemplo, se combinan las informaciones generadas por el procesamiento del lenguaje natural como las relaciones espaciales describiendo una orientación (ej: dirigirse hacia el sur) con las coordenadas geográficas de lugares encontrados dentro de los recursos para determinar el valor del criterio ``relación espacial''. Además, a partir de la definición del concepto de itinerario y de las informaciones utilizadas en la lengua para describir un itinerario, se ha modelado un lenguaje de anotación de información espacial adaptado a la descripción de desplazamientos, apoyándonos en las recomendaciones del consorcio TEI (Text Encoding and Interchange). Finalmente, se ha implementado y evaluado las diferentes etapas de nuestra aproximación sobre un corpus multilingüe de descripciones de senderos y excursiones (francés, español, italiano).
000047425 6531_ $$asistemas de información geográfica
000047425 6531_ $$adiseño y componentes de sistemas de información
000047425 6531_ $$ainteligencia artificial
000047425 700__ $$aNogueras Iso, Francisco Javier$$edir.
000047425 700__ $$aGaio, Mauro$$edir.
000047425 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas
000047425 8560_ $$fchperez@unizar.es
000047425 8564_ $$s7348650$$uhttps://zaguan.unizar.es/record/47425/files/TESIS-2016-033.pdf$$zTexto completo (eng)
000047425 909CO $$ooai:zaguan.unizar.es:47425$$pdriver
000047425 909co $$ptesis
000047425 9102_ $$aIngeniería de sistemas y automática$$bInformática e Ingeniería de Sistemas
000047425 980__ $$aTESIS