000006788 001__ 6788
000006788 005__ 20170831220339.0
000006788 037__ $$aTAZ-TFM-2011-149
000006788 041__ $$aspa
000006788 1001_ $$aBorjas Borjas, Bernardo José
000006788 24500 $$aGeneración automática de metadatos geográficos de páginas Web
000006788 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2011
000006788 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000006788 520__ $$aEste Trabajo Fin de Máster se dedicó al desarrollo de una arquitectura para la generación automática de metadatos geográficos para recursos de Web, con aspecto extensible y flexibilidad para la adición de nuevas características. Para el estudio de un caso de uso se desarrolló un prototipo que se empleó para la generación de registros OGC CSW que describen a los recursos Web. El primer experimento realizado para la validación del prototipo, sobre una muestra representativa de páginas Web principales de geoportales,  ha demostrado que el principal problema era la generación de información sobre la extensión geográfica, ya que las páginas Web no suelen contener metadatos geográficos específicos. Por esta razón, el sistema se complementó con el uso de una herramienta NER que aplica algoritmos NLP para la extracción de nombres de lugares del texto y el desarrollo de un componente para la estimación de la extensión geográfica (Bounding Box) que contempla los nombres geográficos encontrados dentro de los diferentes elementos de una página Web. Los resultados del segundo experimento pueden indicar que usando una heurística muy simple (basada en la frecuencia de nombres geográficos y la agrupación según la pertenencia a una unidad de organización territorial) se puede estimar la extensión geográfica, con un nivel satisfactorio, en casi un 70%.
000006788 521__ $$aMáster Universitario en Ingeniería de Sistemas e Informática
000006788 540__ $$aDerechos regulados por licencia Creative Commons
000006788 6531_ $$ametadatos
000006788 6531_ $$ainformación geográfica
000006788 6531_ $$arecuperación de información
000006788 6531_ $$ametadata
000006788 6531_ $$ageographical information
000006788 6531_ $$ainformation retrieval
000006788 700__ $$aZarazaga Soria, Francisco Javier$$edir.
000006788 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000006788 8560_ $$fbernardo@unizar.es
000006788 8564_ $$s829966$$uhttps://zaguan.unizar.es/record/6788/files/TAZ-TFM-2011-149.pdf$$yMemoria (spa)
000006788 909CO $$ooai:zaguan.unizar.es:6788$$ptrabajos-fin-master$$pdriver
000006788 950__ $$a
000006788 980__ $$aTAZ$$bTFM$$cEINA