000063623 001__ 63623
000063623 005__ 20171221155143.0
000063623 037__ $$aTAZ-TFM-2017-1059
000063623 041__ $$aspa
000063623 1001_ $$aHiguera Muñoz, Jorge Eliecer
000063623 24200 $$aDevelopment of a data warehouse of academic publications with data visualization and reporting
000063623 24500 $$aDesarrollo de un almacén de datos de publicaciones científicas con visualización de datos e informes
000063623 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2017
000063623 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000063623 520__ $$aSe plantea como trabajo de fin de master: Diseñar e implementar un almacén de datos que permita evaluar el rendimiento científico de investigadores. Y así mismo poder analizar algunas métricas de los lugares de publicación de estos artículos.  Lo que se ha buscado desarrollar, es un proyecto que permita analizar de manera sencilla los indicadores de los artículos, autores y lugares de publicación de acuerdo a ciertas métricas establecidas. La herramienta está dirigida a usuarios convencionales que podrán manejar los dashboards desarrollados y también para usuarios expertos que podrán realizar cualquier tipo de consulta-análisis directamente en la base de datos y también podrán crear nuevos paneles de visualización de información. Lo que hace especial esta herramienta y diferente a las que ya existen, es que permite con solo una descarga de información de diferentes fuentes, integrar los datos de dichas fuentes y mostrar los indicadores en un mismo lugar. Se han utilizado técnicas de emparejamiento (matching) exacto, reemplazo de palabras clave y confianza-similitud basadas en la herramienta Data Quality Services de Microsoft. Teniendo en cuenta que es una herramienta en la cual se ha basado el emparejamiento, es posible que, si se utilizara esta o alguna otra herramienta especializada, se puedan obtener mejores resultados. Sin embargo, se ha implementado una carga de ficheros de configuración donde el usuario puede hacer emparejamiento manual. Por ejemplo, si la herramienta muestra dos nombres de autores diferentes, pero se sabe que es el mismo autor, pero escrito de forma diferente (Sergio Ilarri artigas – Ilarri, A. Sergio) se puede rellenar un fichero de configuración de nombres para que un proceso unifique estos nombres. Igualmente, con los nombres de los artículos y los nombres de los lugares de publicación. Se puede resumir el desarrollo de este proyecto en cinco fases principales: Análisis de las fuentes de información: Se ha hecho un esfuerzo por seleccionar las fuentes de información más importantes y a su vez las más adecuadas para el proyecto teniendo en cuenta la información que nos otorga cada una en los ficheros de exportación. Descarga de los ficheros de información: Ficheros de artículos y lugares de publicación. Diseño del almacén de datos: Modelo estrella bajo la metodología de Kimball. Proceso ETL: Carga de las tablas de Staging, auxiliares y finalmente las estrellas de Impacto Artículo e Impacto Lugar de Publicación. Visualización de información: Los informes presentados a los usuarios.
000063623 521__ $$aMáster Universitario en Ingeniería Informática
000063623 540__ $$aDerechos regulados por licencia Creative Commons
000063623 700__ $$aIlarri Artigas, Sergio$$edir.
000063623 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000063623 8560_ $$f695749@celes.unizar.es
000063623 8564_ $$s9871657$$uhttps://zaguan.unizar.es/record/63623/files/TAZ-TFM-2017-1059.pdf$$yMemoria (spa)
000063623 909CO $$ooai:zaguan.unizar.es:63623$$pdriver$$ptrabajos-fin-master
000063623 950__ $$a
000063623 951__ $$adeposita:2017-12-21
000063623 980__ $$aTAZ$$bTFM$$cEINA