TAZ-TFM-2017-1059


Desarrollo de un almacén de datos de publicaciones científicas con visualización de datos e informes

Higuera Muñoz, Jorge Eliecer
Ilarri Artigas, Sergio (dir.)

Universidad de Zaragoza, EINA, 2017
Informática e Ingeniería de Sistemas department, Lenguajes y Sistemas Informáticos area

Máster Universitario en Ingeniería Informática

Abstract: Se plantea como trabajo de fin de master: Diseñar e implementar un almacén de datos que permita evaluar el rendimiento científico de investigadores. Y así mismo poder analizar algunas métricas de los lugares de publicación de estos artículos. Lo que se ha buscado desarrollar, es un proyecto que permita analizar de manera sencilla los indicadores de los artículos, autores y lugares de publicación de acuerdo a ciertas métricas establecidas. La herramienta está dirigida a usuarios convencionales que podrán manejar los dashboards desarrollados y también para usuarios expertos que podrán realizar cualquier tipo de consulta-análisis directamente en la base de datos y también podrán crear nuevos paneles de visualización de información. Lo que hace especial esta herramienta y diferente a las que ya existen, es que permite con solo una descarga de información de diferentes fuentes, integrar los datos de dichas fuentes y mostrar los indicadores en un mismo lugar. Se han utilizado técnicas de emparejamiento (matching) exacto, reemplazo de palabras clave y confianza-similitud basadas en la herramienta Data Quality Services de Microsoft. Teniendo en cuenta que es una herramienta en la cual se ha basado el emparejamiento, es posible que, si se utilizara esta o alguna otra herramienta especializada, se puedan obtener mejores resultados. Sin embargo, se ha implementado una carga de ficheros de configuración donde el usuario puede hacer emparejamiento manual. Por ejemplo, si la herramienta muestra dos nombres de autores diferentes, pero se sabe que es el mismo autor, pero escrito de forma diferente (Sergio Ilarri artigas – Ilarri, A. Sergio) se puede rellenar un fichero de configuración de nombres para que un proceso unifique estos nombres. Igualmente, con los nombres de los artículos y los nombres de los lugares de publicación. Se puede resumir el desarrollo de este proyecto en cinco fases principales: Análisis de las fuentes de información: Se ha hecho un esfuerzo por seleccionar las fuentes de información más importantes y a su vez las más adecuadas para el proyecto teniendo en cuenta la información que nos otorga cada una en los ficheros de exportación. Descarga de los ficheros de información: Ficheros de artículos y lugares de publicación. Diseño del almacén de datos: Modelo estrella bajo la metodología de Kimball. Proceso ETL: Carga de las tablas de Staging, auxiliares y finalmente las estrellas de Impacto Artículo e Impacto Lugar de Publicación. Visualización de información: Los informes presentados a los usuarios.

Tipo de Trabajo Académico: Trabajo Fin de Master

Creative Commons License

El registro pertenece a las siguientes colecciones:
Academic Works > Trabajos Académicos por Centro > escuela-de-ingeniería-y-arquitectura
Academic Works > End-of-master works



Back to search

Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)