000064179 001__ 64179
000064179 005__ 20171221155212.0
000064179 037__ $$aTAZ-TFG-2017-2891
000064179 041__ $$aspa
000064179 1001_ $$aGascón Royo, Iñigo
000064179 24200 $$aPerformance evaluation of data-intensive applications with Apache Tez
000064179 24500 $$aEvaluación del rendimiento de aplicaciones intensivas en datos con Apache Tez
000064179 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2017
000064179 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000064179 520__ $$aDurante los últimos años, el Big Data ha sufrido un gran auge en un rango muy variado de sectores del mercado. Analizar todos los datos disponibles para conocer la demanda de productos por adelantado, o incluso para crear dichas demandas, se ha vuelto una práctica común para muchas empresas. El procesamiento de estas grandes cantidades de datos no es algo trivial y ha de realizarse con tecnologı́as especı́ficamente diseñadas para ese propósito. Es por ello que cada vez surgen más propuestas en esa área de la informática, cada una con sus ventajas e inconvenientes. En todas ellas, no obstante, hay una caracterı́stica de vital importancia: el rendimiento. El trabajo que aquı́ se presenta se enmarca dentro del proyecto DICE, situado en el marco del plan Horizon2020 de la Comisión Europea, y en el cual participa el Grupo de I+D en Computación Distribuida (DiSCo) de la Universidad de Zaragoza. El objetivo final de DICE consiste en ofrecer un perfil UML original, un conjunto de herramientas software y una metodologı́a que ayudarán a los diseñadores de aplicaciones intensivas en datos a plantear la seguridad, eficiencia y fiabilidad de dichas aplicaciones. Entre dichas herramientas software se encuentra un simulador capaz de evaluar el rendimiento de aplicaciones basadas en diferentes tecnologı́as (DICE-Simulator), y es a este simulador al cual se le va a aportar una nueva tecnologı́a mediante la realización de este trabajo. Para poder realizar dicha aportación, integrando la tecnologı́a de Apache Tez en el simu- lador, se han realizado una serie procesos para analizar y modelar la tecnologı́a. En primer lugar, se ha investigado a fondo el funcionamiento de Tez, comprobando su rendimiento en aplicaciones reales y extrayendo tantos los conceptos básicos de la tecnologı́a como aquellos relativos al rendimiento de la misma, vitales para poder simular de forma fiel su comporta- miento. A continuación, habiendo extraı́do toda la información necesaria resultante de la investi- gación, se ha creado un perfil para UML que captura de forma precisa todos los conceptos relativos al funcionamiento de Tez y a su rendimiento en aplicaciones reales. Una vez completado el modelo UML, ha sido necesario transformar dicho modelo a otro distinto que permitiese analizar y evaluar el rendimiento, basado en los conceptos recogido por el primero. Para ello, se ha propuesto un conjunto de patrones de transformación del modelo UML a un modelo de redes de Petri, concretamente a redes de Petri estocásticas, las cuales permiten analizar el rendimiento en aplicaciones informáticas. Por último, se han realizado una serie de experimentos para verificar que las transforma- ciones propuestas son correctas y reflejan de forma precisa el funcionamiento de una aplicación Tez real en términos de rendimiento.
000064179 521__ $$aGraduado en Ingeniería Informática
000064179 540__ $$aDerechos regulados por licencia Creative Commons
000064179 700__ $$aRequeno Jarabo, José Ignacio$$edir.
000064179 700__ $$aMerseguer Hernáiz, José Javier$$edir.
000064179 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000064179 8560_ $$f685215@celes.unizar.es
000064179 8564_ $$s2046723$$uhttps://zaguan.unizar.es/record/64179/files/TAZ-TFG-2017-2891.pdf$$yMemoria (spa)
000064179 909CO $$ooai:zaguan.unizar.es:64179$$pdriver$$ptrabajos-fin-grado
000064179 950__ $$a
000064179 951__ $$adeposita:2017-12-21
000064179 980__ $$aTAZ$$bTFG$$cEINA