000007829 001__ 7829
000007829 005__ 20170831220356.0
000007829 037__ $$aTAZ-TFM-2012-084
000007829 041__ $$aspa
000007829 1001_ $$aHernández de Mesa, Sergio
000007829 24500 $$aIntegración dinámica de entornos de computación heterogéneos para la ejecución de workflows científicos
000007829 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2012
000007829 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000007829 520__ $$aLos workflows científicos se caracterizan por estar compuestos por un elevado número de tareas computacionalmente muy costosas. Las necesidades planteadas por este tipo de workflow hacen necesaria la utilización de entornos de computación capaces de satisfacer estos requisitos de computación. En este contexto, la computación Grid ha emergido como un paradigma adecuado para la ejecución de workflows científicos gracias a la capacidad computacional y las comunicaciones en red de estos entornos. No obstante, esta nueva "sociedad" compuesta por Grids y workflows científicos todavía mantiene abiertos un amplio abanico de retos y dificultades. La posibilidad de ejecutar workflows programados en diferentes lenguajes sobre un mismo entorno de computación, la integración de entornos de computación heterogéneos bajo una misma infraestructura, y la posibilidad de ejecutar diferentes partes de un mismo workflow en diferentes entornos de computación son algunos de los principales problemas existentes. Como primer paso para la resolución de estos problemas, se desarrolló una infraestructura que integra  diferentes entornos de computación heterogéneos de forma transparente para el usuario y que permite ejecutar workflows programados en diversos lenguajes ampliamente aceptados por la comunidad científica. De esta forma, se proporcionó una infraestructura capaz de solucionar los retos anteriores. Un aspecto ortogonal a estos retos no considerado en la infraestructura propuesta es el proceso de asignación de tareas a los recursos disponibles en los diferentes entornos integrados (meta-scheduling). Este proceso es clave para la definición de soluciones maduras y completas a los problemas expuestos. Para avanzar en el desarrollo de la solución propuesta y mejorar la infraestructura, en esta Tesis Fin de Máster se propone una estrategia de meta-scheduling basada en técnicas de simulación que permite asignar dinámicamente el entorno de ejecución a utilizar en cada una de las tareas de un workflow. Para ello, se ha integrado en la infraestructura un meta-scheduler que, para cada tarea, selecciona el entorno de ejecución más adecuado utilizando un algoritmo de optimización del tiempo de ejecución. La información utilizada para esta toma de decisiones proviene de los resultados de simular la ejecución de las tareas en los entornos de computación disponibles. Para soportar este proceso, se ha diseñado un simulador genérico, adaptable y extensible basado en Alea. Para cada entorno de computación, una instancia de este simulador ha sido customizada e integrada en la infraestructura. Asimismo, se ha definido una metodología para la creación de workloads dinámicos que permite simular las tareas en condiciones reales de carga. El uso de estos workloads y el propio diseño de los simuladores, capaces de capturar la complejidad inherente de los entornos de computación, han permitido obtener un elevado grado de precisión en las simulaciones, tal y como se ha demostrado en la validación experimental realizada. Como consecuencia, se ha conseguido mejorar el rendimiento de los workflows ejecutados. Finalmente, la viabilidad y beneficios de la solución propuesta se muestran mediante su aplicación a un workflow real en el dominio de la computación científica, el workflow de análisis Inspiral. Para este caso de uso, la utilización de la infraestructura con la estrategia de meta-scheduling propuesta ha permitido obtener una mejora del rendimiento de un 59% respecto a la ejecución del workflow completo en el cluster Hermes del I3A y una mejora de un 111% respecto a la ejecución del workflow en el Grid AraGrid.
000007829 521__ $$aMáster Universitario en Ingeniería de Sistemas e Informática
000007829 540__ $$aDerechos regulados por licencia Creative Commons
000007829 6531_ $$aworkflows científicos
000007829 6531_ $$aintegración
000007829 6531_ $$aentornos de computación heterogéneos
000007829 6531_ $$agrid computing
000007829 700__ $$aÁlvarez Pérez-Aradros, Pedro$$edir.
000007829 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000007829 8560_ $$f554804@celes.unizar.es
000007829 8564_ $$s1738960$$uhttps://zaguan.unizar.es/record/7829/files/TAZ-TFM-2012-084_ANE.pdf$$yAnexos (spa)
000007829 8564_ $$s985462$$uhttps://zaguan.unizar.es/record/7829/files/TAZ-TFM-2012-084.pdf$$yMemoria (spa)
000007829 909CO $$ooai:zaguan.unizar.es:7829$$ptrabajos-fin-master$$pdriver
000007829 950__ $$a
000007829 980__ $$aTAZ$$bTFM$$cEINA