000146755 001__ 146755
000146755 005__ 20241126113443.0
000146755 037__ $$aTAZ-TFG-2023-2100
000146755 041__ $$aspa
000146755 1001_ $$aVela Tambo, Javier
000146755 24200 $$aDesign and implementation of fault tolerance with low latency in distributed simulation.
000146755 24500 $$aDiseño e implementación de tolerancia a fallos con baja latencia en simulación distribuida.
000146755 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2023
000146755 500__ $$aResumen disponible también en inglés
000146755 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000146755 520__ $$aEl proyecto forma parte de la investigación en torno a un simulador distribuido de sistemas de eventos discretos. La naturaleza distribuida y escalable del simulador implica la presencia de fallos, por lo tanto, es fundamental contar con mecanismos de tolerancia a fallos en el sistema. En un entorno distribuido, existe un compromiso entre las prestaciones y la tolerancia a fallos, ya que, el aumento en el número de mensajes y la sincronización, conlleva un incremento en la latencia y una reducción en el rendimiento. Obtener un rendimiento óptimo en una simulación tolerante a fallos es un desafío. Por lo tanto, el objetivo del proyecto es proponer un modelo de tolerancia a fallos original que preserve las prestaciones del sistema en ausencia de fallos. La tolerancia a fallos implementada se basa en la replicación, la cual está adaptada para la simulación conservativa. Se aprovechan los mensajes y tiempos propios de la simulación para preservar la consistencia y se desacopla la ejecución de las réplicas, lo que reduce la cantidad de mensajes y sincronización necesarios. Mediante el desacoplamiento se logra una consistencia laxa que converge tras un fallo como resultado de un algoritmo diseñado para mantener el registro del estado de la simulación. Estos mecanismos también incluyen la detección de fallos entre nodos vecinos y la recuperación en caso de fallo. Adicionalmente, el diseño incluye un proceso externo que permite la incorporación dinámica de nuevos nodos para retomar la simulación después de un fallo. Se ha logrado un rendimiento óptimo en la simulación mediante un enfoque innovador en el diseño de mecanismos de tolerancia a fallos. En ausencia de fallos, el coste adicional se limita al envío de eventos para persistir el estado en las réplicas, sin necesidad de sincronización adicional. Los resultados demuestran la eficacia de las estrategias implementadas para tolerar múltiples fallos durante la ejecución de la simulación. Además, se ha optimizado la implementación base mediante una gestión eficiente de conexiones y datos, reduciendo el tiempo de ejecución de manera significativa. Como resultado, el proyecto sienta una base sólida para futuras investigaciones y mejoras en la tolerancia a fallos de simulación distribuida.<br />
000146755 521__ $$aGraduado en Ingeniería Informática
000146755 540__ $$aDerechos regulados por licencia Creative Commons
000146755 700__ $$aArronategui Arribalzaba, Unai$$edir.
000146755 700__ $$aBañares Bañares, José Ángel$$edir.
000146755 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cArquitectura y Tecnología de Computadores
000146755 8560_ $$f775593@unizar.es
000146755 8564_ $$s2279006$$uhttps://zaguan.unizar.es/record/146755/files/TAZ-TFG-2023-2100.pdf$$yMemoria (spa)
000146755 909CO $$ooai:zaguan.unizar.es:146755$$pdriver$$ptrabajos-fin-grado
000146755 950__ $$a
000146755 951__ $$adeposita:2024-11-26
000146755 980__ $$aTAZ$$bTFG$$cEINA
000146755 999__ $$a20230607082602.CREATION_DATE