65359 20180219131712.0 TAZ-TFG-2017-1809 spa San Miguel Tello, Alberto Reinforcement Learning and Planning on a Multi-Robot System Aprendizaje por Refuerzo y Planificación en un Sistema Multirobot Zaragoza Universidad de Zaragoza 2017 by-nc-sa Creative Commons 3.0 http://creativecommons.org/licenses/by-nc-sa/3.0/ Este Trabajo Fin de Grado aborda el problema de navegación de unos agentes móviles sobre un entorno con obstáculos desconocidos para ellos, realizando los movimientos necesarios para alcanzar una serie de posiciones finales partiendo de unas iniciales. El método elegido para su resolución ha sido el algoritmo Dyna-Q, que combina técnicas Aprendizaje por Refuerzo y Planificación, implementándose primero en el caso de un agente para después extenderlo al caso multiagente mediante un planteamiento propuesto en este estudio. Se ha realizado una fase de experimentación sobre los parámetros del algoritmo para el caso de un agente con el fin de interpretar su influencia sobre la ejecución del problema, y determinados resultados se han aplicado sobre los casos multiagente y se ha evaluado su viabilidad. Finalmente, se ha planteado la implementación de los métodos y evaluación de los resultados sobre una plataforma real compuesta por varios agentes móviles, abarcando las posibles limitaciones que presente. planteado la implementación de los métodos y evaluación de los resultados sobre una plataforma real compuesta por varios agentes móviles,abarcando las posibles limitaciones que presente. Graduado en Ingeniería de Tecnologías Industriales Derechos regulados por licencia Creative Commons Florentín Mahulea, Cristian dir. Civera Sancho, Javier dir. Universidad de Zaragoza Informática e Ingeniería de Sistemas Ingeniería de Sistemas y Automática 680341@celes.unizar.es 2866148 http://zaguan.unizar.es/record/65359/files/TAZ-TFG-2017-1809.pdf Memoria (spa) oai:zaguan.unizar.es:65359 driver trabajos-fin-grado deposita:2018-02-17 TAZ TFG EINA