000065359 001__ 65359
000065359 005__ 20180219131712.0
000065359 037__ $$aTAZ-TFG-2017-1809
000065359 041__ $$aspa
000065359 1001_ $$aSan Miguel Tello, Alberto
000065359 24200 $$aReinforcement Learning and Planning on a Multi-Robot System
000065359 24500 $$aAprendizaje por Refuerzo y Planificación en un Sistema Multirobot
000065359 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2017
000065359 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000065359 520__ $$aEste Trabajo Fin de Grado aborda el problema de navegación de unos agentes móviles sobre un entorno con obstáculos desconocidos para ellos, realizando los movimientos necesarios para alcanzar una serie de posiciones finales partiendo de unas iniciales. El método elegido para su resolución ha sido el algoritmo Dyna-Q, que combina técnicas Aprendizaje por Refuerzo y Planificación, implementándose primero en el caso de un agente para después extenderlo al caso multiagente mediante un planteamiento propuesto en este estudio. Se ha realizado una fase de experimentación sobre los parámetros del algoritmo para el caso de un agente con el fin de interpretar su influencia sobre la ejecución del problema, y determinados resultados se han aplicado sobre los casos multiagente y se ha evaluado su viabilidad. Finalmente, se ha planteado la implementación de los métodos y evaluación de los resultados sobre una plataforma real compuesta por varios agentes móviles, abarcando las posibles limitaciones que presente. planteado la implementación de los métodos y evaluación de los resultados sobre una plataforma real compuesta por varios agentes móviles,abarcando las posibles limitaciones que presente.
000065359 521__ $$aGraduado en Ingeniería de Tecnologías Industriales
000065359 540__ $$aDerechos regulados por licencia Creative Commons
000065359 700__ $$aFlorentín Mahulea, Cristian $$edir.
000065359 700__ $$aCivera Sancho, Javier$$edir.
000065359 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cIngeniería de Sistemas y Automática
000065359 8560_ $$f680341@celes.unizar.es
000065359 8564_ $$s2866148$$uhttps://zaguan.unizar.es/record/65359/files/TAZ-TFG-2017-1809.pdf$$yMemoria (spa)
000065359 909CO $$ooai:zaguan.unizar.es:65359$$pdriver$$ptrabajos-fin-grado
000065359 950__ $$a
000065359 951__ $$adeposita:2018-02-17
000065359 980__ $$aTAZ$$bTFG$$cEINA