000094485 001__ 94485
000094485 005__ 20210520140813.0
000094485 037__ $$aTESIS-2020-130
000094485 041__ $$aeng
000094485 1001_ $$aAzagra Millán, Pablo
000094485 24500 $$aLearning from human-robot interaction
000094485 260__ $$aZaragoza$$bUniversidad de Zaragoza, Prensas de la Universidad$$c2020
000094485 300__ $$a130
000094485 4900_ $$aTesis de la Universidad de Zaragoza$$v2020-130$$x2254-7606
000094485 500__ $$aPresentado:  15 06 2020
000094485 502__ $$aTesis-Univ. Zaragoza, Informática e Ingeniería de Sistemas, 2020$$bZaragoza, Universidad de Zaragoza$$c2020
000094485 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/es
000094485 520__ $$aEn los últimos años cada vez es más frecuente ver robots en los hogares. La robótica está cada vez más presente en muchos aspectos de nuestras vidas diarias, en aparatos de asistencia doméstica, coches autónomos o asistentes personales. La interacción entre estos robots asistentes y los usuarios es uno de los aspectos clave en la robótica de servicio. Esta interacción necesita ser cómoda e intuitiva para que sea efectiva su utilización. Estas interacciones con los usuarios son necesarias para que el robot aprenda y actualice de manera natural tanto su modelo del mundo como sus capacidades.  <br />Dentro de los sistemas roboticos de servicio, hay muchos componentes que son necesarios para su buen funcionamiento. Esta tesis esta centrada en el sistema de percepción visual de dichos sistemas.<br />Para los humanos la percepción visual es uno de los componentes más esenciales,  permitiendo tareas como reconocimiento de objetos u otras personas, o estimación de información 3D.<br /> <br />Los grandes logros obtenidos en los últimos años en tareas de reconocimiento automático utilizan los enfoques basados en aprendizaje automático, en particular técnicas de deep learning. La mayoría de estos trabajos actuales se centran en modelos entrenados 'a priori' en un conjunto de datos muy grandes. Sin embargo, estos modelos, aunque entrenados en una gran cantidad de datos, no pueden, en general, hacer frente a los retos que aparecen al tratar con  datos reales en entornos domésticos. Por ejemplo, es frecuente que se de el caso de tener nuevos objetos que no existían durante el entrenamiento de los modelos. Otro reto viene de la dispersión de los objetos, teniendo objetos que aparecen muy raramente y por lo tanto habia muy pocos, o ningún, ejemplos en los datos de entenamiento disponibles al crear el modelo.<br />Esta tesis se ha desarrollado dentro del contexto del proyecto IGLU (Interactive Grounded Language Understanding). Dentro del proyecto y sus objetivos, el objetivo principal de esta Tesis doctoral es investigar métodos novedosos para que un robot aprenda de manera incremental mediante la interacción multimodal con el usuario.<br />Desarrollando dicho objetivo principal, los principales trabajos desarrollados durante esta tesis han sido:<br />-Crear un benchmark más adecuado para las tareas de aprendizaje mediante la interacción natural de usuario y robot. Por ejemplo, la mayoría de los datasets para la tarea de reconocimiento de objetos se centra en fotos de diferentes escenarios con múltiples clases por foto. Es necesario un dataset que combine interacción usuario robot con aprendizaje de objetos.<br />-Mejorar sistemas existentes de aprendizaje de objetos y adecuarlos para aprendizaje desde la interacción multimodal humana. Los trabajos de detección de objetos se focalizan en detectar todos los objetos aprendidos en una imagen. Nuestro objetivo es usar la interacción para encontrar el objeto de referencia y aprenderlo incrementalmente.<br />-Desarrollar métodos de aprendizaje incremental que se puedan utilizar en escenarios incrementales, p.e., la aparición de una nueva clase de objeto o cambios a lo largo del tiempo dentro de una clase objetos. Nuestro objetivo es diseñar un sistema que pueda aprender clases desde cero y que pueda actualizar los datos cuando estos aparecen.<br />-Crear un completo prototipo para el aprendizaje incremental y multimodal usando la interacción humana-robot. Se necesita realizar la integración de los distintos métodos desarrollados como parte de los otros objetivos y evaluarlo.<br />
000094485 520__ $$a<br />
000094485 521__ $$97100$$aPrograma de Doctorado en Ingeniería de Sistemas e Informática
000094485 6531_ $$avision artificial
000094485 6531_ $$arobotica
000094485 700__ $$aMurillo Arnal, Ana Cristina $$edir.
000094485 700__ $$aCivera Sancho, Javier $$edir.
000094485 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas
000094485 830__ $$9512
000094485 8560_ $$ftdr@unizar.es
000094485 8564_ $$uhttps://zaguan.unizar.es/record/94485/files/TESIS-2020-130.pdf$$zTexto completo (eng)
000094485 909CO $$ooai:zaguan.unizar.es:94485$$pdriver
000094485 909co $$ptesis
000094485 9102_ $$a$$bInformática e Ingeniería de Sistemas
000094485 980__ $$aTESIS