TAZ-TFM-2013-1104

Evaluación y optimización del proceso de reconocimiento de objetos con sensores de visión y profundidad

Sánchez Romero, Alberto
Murillo Arnal, Ana Cristina (dir.) ; Montijano Muñoz, Eduardo (dir.)

Universidad de Zaragoza, EINA, 2013
Departamento de Informática e Ingeniería de Sistemas, Área de Ingeniería de Sistemas y Automática

Máster Universitario en Ingeniería de Sistemas e Informática

Resumen: El reconocimiento automático de objetos es uno de los temas más populares y que máas interés provocan en el campo de la visión artificial. Esto se debe principalmente a las múltiples aplicaciones que pueden beneficiarse de algoritmos capaces de reconocer la información presente en el entorno. Pueden ser desde aplicaciones en el ámbito de la industria, orientadas al control de la producción y la calidad, a aplicaciones en entornos domésticos como videojuegos o tareas de asistencia, sin olvidarse del ámbito de la robótica de servicio. La actual aparición de sensores de bajo coste que combinan información de color y profundidad de la escena, conocidos como sensores RGB-depth o RGB-d, ha generado grandes oportunidades para el desarrollo de aplicaciones relacionadas con la detección automática de objetos. El hecho de incluir información de profundidad en la escena para cada píxel de la imagen resulta un complemento muy beneficioso para los algoritmos típicos de reconocimiento. Sin embargo, los algoritmos que existen actualmente para resolver este problema todavía se encuentran en una fase inicial de desarrollo, obteniendo resultados limitados y, en la mayor parte de los casos, siendo capaces únicamente de distinguir un número pequeño de objetos diferentes. Este proyecto presenta un sistema completo de reconocimiento automático que es capaz de reconocer de manera eficiente un gran número de objetos. Para ello se hace uso de información 3D proporcionada por los sensores RGB-d y de técnicas de tratamiento de información 2D y 3D para poder realizar la clasifificación de los objetos. El conjunto de datos que se ha empleado para la implementación se ha obtenido de una dataset de imágenes muy utilizada en la comunidad investigadora a nivel internacional. Se parte de un estudio de la literatura relacionada con las técnicas básicas de visión por computador, técnicas para el manejo de la información obtenida de sensores RGB-d, sobre todo para representación de la información mediante nubes de puntos en 3D y el cálculo y uso de descriptores. También ha implicado al aprendizaje de la plataforma de desarrollo ROS, así como del sistema de reconocimiento del que se partía en este trabajo (un trabajo previo del grupo de investigación). Este proyecto presenta una evaluación exhaustiva de dicho sistema base y propone una serie de mejoras, prácticas y teóricas, para aumentar el rendimiento, flexibilidad y formalización del mismo. Los experimentos realizados durante este proyecto demuestran las mejoras obtenidas tanto en coste computacional, como la gestión de recursos; así como las mejoras obtenidas por el algoritmo de clasificación. El resultado final es un sistema completo de reconocimiento, diseñado para el manejo de dataset de imágenes de gran tamaño y con capacidad de devolver resultados probabilísticos en función de cada objeto. Finalmente, se presentan las conclusiones y se proponen líneas de trabajo futuro

+

Tipo de Trabajo Académico: Trabajo Fin de Master

Enlace permanente:

El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Escuela de Ingeniería y Arquitectura
Trabajos académicos > Trabajos fin de máster

Volver a la búsqueda

Memoria (spa)

Valore este documento:

(Sin ninguna reseña)

Añadir a una carpeta personal
Exportar como BibTeX, MARC, MARCXML, DC, EndNote, NLM, RefWorks

Repositorio Institucional de Documentos

+

-