000101435 001__ 101435 000101435 005__ 20210415110715.0 000101435 037__ $$aTAZ-TFG-2020-4785 000101435 041__ $$aspa 000101435 1001_ $$aCay Delgado, Daniel 000101435 24200 $$aMulti-Object Tracking and Segmentation with Learnt Descriptors 000101435 24500 $$aSeguimiento y segmentación de múltiples objetos con descriptores aprendidos 000101435 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2020 000101435 500__ $$aResumen disponible también en inglés. 000101435 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/ 000101435 520__ $$aEn este TFG se ha estudiado uno de los problemas a los que se enfrenta la visión por computador en la actualidad, que es el del seguimiento y segmentación de múltiples objetos a lo largo de un vídeo. Dicho problema consiste en identificar de forma única a cada uno de los objetos que aparecen en un vídeo mediante una máscara que se adapta a su forma y contorno a nivel de píxel (instance segmentation).<br />En los últimos años, los sistemas de seguimiento de objetos han estado estancados debido a que la tecnología de object detection (identificar a cada objeto con una caja delimitadora o bounding box que lo rodea) se había explotado al máximo. En la actualidad, gracias a la aparición de la instance segmentation, la posibilidad de lograr grandes mejoras ha vuelto a aparecer. Es por ello que se ha desarrollado un sistema de seguimiento y segmentación de objetos que parte del uso de técnicas clásicas de visión por computador y de las últimas tecnologías en el ámbito, como es la red neuronal de segmentación semántica Mask R-CNN. Se busca utilizar nuevos métodos con el fin de diferenciar el sistema realizado del resto, aportando así nueva información acerca de este problema. La principal innovación del trabajo se basa en el uso de descriptores aprendidos, información sobre la apariencia de los objetos a seguir que se va a extraer de Mask R-CNN para utilizarla en beneficio de nuestro sistema, logrando así mejoras en su funcionamiento.<br />En cuanto al desarrollo del trabajo, se ha realizado una primera aproximación al seguimiento usando el solapamiento entre objetos de distintas imágenes. Después, se ha utilizado un algoritmo de predicción con el fin de solucionar algunos problemas que la primera aproximación tiene, y tras esto, se ha incorporado el uso de los descriptores aprendidos extraídos de Mask R-CNN para tener en cuenta la apariencia de los objetos, mejorando así los resultados del sistema. Por último, para evaluar el trabajo desarrollado y compararlo con el estado del arte se han usado las métricas de visión por computador MOTSA, MOTSP y sMOTSA.<br />Para el beneficio de la comunidad de la visión por computador, el sistema está disponible en https://github.com/DanielCay/TFG y un ejemplo del resultado final logrado se puede ver en https://youtu.be/Xw1aob3RjWw.<br /><br /> 000101435 521__ $$aGraduado en Ingeniería Informática 000101435 540__ $$aDerechos regulados por licencia Creative Commons 000101435 700__ $$aBescós Torcarl, Berta$$edir. 000101435 700__ $$aNeira Parra, José$$edir. 000101435 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos 000101435 8560_ $$f741066@unizar.es 000101435 8564_ $$s11161268$$uhttps://zaguan.unizar.es/record/101435/files/TAZ-TFG-2020-4785.pdf$$yMemoria (spa) 000101435 909CO $$ooai:zaguan.unizar.es:101435$$pdriver$$ptrabajos-fin-grado 000101435 950__ $$a 000101435 951__ $$adeposita:2021-04-15 000101435 980__ $$aTAZ$$bTFG$$cEINA 000101435 999__ $$a20201117104526.CREATION_DATE