000016082 001__ 16082
000016082 005__ 20150325205536.0
000016082 037__ $$aTAZ-PFC-2014-449
000016082 041__ $$aspa
000016082 1001_ $$aBelled Casabona, Alberto
000016082 24500 $$aSegmentación temporal y reconocimiento débilmente supervisado de acciones en vídeos
000016082 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2014
000016082 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000016082 520__ $$aEl reconocimiento de acciones en vídeos es, sin duda, uno de los problemas de visión por computador más relevantes en la actualidad. Uno de los principales motivos de que ésto sea así son las numerosas aplicaciones derivadas que podrían ser desarrolladas en diversos ámbitos de la ciencia y la vida cotidiana y el entretenimiento. Si además de reconocer las acciones presentes en los vídeos somos capaces de segmentarlas temporalmente, ésto es, determinar los instantes en que empiezan y acaban, su identificación es mucho más completa. No sólo sabríamos que en el vídeo en cuestión aparece una determinada acción, sino que dispondríamos de información adicional para analizarla con más detalle. En este proyecto se formula el problema de la segmentación temporal y el reconocimiento de acciones en vídeos mediante una función de coste, o función de energía, definida de forma débilmente supervisada. A diferencia de los métodos existentes, los cuales emplean un número enorme de vídeos anotados para entrenar los algoritmos, en este proyecto se ha utilizado un único vídeo anotado por cada acción que se pretende reconocer. Con ello conseguimos que la fase de aprendizaje del algoritmo sea menos costosa en esfuerzo humano y que el método sea aplicable a casi cualquier dataset de vídeos. La energía formulada se compone de una serie de términos y parámetros que han sido ajustados mediante la experimentación. Se ha utilizado para ello un dataset de videos realistas extraídos de películas, construído a partir del dataset Hollywood2. La minimización de la energía proporciona la solución de menor coste del problema, es decir, la solución óptima. La bondad de los resultados de minimización se ha evaluado mediante la comparación con un ground truth creado a partir de los vídeos de estudio. Los resultados obtenidos en nuestro dataset y en el dataset KTH demuestran que es posible obtener buenas tasas de acierto en segmentación temporal y reconocimiento de acciones en vídeos de forma débilmente supervisada.
000016082 521__ $$aIngeniero Industrial
000016082 540__ $$aDerechos regulados por licencia Creative Commons
000016082 6531_ $$asegmentación temporal de acciones
000016082 6531_ $$areconocimiento de acciones humanas en vídeos
000016082 700__ $$aCivera Sancho, Javier$$edir.
000016082 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cIngeniería de Sistemas y Automática
000016082 8560_ $$f591557@celes.unizar.es
000016082 8564_ $$s10075096$$uhttps://zaguan.unizar.es/record/16082/files/TAZ-PFC-2014-449.pdf$$yMemoria (spa)
000016082 909CO $$ooai:zaguan.unizar.es:16082$$pproyectos-fin-carrera$$pdriver
000016082 950__ $$a
000016082 980__ $$aTAZ$$bPFC$$cEINA
Universidad de Zaragoza Repository