000048242 001__ 48242
000048242 005__ 20160316114640.0
000048242 037__ $$aTAZ-TFG-2015-3361
000048242 041__ $$aspa
000048242 1001_ $$aDelgado Llamas, Daniel
000048242 24500 $$aAnotación semántica de grandes colecciones de vídeos a partir de su audio
000048242 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2015
000048242 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000048242 520__ $$aEn Internet existen numerosos servicios de alojamiento y visualización de vídeos. Este tipo de plataformas permiten realizar búsquedas entre las grandes colecciones de vídeos que almacenan. Estas búsquedas comparan la consulta realizada por el usuario con la información que disponen de cada uno de sus vídeos. La fuente de información para este tipo de búsquedas puede ser muy distinta dependiendo de cada servicio de alojamiento. En general, los elementos más importantes que clasifican un vídeo son: el título y las etiquetas asociadas a cada vídeo y que describen su contenido. El título y las etiquetas de un vídeo son, normalmente, asignados de forma manual por el usuario que aloja el vídeo en el servidor. El etiquetado de vídeos consiste en asociar o añadir a la información del vídeo un conjunto de palabras o metadatos (datos que describen otros datos) que permita clasificar o describir el contenido del vídeo. Esta tarea, con colecciones de vídeos muy grandes, resulta muy costosa y a veces difícil de realizar por un usuario por desconocimiento del contenido del vídeo. En general, el etiquetado manual produce un conjunto de etiquetas que describen el contenido de los recursos multimedia de forma genérica. Este proyecto pretende conseguir que este proceso de etiquetado manual, por parte del usuario, se realice de forma automática, permitiendo así reducir costes en el tiempo de etiquetado y generando unas etiquetas que describan mejor el contenido del vídeo utilizando información presente en el audio del mismo, mejorando de esta forma la relevancia de las etiquetas con respecto al etiquetado manual. Este proceso de etiquetado consiste, en primer lugar, en obtener o descargar el vídeo solicitado, siguiendo con la extracción de su audio y el posterior reconocimiento de voz del mismo para obtener el mayor número de palabras, de este audio, en forma de texto. A continuación, a partir de un proceso de votación, en el que a partir de los resultados obtenidos mediante el uso de algoritmos de extracción de términos, se determinan las palabras más relevantes que serán utilizadas como etiquetas para clasificar el vídeo. Estas etiquetas obtenidas pasan un proceso de validación, por parte de usuarios, para comprobar que son adecuadas y corresponden al contenido del vídeo. Se decidió que este proceso de validación se realizase de forma externa al sistema de etiquetado de vídeos para que el sistema pudiese continuar aunque la validación no hubiera finalizado. Finalmente, estas etiquetas pasan por un proceso en el que se relacionan estas palabras más relevantes con conceptos de una ontología (esquema conceptual dentro de varios dominios con la finalidad de facilitar el intercambio de información entre diferentes sistemas y entidades) de referencia, obtenida del repositorio de información estructurada llamado dbpedia para obtener mayor significado e información sobre el vídeo procesado. Este proceso de etiquetado de vídeos se encapsula dentro de un servicio que permite la entrada de vídeos y genera como resultados un conjunto de metadatos que describen los vídeos en base a su contenido. Este proceso de etiquetado consta de unas etapas con una alta complejidad, como puede ser la extracción del audio o el reconocimiento de voz, que genera la necesidad de una búsqueda de herramientas a integrar en este proceso que resuelvan cada etapa. Finalmente, se lleva a cabo una evaluación de este proceso de etiquetado automático, valorando aspectos como el rendimiento (costes de computo) o la calidad (tasa de aciertos) de algunos de los elementos que intervienen en ese proceso.
000048242 521__ $$aGraduado en Ingeniería Informática
000048242 540__ $$aDerechos regulados por licencia Creative Commons
000048242 700__ $$aBaldassarri Santa Lucía, Sandra$$edir.
000048242 700__ $$aÁlvarez Pérez-Aradros, Pedro$$edir.
000048242 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000048242 8560_ $$f613409@celes.unizar.es
000048242 8564_ $$s1500221$$uhttps://zaguan.unizar.es/record/48242/files/TAZ-TFG-2015-3361.pdf$$yMemoria (spa)
000048242 909CO $$ooai:zaguan.unizar.es:48242$$pdriver$$ptrabajos-fin-grado
000048242 950__ $$a
000048242 951__ $$adeposita:2016-03-16
000048242 980__ $$aTAZ$$bTFG$$cEINA