TAZ-TFG-2023-113


Sistema de indexado y búsqueda multimodal en archivos multimedia.

García Cutando, María
Lleida Solano, Eduardo (dir.)

Universidad de Zaragoza, EINA, 2023
Ingeniería Electrónica y Comunicaciones department, Teoría de la Señal y Comunicaciones area

Graduado en Ingeniería de Tecnologías y Servicios de Telecomunicación

Abstract: El trabajo consiste en el estudio de las diferentes posibilidades que se dan en la búsqueda y la recuperación de información multimedia, estudiando las diferentes técnicas de segmentación de video y medidas de similitud para la selección de escenas. Se ha implementado un sistema de segmentación semántica, indexado y búsqueda multimodal, que permite realizar consultas mediante una entrada de texto. Y finalmente, el sistema permite crear nuevos vídeos en base a los segmentos de video localizados mediante búsquedas. Para ello se ha utilizado la red neuronal CLIP, basada en pre-entrenamiento contrastivo de pares imagen-texto, la base de datos Milvus, y librerías como OpenCV para la extracción de metadatos.


Tipo de Trabajo Académico: Trabajo Fin de Grado

Creative Commons License



El registro pertenece a las siguientes colecciones:
Academic Works > Trabajos Académicos por Centro > escuela-de-ingeniería-y-arquitectura
Academic Works > End-of-grade works



Back to search

Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)