TAZ-TFG-2023-113

Sistema de indexado y búsqueda multimodal en archivos multimedia.

García Cutando, María
Lleida Solano, Eduardo (dir.)

Universidad de Zaragoza, EINA, 2023
Departamento de Ingeniería Electrónica y Comunicaciones, Área de Teoría de la Señal y Comunicaciones

Graduado en Ingeniería de Tecnologías y Servicios de Telecomunicación

Resumen: El trabajo consiste en el estudio de las diferentes posibilidades que se dan en la búsqueda y la recuperación de información multimedia, estudiando las diferentes técnicas de segmentación de video y medidas de similitud para la selección de escenas. Se ha implementado un sistema de segmentación semántica, indexado y búsqueda multimodal, que permite realizar consultas mediante una entrada de texto. Y finalmente, el sistema permite crear nuevos vídeos en base a los segmentos de video localizados mediante búsquedas. Para ello se ha utilizado la red neuronal CLIP, basada en pre-entrenamiento contrastivo de pares imagen-texto, la base de datos Milvus, y librerías como OpenCV para la extracción de metadatos.

+

Tipo de Trabajo Académico: Trabajo Fin de Grado

Enlace permanente:

El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Escuela de Ingeniería y Arquitectura
Trabajos académicos > Trabajos fin de grado

Volver a la búsqueda

Memoria (spa)

Valore este documento:

(Sin ninguna reseña)

Añadir a una carpeta personal
Exportar como BibTeX, MARC, MARCXML, DC, EndNote, NLM, RefWorks

Repositorio Institucional de Documentos

+

-