TAZ-TFM-2021-026


Binarización de descriptores en redes neuronales de manera supervisada y no supervisada

Peribañez Sos, Pablo
Civera Sancho, Javier (dir.)

Universidad de Zaragoza, EINA, 2021
Departamento de Informática e Ingeniería de Sistemas, Área de Ingeniería de Sistemas y Automática

Máster Universitario en Ingeniería Industrial

Resumen: La binarización de descriptores en redes neuronales profundas es una técnica de reciente aparición, que ha surgido de la necesidad de reducir la huella computacional (en procesamiento y almacenamiento) de algoritmos de image retrieval. Entendemos por image retrieval la aplicación cuyo objetivo es encontrar imágenes, similares a una imagen query proporcionada por el usuario, dentro una base de datos de tamaño considerable. Esta reducción de la huella computacional permitiría trabajar en tiempo real a alta frecuencia y/o con bases de datos más grandes, ampliando así el rango de aplicaciones.
La binarización de descriptores consiste en transformar la salida de una red neuronal, consistente en un vector formado por números reales en un descriptor binario formado por elementos binarios. Nótese que un número real se representa en memoria con 32 o 64 BITS, mientras que un elemento binario solo necesita 1 BIT. La reducción de la huella computacional viene dada por este menor tamaño en memoria y una comparación más eficaz mediante la denominada distancia de Hamming.
La reducción en el tamaño al cambiar de un descriptor al otro es posible por el hecho de que el descriptor continuo presenta redundancia y no todas sus dimensiones son significativas. Este trabajo pretende aprovechar este supuesto y estudiar, implementar y evaluar una serie de técnicas previas a la binarización. Las técnicas se focalizarán en el pre-procesamiento de la imagen, antes del proceso conocido como embedding, como en el post-procesamiento del descriptor continuo antes de ser transformado en binario. También se introducirá una variante en el propio proceso de binarización.
Al tratarse de una técnica de reciente estudio, la literatura del tema es escasa. A este reto se le suma encontrar bases de datos adecuadas e implementar una arquitectura de red que permita alcanzar una alta precisión para poder centrar el estudio en el proceso de binarización. Se han utilizado dos bases de datos de uso común en este campo, MNIST Handwritten Digits y CIFAR-10 y se han obtenido resultados que superan la precisión obtenida por algoritmos recientemente publicados.


Tipo de Trabajo Académico: Trabajo Fin de Master

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Escuela de Ingeniería y Arquitectura
Trabajos académicos > Trabajos fin de máster



Volver a la búsqueda

Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)