000149698 001__ 149698
000149698 005__ 20250127135745.0
000149698 037__ $$aTAZ-TFG-2024-2911
000149698 041__ $$aspa
000149698 1001_ $$aLazar Crisan, Andrei Calin
000149698 24200 $$aModality gap influence over multimodal latent representations from deep neural networks
000149698 24500 $$aAnálisis del desajuste en las representaciones latentes multimodales con redes neuronales profundas
000149698 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2024
000149698 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000149698 520__ $$aEn la era digital, la cantidad de información ha crecido exponencialmente, planteando desafíos en su recuperación y uso, especialmente con datos multimodales que combinan texto, imágenes y audio. Este trabajo se centra en entender las cualidades de las representaciones vectoriales generadas por el modelo CLIP, que crea representaciones conjuntas de texto e imágenes en un espacio latente común. Para mejorar estas propiedades, se propone el diseño de funciones de pérdidas específicas que permiten modificar las características de las representaciones vectoriales, reduciendo las distancias intermodales y mejorando la alineación y eficacia. Se implementan técnicas avanzadas de optimización del entrenamiento y una herramienta de visualización que permite observar de manera geométrica el proceso de optimización, proporcionando una visión clara de la evolución de las representaciones durante el entrenamiento. Adicionalmente, se implementan técnicas de optimización del entrenamiento y se trabaja con datos multilingües para evaluar la robustez de las representaciones obtenidas.<br />
000149698 521__ $$aGraduado en Ingeniería de Tecnologías y Servicios de Telecomunicación
000149698 540__ $$aDerechos regulados por licencia Creative Commons
000149698 691__ $$a4 8 9
000149698 692__ $$a4 - Educación de calidad: Este sistema permite desarrollar métodos autónomos de aprendizaje, facilitando el acceso a la educación para un mayor número de personas. 8 - Trabajo decente y crecimiento económico: Las optimizaciones propuestas aumentan la productividad económica y mejoran el consumo eficiente de recursos. 9 - Industria, innovación e infraestructuras: Este trabajo de investigación no solo impulsa la innovación, sino que también mejora el acceso a la información para personas con dificultades de comunicación.
000149698 700__ $$aLleida Solano, Eduardo$$edir.
000149698 700__ $$aMiguel Artiaga, Antonio$$edir.
000149698 7102_ $$aUniversidad de Zaragoza$$bIngeniería Electrónica y Comunicaciones$$cTeoría de la Señal y Comunicaciones
000149698 8560_ $$f799269@unizar.es
000149698 8564_ $$s50941004$$uhttps://zaguan.unizar.es/record/149698/files/TAZ-TFG-2024-2911.pdf$$yMemoria (spa)
000149698 909CO $$ooai:zaguan.unizar.es:149698$$pdriver$$ptrabajos-fin-grado
000149698 950__ $$a
000149698 951__ $$adeposita:2025-01-27
000149698 980__ $$aTAZ$$bTFG$$cEINA
000149698 999__ $$a20240626094757.CREATION_DATE