000108636 001__ 108636
000108636 005__ 20211216104750.0
000108636 037__ $$aTAZ-TFM-2021-888
000108636 041__ $$aspa
000108636 1001_ $$aDíez Corral, Javier
000108636 24200 $$aArtificial intelligence applied to image search in the eCommerce sector.
000108636 24500 $$aInteligencia artificial aplicada a la búsqueda de imagen en el sector eCommerce.
000108636 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2021
000108636 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000108636 520__ $$aLa gran expansión en los últimos de la inteligencia artificial combinada con los avances conseguidos en el campo del deep learning, han permitido ampliar las técnicas y algoritmos usados en las tareas de visión por ordenador. En el presente trabajo nos centraremos en la tarea de reconocimiento de imágenes mediante modelos de segmentación semántica que aplicaremos al estudio de la viabilidad de un proyecto sobre la construcción de un sistema de recomendación de prendas de ropa para una tienda online. Este tipo de modelos, basados en la clasificación de cada pixel de una imagen a una de las categorías del problema, permiten combinar la clasificación y la localización de los diferentes objetos que nos interesen de la imagen. En particular, analizaremos aquellos modelos que utilizan redes neuronales convolucionales completas (FCN).<br />En la parte teórica del trabajo realizaremos una breve introducción a la segmentación semántica para, a continuación, explicar en profundidad los elementos que componen una FCN distinguiendo dos fases, una encargada de la extracción de características de la imagen y otra encargada de recuperar la imagen segmentada. A lo largo de ese capítulo, detallaremos los elementos que forman las capas de convolución de la red, introduciendo la operación de convolución, las funciones de activación y la operación de pooling que forman la primera fase y la operación de convolución transpuesta y funciones de unpooling utilizadas durante la segunda fase de la red. Una vez definidos todos estos elementos, explicaremos cómo se produce el proceso de aprendizaje en la red mediante la optimización de una función de pérdida e introduciremos el algoritmo de retropropagación combinado con el algoritmo de optimización Adam. Para finalizar este capítulo, presentaremos algunas de las métricas y técnicas más usadas para la validación de modelos de segmentación semántica.<br />En el último capítulo de la memoria presentaremos el procedimiento seguido y los resultados obtenidos durante el desarrollo del proyecto en Jupyter Notebook. En particular, comenzaremos introduciendo la parte de preprocesamiento de los datos donde presentaremos un algoritmo original de etiquetado de imágenes automático basado en el algoritmo k-medias y en la aplicación de diferentes técnicas de tratamiento de la imagen. A continuación, presentaremos los diferentes modelos ajustados para este proyecto centrándonos, sobre todo, en el modelo final que implementaremos. Este modelo utiliza una arquitectura que hemos personalizado para este proyecto de la red U-Net y para su compilación utilizaremos la función de pérdida de entropía cruzada y el optimizador Adam. Con este modelo se ha conseguido, en la clasificación a nivel de pixel, una precisión del 94,37% y del 87,04% en los conjuntos de entrenamiento y validación respectivamente.<br />Con la idea de implementar este modelo final a un caso real, se ha construido una pequeña aplicación que permita emular un sistema de recomendación típico de una tienda online. Este sistema poseerá dos opciones de recomendación. La primera, que tendrá en cuenta el color y el tipo de prenda de la imagen que se suba al sistema, usará un método original basado en la combinación del algoritmo k-medias y de la segmentación de la imagen realizada por el modelo para obtener el color más predominante de la prenda de ropa, mientras que la segunda únicamente tendrá en cuenta el tipo de prenda de ropa que aparece en la imagen.<br />Para finalizar el estudio de viabilidad, en la parte final del trabajo presentaremos la interfaz gráfica de la aplicación donde se podrá observar, con un ejemplo, su funcionamiento.<br /><br />
000108636 521__ $$aMáster Universitario en Modelización e Investigación Matemática, Estadística y Computación
000108636 540__ $$aDerechos regulados por licencia Creative Commons
000108636 700__ $$aAlcalá Nalvaiz, José Tomás$$edir.
000108636 700__ $$aAldea Blasco, Inés$$edir.
000108636 7102_ $$aUniversidad de Zaragoza$$bMétodos Estadísticos$$cEstadística e Investigación Operativa
000108636 8560_ $$f728695@unizar.es
000108636 8564_ $$s4667308$$uhttps://zaguan.unizar.es/record/108636/files/TAZ-TFM-2021-888.pdf$$yMemoria (spa)
000108636 909CO $$ooai:zaguan.unizar.es:108636$$pdriver$$ptrabajos-fin-master
000108636 950__ $$a
000108636 951__ $$adeposita:2021-12-16
000108636 980__ $$aTAZ$$bTFM$$cCIEN
000108636 999__ $$a20210908115007.CREATION_DATE
Universidad de Zaragoza Repository