TAZ-TFM-2021-888


Inteligencia artificial aplicada a la búsqueda de imagen en el sector eCommerce.

Díez Corral, Javier
Alcalá Nalvaiz, José Tomás (dir.) ; Aldea Blasco, Inés (dir.)

Universidad de Zaragoza, CIEN, 2021
Departamento de Métodos Estadísticos, Área de Estadística e Investigación Operativa

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación

Resumen: La gran expansión en los últimos de la inteligencia artificial combinada con los avances conseguidos en el campo del deep learning, han permitido ampliar las técnicas y algoritmos usados en las tareas de visión por ordenador. En el presente trabajo nos centraremos en la tarea de reconocimiento de imágenes mediante modelos de segmentación semántica que aplicaremos al estudio de la viabilidad de un proyecto sobre la construcción de un sistema de recomendación de prendas de ropa para una tienda online. Este tipo de modelos, basados en la clasificación de cada pixel de una imagen a una de las categorías del problema, permiten combinar la clasificación y la localización de los diferentes objetos que nos interesen de la imagen. En particular, analizaremos aquellos modelos que utilizan redes neuronales convolucionales completas (FCN).
En la parte teórica del trabajo realizaremos una breve introducción a la segmentación semántica para, a continuación, explicar en profundidad los elementos que componen una FCN distinguiendo dos fases, una encargada de la extracción de características de la imagen y otra encargada de recuperar la imagen segmentada. A lo largo de ese capítulo, detallaremos los elementos que forman las capas de convolución de la red, introduciendo la operación de convolución, las funciones de activación y la operación de pooling que forman la primera fase y la operación de convolución transpuesta y funciones de unpooling utilizadas durante la segunda fase de la red. Una vez definidos todos estos elementos, explicaremos cómo se produce el proceso de aprendizaje en la red mediante la optimización de una función de pérdida e introduciremos el algoritmo de retropropagación combinado con el algoritmo de optimización Adam. Para finalizar este capítulo, presentaremos algunas de las métricas y técnicas más usadas para la validación de modelos de segmentación semántica.
En el último capítulo de la memoria presentaremos el procedimiento seguido y los resultados obtenidos durante el desarrollo del proyecto en Jupyter Notebook. En particular, comenzaremos introduciendo la parte de preprocesamiento de los datos donde presentaremos un algoritmo original de etiquetado de imágenes automático basado en el algoritmo k-medias y en la aplicación de diferentes técnicas de tratamiento de la imagen. A continuación, presentaremos los diferentes modelos ajustados para este proyecto centrándonos, sobre todo, en el modelo final que implementaremos. Este modelo utiliza una arquitectura que hemos personalizado para este proyecto de la red U-Net y para su compilación utilizaremos la función de pérdida de entropía cruzada y el optimizador Adam. Con este modelo se ha conseguido, en la clasificación a nivel de pixel, una precisión del 94,37% y del 87,04% en los conjuntos de entrenamiento y validación respectivamente.
Con la idea de implementar este modelo final a un caso real, se ha construido una pequeña aplicación que permita emular un sistema de recomendación típico de una tienda online. Este sistema poseerá dos opciones de recomendación. La primera, que tendrá en cuenta el color y el tipo de prenda de la imagen que se suba al sistema, usará un método original basado en la combinación del algoritmo k-medias y de la segmentación de la imagen realizada por el modelo para obtener el color más predominante de la prenda de ropa, mientras que la segunda únicamente tendrá en cuenta el tipo de prenda de ropa que aparece en la imagen.
Para finalizar el estudio de viabilidad, en la parte final del trabajo presentaremos la interfaz gráfica de la aplicación donde se podrá observar, con un ejemplo, su funcionamiento.


Tipo de Trabajo Académico: Trabajo Fin de Master

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Facultad de Ciencias
Trabajos académicos > Trabajos fin de máster



Volver a la búsqueda

Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)