TAZ-TFG-2016-048


Elaboración de un dataset para reconocimiento visual de grano fino

Escobedo Galindo, Sergio
Civera Sancho, Javier (dir.)

Universidad de Zaragoza, EINA, 2016
Informática e Ingeniería de Sistemas department, Ingeniería de Sistemas y Automática area

Graduado en Ingeniería Electrónica y Automática

Abstract: La visión por computador es la capacidad de los ordenadores de analizar imágenes capturadas por una cámara y obtener la información de los objetos que se hayan presentes en esa escena. Dentro de la visión por computador el reconocimiento de objetos en imágenes de manera automática es una de las aplicaciones más relevantes. Un problema particularmente difícil es la clasificación de categorías muy similares, llamado reconocimiento de grano fino. Un ejemplo de esta aplicación pueden ser flores, pájaros o, como en este trabajo, peces. El objetivo del trabajo es la elaboración de un dataset y el análisis de varios algoritmos para el reconocimiento de las diferentes clases. Los algoritmos que serán analizados están basados en histogramas de gradientes de intensidad e histogramas de color. La elaboración del dataset se ha llevado a cabo mediante el estudio de la clasificación jerarquizada de cada una de las especies. Ya que cada especie está incluida en una gran variedad de categorías, se han tomado en cuenta de lo concreto a lo general, considerando la categoría más alejada la clase de cada especie. En el dataset se ha intentado abarcar un gran número de especies de peces para que sea lo más general posible. Aunque bajo la definición de peces se encuentran entorno a 30.000 especies diferentes. Para la evaluación del dataset elaborado se ha usado código para la detección de características y reconocimiento de imágenes y vídeo. Este código está orientado a reconocimiento de objetos en general, no a casos en los que las clases sean muy similares como en este caso. Tras observar que ciertas especies poseen geometrías similares a otras pero colores muy distintivos, se estudió la forma de añadir el color como elemento descriptor de la imagen. La adición del color para describir la imagen se ha llevado a cabo mediante el histograma de color de la imagen. Como el color depende de múltiples factores, se han añadido los histogramas de color en formatos de imagen no tan comúnmente conocidos como lo es el RGB para intentar reducir los factores que influyen en el color. Una vez obtenido un resultado con una configuración que se lleva usando desde hace bastantes años, se tomó la determinación de usar alguna técnica más novedosa. Actualmente, las últimas investigaciones se enfocan hacia las redes neuronales. Una de las principales dificultades para obtener un buen resultado con esta técnica resulta de la necesidad de ajustar un gran número de parámetros de la red. Si se logra salvar esa dificultad, los resultados de clasificación aumentan significativamente de ahí su actual estudio en este ámbito y su potencial ya que aún no están perfectamente desarrolladas.

Tipo de Trabajo Académico: Trabajo Fin de Grado

Creative Commons License

El registro pertenece a las siguientes colecciones:
Academic Works > Trabajos Académicos por Centro > escuela-de-ingeniería-y-arquitectura
Academic Works > End-of-grade works



Back to search

Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)