000069800 001__ 69800
000069800 005__ 20180417132418.0
000069800 037__ $$aTAZ-TFM-2018-012
000069800 041__ $$aeng
000069800 1001_ $$aAlonso Ruiz, Íñigo
000069800 24200 $$aSemantic segmentation with deep learning models and sparse or weak labels
000069800 24500 $$aSegmentación semántica con modelos de deep learning y etiquetados no densos
000069800 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2018
000069800 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000069800 520__ $$aLa segmentación semántica es un problema muy estudiado dentro del campo de la visión por computador que consiste en la clasificación de imágenes a nivel de píxel. Es decir, asignar una etiqueta o valor a cada uno de los píxeles de la imagen. Tiene aplicaciones muy variadas, que van desde interpretar el contenido de escenas urbanas para tareas de conducción automática hasta aplicaciones médicas que ayuden al médico a analizar la información del paciente para realizar un diagnóstico o operaciones. Como en muchos otros problemas y tareas relacionados con la visión por computador, en los últimos años se han propuesto y demostrado grandes avances en los métodos para segmentación semántica gracias, en gran parte, al reciente auge de los métodos basados en aprendizaje profundo o deep learning.\\ A pesar de que en los últimos años se están realizando mejoras constantes,  los modelos de \textit{deep learning} para segmentación semántica %así como otras áreas, tienen un problema  presentan un reto que dificulta su aplicabilidad a problemas de la vida real: necesitan grandes cantidades de anotaciones para entrenar los modelos. Esto es muy costoso, sobre todo porque en este caso hay que realizarlo a nivel de píxel. Muchos conjuntos de datos reales, por ejemplo datos adquiridos para tareas de monitorización del medio ambiente (grabaciones de entornos naturales, imágenes de satélite) generalmente presentan tan solo unos pocos píxeles etiquetados por imagen, que suelen venir de algunos clicks de un experto, para indicar ciertas zonas de interés en esas imágenes. Este tipo de etiquetado hace %imposible que sea muy complicado el entrenamiento de modelos densos que permitan procesar y obtener de manera automática una mayor cantidad de información de todos estos conjuntos de datos.\\ El objetivo de este trabajo es proponer nuevos métodos para resolver este problema. La idea principal es utilizar una segmentación inicial de la imagen multi-nivel de la imagen para propagar la poca información disponible. Este enfoque novedoso permite aumentar la anotación, y demostramos que pese a ser algo ruidosa, permite aprender de manera efectiva un modelo que obtenga la segmentación deseada.  Este método es aplicable a cualquier tipo de dispersión de las anotaciones, siendo independiente del número de píxeles anotados. Las principales tareas desarrolladas en este proyecto son:  -Estudio del estado del arte en técnicas de segmentación semántica (la mayoría basadas en técnicas de deep learning) -Propuesta y evaluación de métodos para aumentar (propagar) las etiquetas de las imágenes de entrenamiento cuando estas son dispersas y escasas -Diseño y evaluación de las arquitecturas de redes neuronales más adecuadas para resolver este problema Para validar nuestras propuestas, nos centramos en un caso de aplicación en imágenes submarinas, capturadas para monitorización de las zonas de barreras de coral. También demostramos que el método propuesto se puede aplicar a otro tipo de imágenes, como imágenes aéreas, imágenes multiespectrales y conjuntos de datos de segmentación de instancias.
000069800 521__ $$aMáster Universitario en Ingeniería Informática
000069800 540__ $$aDerechos regulados por licencia Creative Commons
000069800 700__ $$aMurillo Arnal, Ana Cristina$$edir.
000069800 700__ $$aCambra Linés, Ana Belén$$edir.
000069800 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cIngeniería de Sistemas y Automática
000069800 8560_ $$f665959@celes.unizar.es
000069800 8564_ $$s6424205$$uhttps://zaguan.unizar.es/record/69800/files/TAZ-TFM-2018-012.pdf$$yMemoria (eng)
000069800 909CO $$ooai:zaguan.unizar.es:69800$$pdriver$$ptrabajos-fin-master
000069800 950__ $$a
000069800 951__ $$adeposita:2018-04-17
000069800 980__ $$aTAZ$$bTFM$$cEINA
000069800 999__ $$a20180202013325.CREATION_DATE