000012385 001__ 12385
000012385 005__ 20170831220512.0
000012385 037__ $$aTAZ-TFM-2013-838
000012385 041__ $$aspa
000012385 1001_ $$aCambra Linés, Ana Belén
000012385 24500 $$aReconocimiento robusto de texto en imágenes de dispositivos móviles
000012385 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2013
000012385 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000012385 520__ $$aEl procesamiento automático de imágenes tiene gran interés en el desarrollo de nuevas tecnologías y aplicaciones basadas en información visual. Hasta hace poco, estas tareas han estado limitadas a realizarse en ordenadores con gran capacidad de cómputo, debido a los altos requerimientos de los algoritmos utilizados. Sin embargo, estas limitaciones van desapareciendo gracias a las últimas generaciones de teléfonos móviles, los smartphones, que poseen capacidades de procesamiento mucho más altas. En particular, dentro del campo de la visión artificial y en particular en temas de reconocimiento automático, una tarea que se ve muy beneficiada de la portabilidad a dispositivos móviles es la detección y reconocimiento de texto, ya que se han generado nuevos ámbitos de aplicación. Con este trabajo de fin de máster se propone mejorar un sistema base existente de reconocimiento de texto en imágenes. El sistema base consiste en una aplicación para móviles capaz de extraer el texto de carteles rectangulares presentes en una fotografía capturada con el móvil. Actualmente existen muchos reconocedores de caracteres, llamados OCRs (del inglés Optical Character Recognition), que permiten extraer el texto de una imagen pero sus buenos resultados están muy condicionados a cómo se presenta el texto dentro de dicha imagen. Se requiere que el usuario enfoque con mucha precisión dónde se encuentran los textos a leer. Esta situación es una gran restricción y sobretodo muy poco realista y robusta, además de no permitir aprovechar estas tecnologías para, por ejemplo, dar servi cios a personas con problemas de visión. Aunque el prototipo tomado como base para este trabajo consigue mejorar los resultados obtenidos por un OCR convencional, sigue presentando limitaciones para el uso en escenarios generales. En particular, se va a realizar una evaluación exhaustiva del prototipo, y se va a diseñar e implementar mejoras que reduzcan las limitaciones actuales que presenta, para conseguir un reconocimiento más robusto. Dado que el campo donde se enmarca este trabajo es una rama activa dentro de la visión artificial, han aparecido nuevos enfoques dentro del reconocimiento de texto que obtienen mejores resultados que los tradicionales OCRs. Por ello, también se va a diseñar y evaluar la integración de este tipo de enfoques con el trabajo realizado. Los resultados obtenidos han sido satisfactorios, consiguiendo mejorar el prototipo base. También la evaluación realizada del proceso demuestra que éste consigue mejorar los resultados de otros OCRs existentes, además de mejorar, en determinados casos, los resultados de otras técnicas de extracción de texto más modernas. Con parte de estos resultados se redactó el siguiente articulo: “Towards robust and efficient text sign reading from a mobile phone” que fue publicado en el 2nd IEEE Workshop on Mobile Vision llevado a cabo junto con el ICCV 2011.
000012385 521__ $$aMáster Universitario en Ingeniería de Sistemas e Informática
000012385 540__ $$aDerechos regulados por licencia Creative Commons
000012385 6531_ $$avisión artificial
000012385 6531_ $$areconocimiento
000012385 6531_ $$aocr
000012385 6531_ $$adispositivos móviles
000012385 700__ $$aMurillo Arnal, Ana Cristina$$edir.
000012385 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000012385 8560_ $$f538512@celes.unizar.es
000012385 8564_ $$s29720868$$uhttps://zaguan.unizar.es/record/12385/files/TAZ-TFM-2013-838.pdf$$yMemoria (spa)
000012385 909CO $$ooai:zaguan.unizar.es:12385$$ptrabajos-fin-master$$pdriver
000012385 950__ $$a
000012385 980__ $$aTAZ$$bTFM$$cEINA