000013281 001__ 13281 000013281 005__ 20190219123644.0 000013281 037__ $$aTESIS-2013-162 000013281 041__ $$aeng 000013281 080__ $$a004 000013281 1001_ $$aPraczyk, Piotr Adam 000013281 24500 $$aManagement of Scientific Images$$bAn approach to the extraction, annotation and retrieval of figures in the field of High Energy Physics 000013281 260__ $$aZaragoza$$bUniversidad de Zaragoza, Prensas de la Universidad$$c2013 000013281 300__ $$a195 000013281 4900_ $$aTesis de la Universidad de Zaragoza$$v2013-143$$x2254-7606 000013281 500__ $$aPresentado: 26 11 2013 000013281 502__ $$aTesis-Univ. Zaragoza, Informática e Ingeniería de Sistemas, 2013$$bZaragoza, Universidad de Zaragoza$$c2013 000013281 506__ $$aby-nc-nd$$bCreative Commons$$c3.0$$uhttps://creativecommons.org/licenses/by-nc-nd/3.0/ 000013281 520__ $$aEl entorno de la información en la primera década del siglo XXI no tiene precedentes. Las barreras físicas que han limitado el acceso al conocimiento están desapareciendo a medida que los métodos tradicionales de acceso a información se reemplazan o se mejoran gracias al uso de sistemas basados en computador. Los sistemas digitales son capaces de gestionar colecciones mucho más grandes de documentos, confrontando a los usuarios de información con la avalancha de documentos asociados a su tópico de interés. Esta nueva situación ha creado un incentivo para el desarrollo de técnicas de minería de datos y la creación de motores de búsqueda más eficientes y capaces de limitar los resultados de búsqueda a un subconjunto reducido de los más relevantes. Sin embargo, la mayoría de los motores de búsqueda en la actualidad trabajan con descripciones textuales. Estas descripciones se pueden extraer o bien del contenido o a través de fuentes externas. La recuperación basada en el contenido no textual de documentos es un tema de investigación continua. En particular, la recuperación de imágenes y el desentrañar la información contenida en ellas están suscitando un gran interés en la comunidad científica. Las bibliotecas digitales se sitúan en una posición especial dentro de los sistemas que facilitan el acceso al conocimiento. Actúan como repositorios de documentos que comparten algunas características comunes (por ejemplo, pertenecer a la misma área de conocimiento o ser publicados por la misma institución) y como tales contienen documentos considerados de interés para un grupo particular de usuarios. Además, facilitan funcionalidades de recuperación sobre las colecciones gestionadas. Normalmente, las publicaciones científicas son las unidades más pequeñas gestionadas por las bibliotecas digitales científicas. Sin embargo, en el proceso de creación científica hay diferentes tipos de artefactos, entre otros: figuras y conjuntos de datos. Las figuras juegan un papel particularmente importante en el proceso de publicación científica. Representan los datos en una forma gráfica que nos permite mostrar patrones sobre grandes conjuntos de datos y transmitir ideas complejas de un modo fácilmente entendible. Los sistemas existentes para bibliotecas digitales facilitan el acceso a figuras, pero solo como parte de los ficheros sobre los que se serializa la publicación entera. El objetivo de esta tesis es proponer un conjunto de métodos ytécnicas que permitan transformar las figuras en productos de primera clase dentro del proceso de publicación científica, permitiendo que los investigadores puedan obtener el máximo beneficio a la hora de realizar búsquedas y revisiones de bibliografía existente. Los métodos y técnicas propuestos están orientados a facilitar la adquisición, anotación semántica y búsqueda de figuras contenidas en publicaciones científicas. Para demostrar la completitud de la investigación se han ilustrado las teorías propuestas mediante ejemplos en el campo de la Física de Partículas (también conocido como Física de Altas Energías). Para aquellos casos en los que se han necesitadoo en las figuras que aparecen con más frecuencia en las publicaciones de Física de Partículas: los gráficos científicos denominados en inglés con el término plots. Los prototipos que propuestas más detalladas han desarrollado para esta tesis se han integrado parcialmente dentro del software Invenio (1) para bibliotecas digitales, así como dentro de INSPIRE, una de las mayores bibliotecas digitales en Física de Partículas mantenida gracias a la colaboración de grandes laboratorios y centros de investigación como son el CERN, SLAC, DESY y Fermilab. 1). http://invenio-software.org/ 000013281 6531_ $$adiseño y componentes de sistemas de información 000013281 6531_ $$abases de datos 000013281 6531_ $$ainteligencia artificial 000013281 6531_ $$asoftware 000013281 6531_ $$adesign and components of information systems 000013281 6531_ $$adatabases 000013281 6531_ $$aartificial intelligence 000013281 700__ $$aMele, Salvatore$$edir. 000013281 700__ $$aNogueras Iso, Francisco Javier$$edir. 000013281 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas 000013281 8560_ $$fzaguan@unizar.es 000013281 8564_ $$s7401539$$uhttps://zaguan.unizar.es/record/13281/files/TESIS-2013-162.pdf$$zTexto completo (eng) 000013281 909CO $$ooai:zaguan.unizar.es:13281 000013281 909co $$ptesis 000013281 909CO $$pdriver 000013281 9102_ $$aCiencia de la computación e inteligencia artificial$$bInformática e Ingeniería de Sistemas 000013281 980__ $$aTESIS