Resumen: Para facilitar la gestión de plagas en cultivos, el Ministerio de Agricultura, Ganadería y Pesca proporciona múltiples documentos describiendo los diferentes aspectos de las plagas y sus posibles tratamientos. Sin embargo, dicha información, en vez de proporcionarse de forma interoperable, está descrita principalmente en ficheros PDF, cada uno centrado en un aspecto concreto de la gestión de plagas. Como primer paso para facilitar la integración de toda la información disponible en un sistema de información moderno, este trabajo de fin de grado se centra en el desarrollo de un sistema de extracción de la información contenida en un subconjunto de la colección de documentos PDF disponibles (texto e imágenes) y su almacenamiento en una base de datos. La complejidad del proceso de extracción viene marcada por la heterogeneidad y problemas de calidad de los documentos tratados. Como forma de validación de la información extraída, se desarrolla una aplicación web que presenta la información guardada en la base de datos de forma sencilla y rápidamente accesible a través de una serie de parámetros de búsqueda. Dada la complejidad de la extracción de información de los PDFs, este paso requiere una investigación previa en herramientas y métodos existentes y su comparación para la elección del conjunto más apropiado. La implementación de la aplicación web se realiza con el stack MERN (MongoDB, Express, React y NodeJS), ampliamente utilizado actualmente.