Resumen: En la actualidad, la mejora de las técnicas de secuenciación de ADN y el aumento de los grupos de investigación han permitido el desarrollo de varias aplicaciones. En el ámbito de la e-salud, comienzan a catalogarse genes defectuosos que disparan la probabilidad de padecer enfermedades como cáncer, párkinson o diabetes. Analizando el genoma de un individuo, es posible detectar prematuramente estas enfermedades y llevar a cabo un tratamiento personalizado. Por otra parte, la comparación del genoma de un mismo individuo en distintos momentos de la vida permite detectar mutaciones (p.ej. debibas a radiación ionizante). Además, como el genoma de cada individuo es único y guarda estrecha relación con el de sus parientes, puede ser utilizado tanto en aplicaciones biométricas como para realizar estudios filogénicos. Para desarrollar estas aplicaciones, la secuencia de ADN es codificada digitalmente y se incorporan aquellos metadatos (datos personales, datos médicos, anotaciones sobre la secuencia, etc.) que sean pertinentes. Con este propósito, han surgido varios protocolos (HL7 genomics para e-salud, BSML, MAGE-ML) que permiten el almacenamiento e intercambio estandarizado de muestras de ADN. No obstante, éstos están diseñados para trabajar con muestras pequeñas (para aplicaciones específicas) y por ello no habilitan métodos de compresión. Además, no siempre incluyen mecanismos para la protección de los datos, tal como obliga la legislación vigente (en España, la LOPD). El objetivo de este Proyecto Fin de Carrera es diseñar un contenedor digital optimizado para el almacenamiento e intercambio de genomas humanos o partes de éstos. Éste podrá ser utilizado tanto para las aplicaciones antes descritas (p.ej. genética clínica y biometría) como para futuras aplicaciones por desarrollar. Existen tres elementos de gran interés en su diseño: la selección de un algoritmo de compresión sin pérdidas que permita reducir el tamaño del genoma (aprox. 3 GB), el desarrollo de un sistema robusto de seguridad y control de acceso según roles (p.ej. médico, investigador, sistema biométrico) y la capacidad de interoperar con los estándares ya existentes. Se implementará una interfaz gráfica que permita tanto la construcción como el acceso al contenedor según roles diferenciados. Finalmente se medirán los ratios de compresión de la secuencia genética, el overhead debido a los elementos de seguridad y los tiempos de construcción y acceso al contenedor para evaluar la calidad del diseño.