Abstract: El objetivo de este trabajo es reproducir el estudio realizado en L. Yuanyuan et al., Deep Feature Selection and Causal Analysis of Alzheimer’s Disease, Frontiers in Neuroscience, 2019 [1]. El estudio consiste en el desarrollo de un sistema que integra deep learning, feature selection, inferencia causal y análisis genéticos y de imágenes para la predicción y una mejor comprensión de las causas de la enfermedad de Alzheimer. En el estudio utilizamos imágenes cerebrales en tres dimensiones, obtenidas mediante la técnica de resonancia magnética Diffusion Tensor Imaging (DTI) y datos genéticos de los pacientes. Contamos con un dataset de imágenes DTI de 112 pacientes (51 AD y 62 CN), cada uno con imágenes en cuatro puntos temporales: baseline, 6 meses, 12 meses y 24 meses. El dataset de datos genéticos se compone del genoma de 79 pacientes, del cual tras su procesado hemos obtenido los 40 genes con los que hemos realizado los experimentos. El trabajo desarrollado ha consistido, en realizar un preprocesado de las imágenes consistente en un registro lineal y no lineal a un atlas estándar y un control de calidad e imputación de los datos genéticos utilizando los datos de referencia de 1000 Genomes. A continuación se ha diseñado un modelo de red neuronal convolucional de tres dimensiones para obtener la probabilidad de que un paciente padezca Alzheimer, estimada a partir de una imágen DTI de su cerebro. Posteriormente, se ha realizado un procedimiento de interpretabilidad de redes neuronales conocido como Prediction Difference Analysis, consistente en ocultar parte de la información de la imágen de entrada para observar la variación en la predicción con el objetivo de obtener las regiones cerebrales a las que la red neuronal da más importancia a la hora de predecir la probabilidad de Alzheimer de un paciente. Finalmente, se han realizado dos experimentos de descubrimiento causal que buscan determinar la dirección de la causalidad entre la enfermedad de Alzheimer y las regiones cerebrales, y entre las regiones cerebrales y los genes, es decir en descubrir si la dirección de la causalidad es X → Y ( X causa Y ) o Y → X ( Y causa X ). Esto se ha abordado mediante la construcción de dos redes generativas adversarias condicionales (CGAN) que aprenderán a generar la distribución de X dado Y y la distribución de Y dado X . Los modelos resultantes se han evaluado mediante un Classifier 2 Sample Test (C2ST), el cual consiste en un método de clasificación que intenta distinguir entre los ejemplos generados por una CGAN y los reales. Si el clasificador no es capaz de distinguir entre los dos conjuntos, es decir, si obtiene una precisión cercana al 50%, significa que la CGAN ha conseguido modelar de forma exitosa la distribución objetivo. Determinaremos que la dirección de causalidad correcta es la que obtenga una precisión menor en su C2ST. Mediante el experimento de interpretabilidad se ha descubierto que el ventrículo es una región a la que la red neuronal presta especial atención al predecir Alzheimer a partir de las imágenes de DTI. Con los experimentos de búsqueda causal hemos encontrado relevancia estadística en la causalidad de todas las ROI analizadas con la dirección ROI → AD y hemos obtenido relevancia en 14 de los genes analizados, destacando el gen CD33, relacionado con el Alzheimer y el SCYL1 relacionado con la atrofia cerebral.