000096477 001__ 96477
000096477 005__ 20201120151208.0
000096477 037__ $$aTAZ-TFG-2020-3448
000096477 041__ $$aspa
000096477 1001_ $$aFerraz García, Francisco
000096477 24200 $$aReproducibility and interpretability of the best-performing methods in TADPOLE Challenge for the diagnosis and prognosis of Alzheimer's disease
000096477 24500 $$aEstudio de la reproducibilidad e interpretabilidad de los métodos más precisos del TADPOLE Challenge para el diagnóstico y pronóstico de la enfermedad de Alzheimer
000096477 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2020
000096477 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000096477 520__ $$aEl 15 de junio de 2017, el EuroPOND Consortium y ADNI lanzaron The Alzheimer’s Disease<br />Prediction Of Longitudinal Evolution (TADPOLE) Challenge. Este reto tiene como objetivo<br />identificar qué personas empezarán a mostrar síntomas en un plazo de 1 a 5 años elegidas en un<br />grupo de edad de riesgo de padecer la enfermedad. Para ello, se propuso utilizar un conjunto<br />de mediciones longitudinales realizadas sobre los pacientes prevalecientes de ADNI, con el fin<br />de realizar predicciones de aquellas mediciones futuras más relevantes para el diagnóstico de la<br />enfermedad.<br />Las predicciones del TADPOLE Challenge se centran sobre el diagnóstico clínico, una<br />clasificación en tres grupos dependientes del nivel de deterioro cerebral por probable enfermedad<br />de Alzheimer (CN, MCI y AD); la puntuación ADAS‐Cog13, resultante de un exámen psicológico<br />frecuentemente utilizado en ensayos clínicos; y el volumen de los ventrículos del cerebro, estimado<br />a partir de imágenes por resonancia magnética (MRI). Gracias al TADPOLE Challenge se han<br />desarrollado una serie de métodos de aprendizaje automático que han proporcionado unos<br />resultados muy precisos en dos de las tres mediciones propuestas: el diagnóstico clínico y el<br />volumen de los ventrículos. Por el contrario, las mejores estimaciones de la puntuación ADAS‐<br />Cog13 fueron poco mejores que una estimación aleatoria.<br />El objetivo de este Trabajo de Final de Grado es reproducir los resultados de los tres mejores<br />métodos del TADPOLE Challenge en la predicción del diagnóstico clínico, de la forma más fiel<br />posible dada la escasa información disponible de los mismos. Además, utilizaremos métodos<br />de Inteligencia Artificial Interpretable para comprender por qué estos algoritmos obtienen los<br />mejores resultados en esta tarea, para obtener información relevante para su mejora, y para<br />establecer su fiabilidad y plantear su posible uso en la práctica clínica. Adicionalmente, se probará<br />la efectividad de los métodos desarrollados para el pronóstico de la puntuación de ADAS‐Cog13 y<br />la predicción del volumen de los ventrículos.<br />En particular, se han implementado dos sistemas: un Gradient Booster y un Random Forest,<br />y se ha utilizado un sistema de Support Vector Machines diseñado por los autores para el reto.<br />Mediante el aumento de los datos originales y la optimización de los hiperparámetros, se ha<br />conseguido reproducir e incluso superar los resultados de los métodos ganadores del reto tanto en<br />la predicción del diagnóstico clínico como del volúmen de los ventrículos, con una precisión del 96%<br />y del 91%, respectivamente. En comparación con las métricas del reto, hemos obtenido un mAUC<br />(área bajo la curva característica operativa del receptor) de 97.6 en el problema de diagnóstico,<br />superando el mAUC de 93.1 obtenido por el método ganador, mientras que para el volúmen de los<br />ventrículos obtenemos un MAE (error absoluto medio) de 0.27, superando el 0.45 de referencia.<br />Mediante el uso de dos algoritmos del estado del arte en interpretabilidad (SHAP y LIME) se<br />ha demostrado la fiabilidad de los modelos, comparando los atributos que usan para obtener el<br />diagnóstico con los utilizados en la práctica clínica, y se han señalado los motivos por los que los<br />sistemas podrían fallar, proponiendo soluciones para aumentar la capacidad de generalización de<br />los modelos.<br /><br />
000096477 521__ $$aGraduado en Ingeniería Informática
000096477 540__ $$aDerechos regulados por licencia Creative Commons
000096477 700__ $$aHernández Giménez, Mónica$$edir.
000096477 700__ $$aMayordomo Cámara, Elvira$$edir.
000096477 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000096477 8560_ $$f737312@unizar.es
000096477 8564_ $$s13303093$$uhttps://zaguan.unizar.es/record/96477/files/TAZ-TFG-2020-3448.pdf$$yMemoria (spa)
000096477 909CO $$ooai:zaguan.unizar.es:96477$$pdriver$$ptrabajos-fin-grado
000096477 950__ $$a
000096477 951__ $$adeposita:2020-11-20
000096477 980__ $$aTAZ$$bTFG$$cEINA
000096477 999__ $$a20200901123918.CREATION_DATE