<?xml version="1.0" encoding="UTF-8"?>
<xml>
<records>
<record>
  <contributors>
    <authors>
      <author>Ferraz García, Francisco</author>
      <author>Hernández Giménez, Mónica</author>
      <author>Mayordomo Cámara, Elvira</author>
    </authors>
  </contributors>
  <titles>
    <title>Estudio de la reproducibilidad e interpretabilidad de los métodos más precisos del TADPOLE Challenge para el diagnóstico y pronóstico de la enfermedad de Alzheimer</title>
    <secondary-title/>
  </titles>
  <doi/>
  <pages/>
  <volume/>
  <number/>
  <dates>
    <year>2020</year>
    <pub-dates>
      <date>2020</date>
    </pub-dates>
  </dates>
  <abstract>El 15 de junio de 2017, el EuroPOND Consortium y ADNI lanzaron The Alzheimer’s Disease&lt;br /&gt;Prediction Of Longitudinal Evolution (TADPOLE) Challenge. Este reto tiene como objetivo&lt;br /&gt;identificar qué personas empezarán a mostrar síntomas en un plazo de 1 a 5 años elegidas en un&lt;br /&gt;grupo de edad de riesgo de padecer la enfermedad. Para ello, se propuso utilizar un conjunto&lt;br /&gt;de mediciones longitudinales realizadas sobre los pacientes prevalecientes de ADNI, con el fin&lt;br /&gt;de realizar predicciones de aquellas mediciones futuras más relevantes para el diagnóstico de la&lt;br /&gt;enfermedad.&lt;br /&gt;Las predicciones del TADPOLE Challenge se centran sobre el diagnóstico clínico, una&lt;br /&gt;clasificación en tres grupos dependientes del nivel de deterioro cerebral por probable enfermedad&lt;br /&gt;de Alzheimer (CN, MCI y AD); la puntuación ADAS‐Cog13, resultante de un exámen psicológico&lt;br /&gt;frecuentemente utilizado en ensayos clínicos; y el volumen de los ventrículos del cerebro, estimado&lt;br /&gt;a partir de imágenes por resonancia magnética (MRI). Gracias al TADPOLE Challenge se han&lt;br /&gt;desarrollado una serie de métodos de aprendizaje automático que han proporcionado unos&lt;br /&gt;resultados muy precisos en dos de las tres mediciones propuestas: el diagnóstico clínico y el&lt;br /&gt;volumen de los ventrículos. Por el contrario, las mejores estimaciones de la puntuación ADAS‐&lt;br /&gt;Cog13 fueron poco mejores que una estimación aleatoria.&lt;br /&gt;El objetivo de este Trabajo de Final de Grado es reproducir los resultados de los tres mejores&lt;br /&gt;métodos del TADPOLE Challenge en la predicción del diagnóstico clínico, de la forma más fiel&lt;br /&gt;posible dada la escasa información disponible de los mismos. Además, utilizaremos métodos&lt;br /&gt;de Inteligencia Artificial Interpretable para comprender por qué estos algoritmos obtienen los&lt;br /&gt;mejores resultados en esta tarea, para obtener información relevante para su mejora, y para&lt;br /&gt;establecer su fiabilidad y plantear su posible uso en la práctica clínica. Adicionalmente, se probará&lt;br /&gt;la efectividad de los métodos desarrollados para el pronóstico de la puntuación de ADAS‐Cog13 y&lt;br /&gt;la predicción del volumen de los ventrículos.&lt;br /&gt;En particular, se han implementado dos sistemas: un Gradient Booster y un Random Forest,&lt;br /&gt;y se ha utilizado un sistema de Support Vector Machines diseñado por los autores para el reto.&lt;br /&gt;Mediante el aumento de los datos originales y la optimización de los hiperparámetros, se ha&lt;br /&gt;conseguido reproducir e incluso superar los resultados de los métodos ganadores del reto tanto en&lt;br /&gt;la predicción del diagnóstico clínico como del volúmen de los ventrículos, con una precisión del 96%&lt;br /&gt;y del 91%, respectivamente. En comparación con las métricas del reto, hemos obtenido un mAUC&lt;br /&gt;(área bajo la curva característica operativa del receptor) de 97.6 en el problema de diagnóstico,&lt;br /&gt;superando el mAUC de 93.1 obtenido por el método ganador, mientras que para el volúmen de los&lt;br /&gt;ventrículos obtenemos un MAE (error absoluto medio) de 0.27, superando el 0.45 de referencia.&lt;br /&gt;Mediante el uso de dos algoritmos del estado del arte en interpretabilidad (SHAP y LIME) se&lt;br /&gt;ha demostrado la fiabilidad de los modelos, comparando los atributos que usan para obtener el&lt;br /&gt;diagnóstico con los utilizados en la práctica clínica, y se han señalado los motivos por los que los&lt;br /&gt;sistemas podrían fallar, proponiendo soluciones para aumentar la capacidad de generalización de&lt;br /&gt;los modelos.&lt;br /&gt;&lt;br /&gt;</abstract>
</record>

</records>
</xml>