<?xml version="1.0" encoding="UTF-8"?>
<articles>
<article xmlns:xlink="http://www.w3.org/1999/xlink/">
  <front>
    <article-meta>
      <title-group>
        <article-title/>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name>
            <surname>Hernández Giménez</surname>
            <given-names>Mónica</given-names>
          </name>
        </contrib>
        <contrib contrib-type="author">
          <name>
            <surname>Mayordomo Cámara</surname>
            <given-names>Elvira</given-names>
          </name>
        </contrib>
      </contrib-group>
      <pub-date pub-type="pub">
        <year>2020</year>
      </pub-date>
      <self-uri xlink:href="http://zaguan.unizar.es/record/96477"/>
      <self-uri xlink:href="http://zaguan.unizar.es/record/96477/files/TAZ-TFG-2020-3448.pdf"/>
    </article-meta>
    <abstract>El 15 de junio de 2017, el EuroPOND Consortium y ADNI lanzaron The Alzheimer’s Disease&lt;br /&gt;Prediction Of Longitudinal Evolution (TADPOLE) Challenge. Este reto tiene como objetivo&lt;br /&gt;identificar qué personas empezarán a mostrar síntomas en un plazo de 1 a 5 años elegidas en un&lt;br /&gt;grupo de edad de riesgo de padecer la enfermedad. Para ello, se propuso utilizar un conjunto&lt;br /&gt;de mediciones longitudinales realizadas sobre los pacientes prevalecientes de ADNI, con el fin&lt;br /&gt;de realizar predicciones de aquellas mediciones futuras más relevantes para el diagnóstico de la&lt;br /&gt;enfermedad.&lt;br /&gt;Las predicciones del TADPOLE Challenge se centran sobre el diagnóstico clínico, una&lt;br /&gt;clasificación en tres grupos dependientes del nivel de deterioro cerebral por probable enfermedad&lt;br /&gt;de Alzheimer (CN, MCI y AD); la puntuación ADAS‐Cog13, resultante de un exámen psicológico&lt;br /&gt;frecuentemente utilizado en ensayos clínicos; y el volumen de los ventrículos del cerebro, estimado&lt;br /&gt;a partir de imágenes por resonancia magnética (MRI). Gracias al TADPOLE Challenge se han&lt;br /&gt;desarrollado una serie de métodos de aprendizaje automático que han proporcionado unos&lt;br /&gt;resultados muy precisos en dos de las tres mediciones propuestas: el diagnóstico clínico y el&lt;br /&gt;volumen de los ventrículos. Por el contrario, las mejores estimaciones de la puntuación ADAS‐&lt;br /&gt;Cog13 fueron poco mejores que una estimación aleatoria.&lt;br /&gt;El objetivo de este Trabajo de Final de Grado es reproducir los resultados de los tres mejores&lt;br /&gt;métodos del TADPOLE Challenge en la predicción del diagnóstico clínico, de la forma más fiel&lt;br /&gt;posible dada la escasa información disponible de los mismos. Además, utilizaremos métodos&lt;br /&gt;de Inteligencia Artificial Interpretable para comprender por qué estos algoritmos obtienen los&lt;br /&gt;mejores resultados en esta tarea, para obtener información relevante para su mejora, y para&lt;br /&gt;establecer su fiabilidad y plantear su posible uso en la práctica clínica. Adicionalmente, se probará&lt;br /&gt;la efectividad de los métodos desarrollados para el pronóstico de la puntuación de ADAS‐Cog13 y&lt;br /&gt;la predicción del volumen de los ventrículos.&lt;br /&gt;En particular, se han implementado dos sistemas: un Gradient Booster y un Random Forest,&lt;br /&gt;y se ha utilizado un sistema de Support Vector Machines diseñado por los autores para el reto.&lt;br /&gt;Mediante el aumento de los datos originales y la optimización de los hiperparámetros, se ha&lt;br /&gt;conseguido reproducir e incluso superar los resultados de los métodos ganadores del reto tanto en&lt;br /&gt;la predicción del diagnóstico clínico como del volúmen de los ventrículos, con una precisión del 96%&lt;br /&gt;y del 91%, respectivamente. En comparación con las métricas del reto, hemos obtenido un mAUC&lt;br /&gt;(área bajo la curva característica operativa del receptor) de 97.6 en el problema de diagnóstico,&lt;br /&gt;superando el mAUC de 93.1 obtenido por el método ganador, mientras que para el volúmen de los&lt;br /&gt;ventrículos obtenemos un MAE (error absoluto medio) de 0.27, superando el 0.45 de referencia.&lt;br /&gt;Mediante el uso de dos algoritmos del estado del arte en interpretabilidad (SHAP y LIME) se&lt;br /&gt;ha demostrado la fiabilidad de los modelos, comparando los atributos que usan para obtener el&lt;br /&gt;diagnóstico con los utilizados en la práctica clínica, y se han señalado los motivos por los que los&lt;br /&gt;sistemas podrían fallar, proponiendo soluciones para aumentar la capacidad de generalización de&lt;br /&gt;los modelos.&lt;br /&gt;&lt;br /&gt;</abstract>
  </front>
  <article-type>TAZ</article-type>
</article>

</articles>