<?xml version="1.0" encoding="UTF-8"?>
<articles>
<article xmlns:xlink="http://www.w3.org/1999/xlink/">
  <front>
    <article-meta>
      <title-group>
        <article-title/>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name>
            <surname>López Ruiz</surname>
            <given-names>Ricardo</given-names>
          </name>
        </contrib>
        <contrib contrib-type="author">
          <name>
            <surname>Bueno Sancho</surname>
            <given-names>Vanessa</given-names>
          </name>
        </contrib>
      </contrib-group>
      <pub-date pub-type="pub">
        <year>2023</year>
      </pub-date>
      <self-uri xlink:href="http://zaguan.unizar.es/record/134420"/>
      <self-uri xlink:href="http://zaguan.unizar.es/record/134420/files/TAZ-TFG-2023-3765.pdf"/>
    </article-meta>
    <abstract>Este trabajo surge a raíz de un periodo de prácticas realizado en la empresa NTT DATA. Concre- &lt;br /&gt;tamente en el departamento de AI Assest Development Center en el equipo de Dolffia. Dolffia es una &lt;br /&gt;plataforma de procesamiento de documentos basada en IA, que extrae y clasifica información de ma- &lt;br /&gt;nera rápida y precisa. El objetivo del trabajo es crear una herramienta capaz de identificar las distintas &lt;br /&gt;entidades estructurales de un documento. Para ello tuve que aprender sobre NLP (Natural Language &lt;br /&gt;Processing) y descubrir los diferentes algoritmos usados en el machine learning.&lt;br /&gt;El propósito del trabajo es conseguir un modelo capaz de resolver la tarea mencionada de manera &lt;br /&gt;eficaz. Para llegar a ese modelo primero hay que entender unos fundamentos teóricos y el problema que &lt;br /&gt;hemos de resolver.&lt;br /&gt;En el primer capítulo del trabajo se hace una aproximación al mundo de la Inteligencia Artificial, más &lt;br /&gt;concretamente al aprendizaje automático. Diferenciando entre aprendizaje supervisado y no supervisado, &lt;br /&gt;se explican algoritmos como la regresión lineal, el gradiente descendiente o la detección de anomalías. A &lt;br /&gt;continuación se desarrolla en detalle la definición y conceptos básicos de una red neuronal. Finalmente &lt;br /&gt;se hace breve inciso en los modelos habitualmente usados en el NLP, es decir, en el procesamiento del &lt;br /&gt;lenguaje natural.&lt;br /&gt;En el segundo capítulo se introduce el problema de identificación de entidades en documentos. Pri- &lt;br /&gt;mero se explican sus bases y se comentan dificultades que nos van a surgir al resolverlo. Seguidamente se &lt;br /&gt;analizan métodos tradicionales para resolverlo, cómo son los métodos lingüísticos, los métodos basados &lt;br /&gt;en diccionarios y los métodos basados en aprendizaje automático. Por último, y de manera extendida, &lt;br /&gt;se explica cómo se puede resolver el problema usando redes neuronales convolucionales y la novedosa &lt;br /&gt;arquitectura conocida como Transformers.&lt;br /&gt;En el tercer capítulo comienza la parte realmente práctica del trabajo. En primer lugar se explica &lt;br /&gt;la forma elegida de resolver el problema: vamos a hacer un fine-tuning de un modelo de la biblioteca &lt;br /&gt;Transformers 1 de Hugging Face 2. El modelo elegido es LayoutLMv2. En la primera sección se explica &lt;br /&gt;en detalle y se compara con su predecesor. En la siguiente sección se hace una explicación exhaustiva de &lt;br /&gt;DocLayNet, el conjunto de datos elegido para hacer el fine-tuning, y cómo lo hemos preprocesado.&lt;br /&gt;Finalmente, en el cuarto y último capítulo se explica cómo se ha realizado el entrenamiento del &lt;br /&gt;modelo LayoutLMv2 con el dataset DocLayNet, a continuación se analizan los resultados obtenidos. &lt;br /&gt;Para acabar se comentan brevemente posibles mejoras a realizar sobre nuestro modelo en un futuro.&lt;br /&gt;&lt;br /&gt;</abstract>
  </front>
  <article-type>TAZ</article-type>
</article>

</articles>