<?xml version="1.0" encoding="UTF-8"?>
<articles>
<article xmlns:xlink="http://www.w3.org/1999/xlink/">
  <front>
    <article-meta>
      <title-group>
        <article-title/>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name>
            <surname>Garrido Picazo</surname>
            <given-names>Piedad</given-names>
          </name>
        </contrib>
      </contrib-group>
      <pub-date pub-type="pub">
        <year>2022</year>
      </pub-date>
      <self-uri xlink:href="http://zaguan.unizar.es/record/129300"/>
      <self-uri xlink:href="http://zaguan.unizar.es/record/129300/files/TAZ-PFC-2022-010.pdf"/>
    </article-meta>
    <abstract>Este Trabajo de Fin de Grado (TFG), trata de obtener documentos de una fuente de internet,&lt;br /&gt;para posteriormente clasificarlos en clústeres dependiendo de su similaridad semántica y represen-&lt;br /&gt;tarlos, de tal modo que se pueda analizar su parecido. Para ello, se utilizarán modelos de lenguaje&lt;br /&gt;que tratarán de entender el contexto del documento, generando los embeddings asociados.&lt;br /&gt;Como documentos de entrada, se utilizarán papers de caracter cientı́fico-técnicos y para la salida, se&lt;br /&gt;deberán visualizar los distintos clústeres, ya que es la mejor forma de hacer referencia al conjunto&lt;br /&gt;de documentos de entrada, debido a que de otra forma, es difı́cil visualizar la relación entre los&lt;br /&gt;documentos descargados (aprox. 800). Finalmente, se obtendrá un “topic” que sirva para describir&lt;br /&gt;cada clúster.&lt;br /&gt;Al ser un TFG orientado a la investigación, el desarrollo del mismo tuvo varias fases, siendo éstas&lt;br /&gt;la de formación en conocimientos básicos relacionados con las tecnologı́as, la de investigación de&lt;br /&gt;las opciones que existı́an en cada apartado y finalmente la de implementación, fase en la que se&lt;br /&gt;desarrolló el proyecto con tecnologı́as como KNIME, Jupyter Notebook, Python, Conda...&lt;br /&gt;&lt;br /&gt;</abstract>
  </front>
  <article-type>TAZ</article-type>
</article>

</articles>