<?xml version="1.0" encoding="UTF-8"?>
<xml>
<records>
<record>
  <contributors>
    <authors>
      <author>Pérez Blasco, Alberto</author>
      <author>Garrido Picazo, Piedad</author>
    </authors>
  </contributors>
  <titles>
    <title>Representación mediante clusters de similaridad semántica, generada con modelos de lenguaje.</title>
    <secondary-title/>
  </titles>
  <doi/>
  <pages/>
  <volume/>
  <number/>
  <dates>
    <year>2022</year>
    <pub-dates>
      <date>2022</date>
    </pub-dates>
  </dates>
  <abstract>Este Trabajo de Fin de Grado (TFG), trata de obtener documentos de una fuente de internet,&lt;br /&gt;para posteriormente clasificarlos en clústeres dependiendo de su similaridad semántica y represen-&lt;br /&gt;tarlos, de tal modo que se pueda analizar su parecido. Para ello, se utilizarán modelos de lenguaje&lt;br /&gt;que tratarán de entender el contexto del documento, generando los embeddings asociados.&lt;br /&gt;Como documentos de entrada, se utilizarán papers de caracter cientı́fico-técnicos y para la salida, se&lt;br /&gt;deberán visualizar los distintos clústeres, ya que es la mejor forma de hacer referencia al conjunto&lt;br /&gt;de documentos de entrada, debido a que de otra forma, es difı́cil visualizar la relación entre los&lt;br /&gt;documentos descargados (aprox. 800). Finalmente, se obtendrá un “topic” que sirva para describir&lt;br /&gt;cada clúster.&lt;br /&gt;Al ser un TFG orientado a la investigación, el desarrollo del mismo tuvo varias fases, siendo éstas&lt;br /&gt;la de formación en conocimientos básicos relacionados con las tecnologı́as, la de investigación de&lt;br /&gt;las opciones que existı́an en cada apartado y finalmente la de implementación, fase en la que se&lt;br /&gt;desarrolló el proyecto con tecnologı́as como KNIME, Jupyter Notebook, Python, Conda...&lt;br /&gt;&lt;br /&gt;</abstract>
</record>

</records>
</xml>