<?xml version="1.0" encoding="UTF-8"?>
<collection xmlns="http://www.loc.gov/MARC21/slim">
<record>
  <controlfield tag="001">129300</controlfield>
  <controlfield tag="005">20231213131054.0</controlfield>
  <datafield tag="037" ind1=" " ind2=" ">
    <subfield code="a">TAZ-PFC-2022-010</subfield>
  </datafield>
  <datafield tag="041" ind1=" " ind2=" ">
    <subfield code="a">spa</subfield>
  </datafield>
  <datafield tag="100" ind1="1" ind2=" ">
    <subfield code="a">Pérez Blasco, Alberto</subfield>
  </datafield>
  <datafield tag="242" ind1="0" ind2="0">
    <subfield code="a">Clustering based on semantic similarity, generated by language models.</subfield>
  </datafield>
  <datafield tag="245" ind1="0" ind2="0">
    <subfield code="a">Representación mediante clusters de similaridad semántica, generada con modelos de lenguaje.</subfield>
  </datafield>
  <datafield tag="260" ind1=" " ind2=" ">
    <subfield code="a">Zaragoza</subfield>
    <subfield code="b">Universidad de Zaragoza</subfield>
    <subfield code="c">2022</subfield>
  </datafield>
  <datafield tag="500" ind1=" " ind2=" ">
    <subfield code="a">Resumen disponible también en inglés. Con la colaboración de la empresa NTT Data</subfield>
  </datafield>
  <datafield tag="506" ind1=" " ind2=" ">
    <subfield code="a">by-nc-sa</subfield>
    <subfield code="b">Creative Commons</subfield>
    <subfield code="c">3.0</subfield>
    <subfield code="u">http://creativecommons.org/licenses/by-nc-sa/3.0/</subfield>
  </datafield>
  <datafield tag="520" ind1=" " ind2=" ">
    <subfield code="a">Este Trabajo de Fin de Grado (TFG), trata de obtener documentos de una fuente de internet,&lt;br />para posteriormente clasificarlos en clústeres dependiendo de su similaridad semántica y represen-&lt;br />tarlos, de tal modo que se pueda analizar su parecido. Para ello, se utilizarán modelos de lenguaje&lt;br />que tratarán de entender el contexto del documento, generando los embeddings asociados.&lt;br />Como documentos de entrada, se utilizarán papers de caracter cientı́fico-técnicos y para la salida, se&lt;br />deberán visualizar los distintos clústeres, ya que es la mejor forma de hacer referencia al conjunto&lt;br />de documentos de entrada, debido a que de otra forma, es difı́cil visualizar la relación entre los&lt;br />documentos descargados (aprox. 800). Finalmente, se obtendrá un “topic” que sirva para describir&lt;br />cada clúster.&lt;br />Al ser un TFG orientado a la investigación, el desarrollo del mismo tuvo varias fases, siendo éstas&lt;br />la de formación en conocimientos básicos relacionados con las tecnologı́as, la de investigación de&lt;br />las opciones que existı́an en cada apartado y finalmente la de implementación, fase en la que se&lt;br />desarrolló el proyecto con tecnologı́as como KNIME, Jupyter Notebook, Python, Conda...&lt;br />&lt;br /></subfield>
  </datafield>
  <datafield tag="521" ind1=" " ind2=" ">
    <subfield code="a">Graduado en Ingeniería Informática</subfield>
  </datafield>
  <datafield tag="540" ind1=" " ind2=" ">
    <subfield code="a">Derechos regulados por licencia Creative Commons</subfield>
  </datafield>
  <datafield tag="700" ind1=" " ind2=" ">
    <subfield code="a">Garrido Picazo, Piedad</subfield>
    <subfield code="e">dir.</subfield>
  </datafield>
  <datafield tag="710" ind1="2" ind2=" ">
    <subfield code="a">Universidad de Zaragoza</subfield>
    <subfield code="b">Informática e Ingeniería de Sistemas</subfield>
    <subfield code="c">Lenguajes y Sistemas Informáticos</subfield>
  </datafield>
  <datafield tag="856" ind1="0" ind2=" ">
    <subfield code="f">779212@unizar.es</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2=" ">
    <subfield code="s">3497932</subfield>
    <subfield code="u">http://zaguan.unizar.es/record/129300/files/TAZ-PFC-2022-010.pdf</subfield>
    <subfield code="y">Memoria (spa)</subfield>
  </datafield>
  <datafield tag="909" ind1="C" ind2="O">
    <subfield code="o">oai:zaguan.unizar.es:129300</subfield>
    <subfield code="p">proyectos-fin-carrera</subfield>
    <subfield code="p">driver</subfield>
  </datafield>
  <datafield tag="950" ind1=" " ind2=" ">
    <subfield code="a"></subfield>
  </datafield>
  <datafield tag="980" ind1=" " ind2=" ">
    <subfield code="a">TAZ</subfield>
    <subfield code="b">PFC</subfield>
    <subfield code="c">POLTER</subfield>
  </datafield>
  <datafield tag="999" ind1=" " ind2=" ">
    <subfield code="a">20220619182611.CREATION_DATE</subfield>
  </datafield>
  <datafield tag="951" ind1=" " ind2=" ">
    <subfield code="a">deposita:2023-12-13</subfield>
  </datafield>
</record>
</collection>