000129300 001__ 129300
000129300 005__ 20231213131054.0
000129300 037__ $$aTAZ-PFC-2022-010
000129300 041__ $$aspa
000129300 1001_ $$aPérez Blasco, Alberto
000129300 24200 $$aClustering based on semantic similarity, generated by language models.
000129300 24500 $$aRepresentación mediante clusters de similaridad semántica, generada con modelos de lenguaje.
000129300 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2022
000129300 500__ $$aResumen disponible también en inglés. Con la colaboración de la empresa NTT Data
000129300 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000129300 520__ $$aEste Trabajo de Fin de Grado (TFG), trata de obtener documentos de una fuente de internet,<br />para posteriormente clasificarlos en clústeres dependiendo de su similaridad semántica y represen-<br />tarlos, de tal modo que se pueda analizar su parecido. Para ello, se utilizarán modelos de lenguaje<br />que tratarán de entender el contexto del documento, generando los embeddings asociados.<br />Como documentos de entrada, se utilizarán papers de caracter cientı́fico-técnicos y para la salida, se<br />deberán visualizar los distintos clústeres, ya que es la mejor forma de hacer referencia al conjunto<br />de documentos de entrada, debido a que de otra forma, es difı́cil visualizar la relación entre los<br />documentos descargados (aprox. 800). Finalmente, se obtendrá un “topic” que sirva para describir<br />cada clúster.<br />Al ser un TFG orientado a la investigación, el desarrollo del mismo tuvo varias fases, siendo éstas<br />la de formación en conocimientos básicos relacionados con las tecnologı́as, la de investigación de<br />las opciones que existı́an en cada apartado y finalmente la de implementación, fase en la que se<br />desarrolló el proyecto con tecnologı́as como KNIME, Jupyter Notebook, Python, Conda...<br /><br />
000129300 521__ $$aGraduado en Ingeniería Informática
000129300 540__ $$aDerechos regulados por licencia Creative Commons
000129300 700__ $$aGarrido Picazo, Piedad$$edir.
000129300 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000129300 8560_ $$f779212@unizar.es
000129300 8564_ $$s3497932$$uhttps://zaguan.unizar.es/record/129300/files/TAZ-PFC-2022-010.pdf$$yMemoria (spa)
000129300 909CO $$ooai:zaguan.unizar.es:129300$$pproyectos-fin-carrera$$pdriver
000129300 950__ $$a
000129300 951__ $$adeposita:2023-12-13
000129300 980__ $$aTAZ$$bPFC$$cPOLTER
000129300 999__ $$a20220619182611.CREATION_DATE