000149256 001__ 149256
000149256 005__ 20250127135741.0
000149256 037__ $$aTAZ-TFG-2024-4754
000149256 041__ $$aspa
000149256 1001_ $$aMurcia Martínez, Diego
000149256 24200 $$aAutomatic classification of software requirements: Creation of the dataset and training of language models
000149256 24500 $$aClasificación automática de requisitos de software: Creación del conjunto de datos y entrenamiento de modelos de lenguaje
000149256 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2024
000149256 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000149256 520__ $$aEste trabajo fin de grado aborda el problema de clasificar, de manera automática, los requisitos de los sistemas software. Este es un paso previo, que debemos solucionar, antes de automatizar muchas otras tareas del proceso de desarrollo del software. Entre ellas, por ejemplo, la de generar de manera automática dichos requisitos partiendo de estándares, manuales y/o procedimientos consolidados. No cabe duda que, en el contexto actual, la inteligencia artificial debe jugar un papel fundamental en estos procesos de automatización. Concretamente, las técnicas de procesamiento del lenguaje natural, apoyadas en los modelos de lenguaje, son el pilar que soportará dicha automatización. Esta memoria documenta cada una de las fases que se han llevado a cabo para medir la efectividad de diversos modelos de lenguaje a la hora de clasificar requisitos de software en funcionales y no funcionales. Estas fases incluyen desde la generación de un conjunto de datos, válido para el entrenamiento, validación y test de los modelos, hasta la estimación de valores estadísticos que midan el desempeño del dataset y de los propios modelos. El dataset trata de replicar los múltiples y diferentes contextos que aparecen en el mundo del desarrollo de software. Por ejemplo, los requisitos funcionales superan habitualmente en número a los no funcionales, de manera amplia. Esta característica diferencia a nuestro proyecto, ya que desde nuestro conocimiento, el dataset desarrollado es el más extenso, y realista, de los hasta ahora propuestos por la comunidad. La experimentación se ha diseñado de forma que pueda ser replicada por otros investigadores. Pudiendo además recabarse información del comportamiento de los distintos modelos en diversas situaciones. También se rehacen experimentos ya existentes en la literatura, posibilitando así la comparación con otros trabajos. El dataset, el código y los resultados relativos a la realización de este proyecto pueden encontrarse en el repositorio de GitHub "DaReC".<br />
000149256 521__ $$aGraduado en Ingeniería de Tecnologías y Servicios de Telecomunicación
000149256 540__ $$aDerechos regulados por licencia Creative Commons
000149256 691__ $$a9
000149256 692__ $$aLos avances en inteligencia artificial actualmente están suponiendo una revolución tecnológica sin precedentes en cualquier industria. En el ámbito de la ingeniería de software, la generación de un nuevo conjunto de datos para el entrenamiento de modelos de lenguaje y un entorno de pruebas para medir su efectividad, constituyen dos contribuciones a la comunidad que pueden resultar de utilidad para la innovación y el desarrollo de la IA en un futuro.
000149256 700__ $$aMerseguer Hernaiz, José Javier$$edir.
000149256 700__ $$aBernad Lusilla, Jorge Raul$$edir.
000149256 7102_ $$aUniversidad de Zaragoza$$bInformática e Ingeniería de Sistemas$$cLenguajes y Sistemas Informáticos
000149256 8560_ $$f775048@unizar.es
000149256 8564_ $$s618344$$uhttps://zaguan.unizar.es/record/149256/files/TAZ-TFG-2024-4754.pdf$$yMemoria (spa)
000149256 909CO $$ooai:zaguan.unizar.es:149256$$pdriver$$ptrabajos-fin-grado
000149256 950__ $$a
000149256 951__ $$adeposita:2025-01-27
000149256 980__ $$aTAZ$$bTFG$$cEINA
000149256 999__ $$a20241128214215.CREATION_DATE