Abstract: El objetivo de este Trabajo Final de Grado (TFG) es conseguir generar un modelo para un vehículo autónomo que sea capaz de completar un circuito de la manera más correcta y eficaz posible. Esto se ha logrado utilizando algoritmos de Aprendizaje por Refuerzo (RL) que provee la librería Stable Baselines3 para Python así como Gymnasium para crear un entorno válido a utilizar por el algoritmo de RL y otras que aportan utilidad para cálculos como pueden ser Numpy u OpenCv. Así se ha abordado el problema mediante la elaboración de diversos entrenamientos modificando la función de recompensa del algoritmo de RL y probando los resultados obtenidos contrastándolos con las métricas que nos aporta Stable Baselines3 interpretables mediante TensorBoard. Cabe destacar que toda la plataforma desarrollada en el proyecto ha sido implementada íntegramente por el autor, tomando como base referencias y fragmentos de código disponibles públicamente en distintas fuentes online, los cuales han sido adaptados y extendidos para cumplir con los objetivos específicos del trabajo.