TAZ-TFM-2019-1470


Técnicas de aprendizaje estadístico en modelos de valoración dinámica de precios

Sánchez Latorre, Roberto
Alcalá Nalvaiz, José Tomás (dir.) ; Soto Juárez, Juan Manuel (dir.)

Universidad de Zaragoza, CIEN, 2019
Métodos Estadísticos department, Estadística e Investigación Operativa area

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación

Abstract: En el presente trabajo se estudian diversas técnicas de aprendizaje por refuerzo con la idea de solucionar varios problemas de fijación y planificación de precios. Para ello, se lleva a cabo una introducción al aprendizaje por refuerzo, estudiando los problemas de decisión de Markov en el caso de un único agente. En estos juegan un papel fundamental las ecuaciones de optimalidad de Bellman, que permiten el desarrollo de métodos para la resolución del problema. En el trabajo se verán los algoritmos Q-Learning, SARSA y dos de sus variantes. En el caso de varios agentes se estudian los juegos matriciales y su generalización a varios estados, los juegos estocásticos. En estos problemas, y bajo el soporte de la teoría de juegos, aparecen los equilibrios de Nash. Veremos dos de las principales técnicas para resolver estos problemas, los métodos de mejor respuesta y los métodos de los equilibrios. Finalmente se analizarán los resultados obtenidos tras aplicar los algoritmos estudiados a problemas de fijación de precios.


Tipo de Trabajo Académico: Trabajo Fin de Master

Creative Commons License



El registro pertenece a las siguientes colecciones:
Academic Works > Trabajos Académicos por Centro > facultad-de-ciencias
Academic Works > End-of-master works



Back to search

Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)