TAZ-TFM-2019-1470


Técnicas de aprendizaje estadístico en modelos de valoración dinámica de precios

Sánchez Latorre, Roberto
Alcalá Nalvaiz, José Tomás (dir.) ; Soto Juárez, Juan Manuel (dir.)

Universidad de Zaragoza, CIEN, 2019
Departamento de Métodos Estadísticos, Área de Estadística e Investigación Operativa

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación

Resumen: En el presente trabajo se estudian diversas técnicas de aprendizaje por refuerzo con la idea de solucionar varios problemas de fijación y planificación de precios. Para ello, se lleva a cabo una introducción al aprendizaje por refuerzo, estudiando los problemas de decisión de Markov en el caso de un único agente. En estos juegan un papel fundamental las ecuaciones de optimalidad de Bellman, que permiten el desarrollo de métodos para la resolución del problema. En el trabajo se verán los algoritmos Q-Learning, SARSA y dos de sus variantes. En el caso de varios agentes se estudian los juegos matriciales y su generalización a varios estados, los juegos estocásticos. En estos problemas, y bajo el soporte de la teoría de juegos, aparecen los equilibrios de Nash. Veremos dos de las principales técnicas para resolver estos problemas, los métodos de mejor respuesta y los métodos de los equilibrios. Finalmente se analizarán los resultados obtenidos tras aplicar los algoritmos estudiados a problemas de fijación de precios.


Tipo de Trabajo Académico: Trabajo Fin de Master

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Facultad de Ciencias
Trabajos académicos > Trabajos fin de máster



Volver a la búsqueda

Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)