Resumen: En el presente trabajo se estudian diversas técnicas de aprendizaje por refuerzo con la idea de solucionar varios problemas de fijación y planificación de precios. Para ello, se lleva a cabo una introducción al aprendizaje por refuerzo, estudiando los problemas de decisión de Markov en el caso de un único agente. En estos juegan un papel fundamental las ecuaciones de optimalidad de Bellman, que permiten el desarrollo de métodos para la resolución del problema. En el trabajo se verán los algoritmos Q-Learning, SARSA y dos de sus variantes. En el caso de varios agentes se estudian los juegos matriciales y su generalización a varios estados, los juegos estocásticos. En estos problemas, y bajo el soporte de la teoría de juegos, aparecen los equilibrios de Nash. Veremos dos de las principales técnicas para resolver estos problemas, los métodos de mejor respuesta y los métodos de los equilibrios. Finalmente se analizarán los resultados obtenidos tras aplicar los algoritmos estudiados a problemas de fijación de precios.