000077772 001__ 77772 000077772 005__ 20190226114808.0 000077772 037__ $$aTAZ-TFG-2018-2390 000077772 041__ $$aspa 000077772 1001_ $$aLascorz Lozano, Lorién 000077772 24200 $$aReinforcement Learning. Basic elements and main algorithms 000077772 24500 $$aAprendizaje por Refuerzo. Elementos básicos y algoritmos 000077772 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2018 000077772 500__ $$aAporta en secretaría material físico. Resumen disponible también en inglés 000077772 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/ 000077772 520__ $$aEl aprendizaje por refuerzo es un área del estudio informático y matemático que engloba sistemas y algoritmos de aprendizaje sobre ordenadores. En particular, esta teoría es capaz de resolver los problemas deseados sin la necesidad del conocimiento estricto y completo de todos los parámetros del problema. Esta característica es muy conveniente ya que en muchos de los problemas reales, se desconocen estos parámetros o no se controlan con exactitud. Estos sistemas de aprendizaje proporcionan al ordenador la capacidad de aprender de los datos y no sólo de ejecutar unas funciones para las que están programadas. 000077772 521__ $$aGraduado en Matemáticas 000077772 540__ $$aDerechos regulados por licencia Creative Commons 000077772 700__ $$aAlcalá Nalvaiz, José Tomás$$edir. 000077772 7102_ $$aUniversidad de Zaragoza$$bMétodos Estadísticos$$cEstadística e Investigación Operativa 000077772 8560_ $$f621170@celes.unizar.es 000077772 8564_ $$s556715$$uhttps://zaguan.unizar.es/record/77772/files/TAZ-TFG-2018-2390.pdf$$yMemoria (spa) 000077772 909CO $$ooai:zaguan.unizar.es:77772$$pdriver$$ptrabajos-fin-grado 000077772 950__ $$a 000077772 951__ $$adeposita:2019-02-26 000077772 980__ $$aTAZ$$bTFG$$cCIEN 000077772 999__ $$a20180628104553.CREATION_DATE