000077772 001__ 77772
000077772 005__ 20190226114808.0
000077772 037__ $$aTAZ-TFG-2018-2390
000077772 041__ $$aspa
000077772 1001_ $$aLascorz Lozano, Lorién
000077772 24200 $$aReinforcement Learning. Basic elements and main algorithms
000077772 24500 $$aAprendizaje por Refuerzo. Elementos básicos y algoritmos
000077772 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2018
000077772 500__ $$aAporta en secretaría material físico.  Resumen disponible también en inglés
000077772 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000077772 520__ $$aEl aprendizaje por refuerzo es un área del estudio informático y matemático que engloba sistemas y algoritmos de aprendizaje sobre ordenadores. En particular, esta teoría es capaz de resolver los problemas deseados sin la necesidad del conocimiento estricto y completo de todos los parámetros del problema. Esta característica es muy conveniente ya que en muchos de los problemas reales, se desconocen estos parámetros o no se controlan con exactitud. Estos sistemas de aprendizaje proporcionan al ordenador la capacidad de aprender de los datos y no sólo de ejecutar unas funciones para las que están programadas.
000077772 521__ $$aGraduado en Matemáticas
000077772 540__ $$aDerechos regulados por licencia Creative Commons
000077772 700__ $$aAlcalá Nalvaiz, José Tomás$$edir.
000077772 7102_ $$aUniversidad de Zaragoza$$bMétodos Estadísticos$$cEstadística e Investigación Operativa
000077772 8560_ $$f621170@celes.unizar.es
000077772 8564_ $$s556715$$uhttps://zaguan.unizar.es/record/77772/files/TAZ-TFG-2018-2390.pdf$$yMemoria (spa)
000077772 909CO $$ooai:zaguan.unizar.es:77772$$pdriver$$ptrabajos-fin-grado
000077772 950__ $$a
000077772 951__ $$adeposita:2019-02-26
000077772 980__ $$aTAZ$$bTFG$$cCIEN
000077772 999__ $$a20180628104553.CREATION_DATE