<?xml version="1.0" encoding="UTF-8"?>
<collection>
<dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:invenio="http://invenio-software.org/elements/1.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd"><dc:language>spa</dc:language><dc:creator>Lascorz Lozano, Lorién</dc:creator><dc:creator>Alcalá Nalvaiz, José Tomás</dc:creator><dc:title>Aprendizaje por Refuerzo. Elementos básicos y algoritmos</dc:title><dc:identifier>TAZ-TFG-2018-2390</dc:identifier><dc:description>El aprendizaje por refuerzo es un área del estudio informático y matemático que engloba sistemas y algoritmos de aprendizaje sobre ordenadores. En particular, esta teoría es capaz de resolver los problemas deseados sin la necesidad del conocimiento estricto y completo de todos los parámetros del problema. Esta característica es muy conveniente ya que en muchos de los problemas reales, se desconocen estos parámetros o no se controlan con exactitud. Estos sistemas de aprendizaje proporcionan al ordenador la capacidad de aprender de los datos y no sólo de ejecutar unas funciones para las que están programadas.</dc:description><dc:publisher>Universidad de Zaragoza</dc:publisher><dc:date>2018</dc:date><dc:source>http://zaguan.unizar.es/record/77772</dc:source><dc:identifier>http://zaguan.unizar.es/record/77772</dc:identifier><dc:identifier>oai:zaguan.unizar.es:77772</dc:identifier></dc:dc>

</collection>