<?xml version="1.0" encoding="UTF-8"?>
<references>
<reference>
  <a1>Lascorz Lozano, Lorién</a1>
  <a2>Alcalá Nalvaiz, José Tomás</a2>
  <t1>Aprendizaje por Refuerzo. Elementos básicos y algoritmos</t1>
  <t2/>
  <sn/>
  <op/>
  <vo/>
  <ab>El aprendizaje por refuerzo es un área del estudio informático y matemático que engloba sistemas y algoritmos de aprendizaje sobre ordenadores. En particular, esta teoría es capaz de resolver los problemas deseados sin la necesidad del conocimiento estricto y completo de todos los parámetros del problema. Esta característica es muy conveniente ya que en muchos de los problemas reales, se desconocen estos parámetros o no se controlan con exactitud. Estos sistemas de aprendizaje proporcionan al ordenador la capacidad de aprender de los datos y no sólo de ejecutar unas funciones para las que están programadas.</ab>
  <la>spa</la>
  <k1/>
  <pb>Universidad de Zaragoza</pb>
  <pp>Zaragoza</pp>
  <yr>2018</yr>
  <ed/>
  <ul>http://zaguan.unizar.es/record/77772/files/TAZ-TFG-2018-2390.pdf;
	</ul>
  <no>Imported from Invenio.</no>
</reference>

</references>