<?xml version="1.0" encoding="UTF-8"?>
<articles>
<article xmlns:xlink="http://www.w3.org/1999/xlink/">
  <front>
    <article-meta>
      <title-group>
        <article-title/>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name>
            <surname>Alcalá Nalvaiz</surname>
            <given-names>José Tomás</given-names>
          </name>
        </contrib>
      </contrib-group>
      <pub-date pub-type="pub">
        <year>2018</year>
      </pub-date>
      <self-uri xlink:href="http://zaguan.unizar.es/record/77772"/>
      <self-uri xlink:href="http://zaguan.unizar.es/record/77772/files/TAZ-TFG-2018-2390.pdf"/>
    </article-meta>
    <abstract>El aprendizaje por refuerzo es un área del estudio informático y matemático que engloba sistemas y algoritmos de aprendizaje sobre ordenadores. En particular, esta teoría es capaz de resolver los problemas deseados sin la necesidad del conocimiento estricto y completo de todos los parámetros del problema. Esta característica es muy conveniente ya que en muchos de los problemas reales, se desconocen estos parámetros o no se controlan con exactitud. Estos sistemas de aprendizaje proporcionan al ordenador la capacidad de aprender de los datos y no sólo de ejecutar unas funciones para las que están programadas.</abstract>
  </front>
  <article-type>TAZ</article-type>
</article>

</articles>