<?xml version="1.0" encoding="UTF-8"?>
<collection>
<dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
  <dc:language>spa</dc:language>
  <dc:creator>Almingol Docando, Javier</dc:creator>
  <dc:creator>Montesano del Campo, Luis</dc:creator>
  <dc:title>Agrupamiento no paramétrico en espacios latentes con selección automática de características relevantes</dc:title>
  <dc:subject>algoritmo</dc:subject>
  <dc:subject>clusterización</dc:subject>
  <dc:subject>procesos de dirichlet</dc:subject>
  <dc:subject>lasso bayesiano</dc:subject>
  <dc:subject>clusterización de trayectorias</dc:subject>
  <dc:subject>algoritmo bayesiano no paramétrico</dc:subject>
  <dc:description>En los últimos años ha aumentado la disponibilidad de cantidades masivas de datos sin etiquetar de diversa naturaleza. Un ejemplo de este tipo de datos son, por ejemplo, trayectorias de personas en centros comerciales o ciudades obtenidas a partir de datos de GPS, cámaras de vigilancia, localización GSM, etc. El análisis de este tipo de datos tiene diversas aplicaciones en detección de comportamientos, programación de robots por demostración, detección de anomalías entre otras, para ello es necesario etiquetar o clasificar las trayectorias en diferentes grupos. El etiquetado presenta dos dificultades principales, en primer lugar las trayectorias pueden estar muy mezcladas en el espacio de medida a pesar de existir una representación latente (oculta) donde pueden ser separadas de una forma más sencilla, en segundo lugar el número de clases puede ser desconocido y necesita ser obtenido a partir de los datos. En este Proyecto Fin de Carrera derivamos un algoritmo basado en Procesos de Dirichlet que nos permite clasificar elementos en distintas clases en función de los parámetros latentes que caracterizan a cada una de ellas, además de determinar el número de clases existentes en el conjunto de datos de forma automática. La estimación de parámetros la realizaremos a partir de una regresión Bayesiana penalizada basada en la norma L1 denominada Lasso Bayesiano que nos permitirá realizar de facto una selección de características relevantes. Plantearemos el modelo jerárquico del algoritmo conjunto así como resolveremos sus implicaciones matemáticas. Finalmente, codificaremos el algoritmo en Matlab y lo validaremos con cuatro conjuntos de datos: datos generados aleatoriamente, trayectorias 2D, trayectorias de robot 6D y trayectorias reales de movimiento humano.</dc:description>
  <dc:date>2012-11-20T10:29:53Z</dc:date>
  <dc:identifier>http://zaguan.unizar.es/record/9729</dc:identifier>
  <dc:rights>info:eu-repo/semantics/closedAccess</dc:rights>
  <dc:rights>Fulltext access not authorized</dc:rights>
  <dc:type>info:eu-repo/semantics/bachelorThesis</dc:type>
  <dc:type>info:eu-repo/semantics/publishedVersion</dc:type>
  <dc:coverage>Zaragoza</dc:coverage>
  <dc:audience>Researchers</dc:audience>
  <dc:audience>Students</dc:audience>
  <dc:audience>Librarians</dc:audience>
</dc:dc>

</collection>
