Repositorio Zaguan - Universidad de Zaragoza 

Related links

TAZ-PFC-2012-720

Agrupamiento no paramétrico en espacios latentes con selección automática de características relevantes

Almingol Docando, Javier
Montesano del Campo, Luis (dir.)

Universidad de Zaragoza, Escuela de Ingeniería y Arquitectura, 2012
Informática e Ingeniería de Sistemas department, Lenguajes y Sistemas Informáticos area

Ingeniero de Telecomunicación

Abstract: En los últimos años ha aumentado la disponibilidad de cantidades masivas de datos sin etiquetar de diversa naturaleza. Un ejemplo de este tipo de datos son, por ejemplo, trayectorias de personas en centros comerciales o ciudades obtenidas a partir de datos de GPS, cámaras de vigilancia, localización GSM, etc. El análisis de este tipo de datos tiene diversas aplicaciones en detección de comportamientos, programación de robots por demostración, detección de anomalías entre otras, para ello es necesario etiquetar o clasificar las trayectorias en diferentes grupos. El etiquetado presenta dos dificultades principales, en primer lugar las trayectorias pueden estar muy mezcladas en el espacio de medida a pesar de existir una representación latente (oculta) donde pueden ser separadas de una forma más sencilla, en segundo lugar el número de clases puede ser desconocido y necesita ser obtenido a partir de los datos. En este Proyecto Fin de Carrera derivamos un algoritmo basado en Procesos de Dirichlet que nos permite clasificar elementos en distintas clases en función de los parámetros latentes que caracterizan a cada una de ellas, además de determinar el número de clases existentes en el conjunto de datos de forma automática. La estimación de parámetros la realizaremos a partir de una regresión Bayesiana penalizada basada en la norma L1 denominada Lasso Bayesiano que nos permitirá realizar de facto una selección de características relevantes. Plantearemos el modelo jerárquico del algoritmo conjunto así como resolveremos sus implicaciones matemáticas. Finalmente, codificaremos el algoritmo en Matlab y lo validaremos con cuatro conjuntos de datos: datos generados aleatoriamente, trayectorias 2D, trayectorias de robot 6D y trayectorias reales de movimiento humano.


Free keyword(s): algoritmo ; clusterización ; procesos de dirichlet ; lasso bayesiano ; clusterización de trayectorias ; algoritmo bayesiano no paramétrico
Tipo de Trabajo Académico: Proyecto Fin de Carrera

Fulltext view has been restricted by the author


 

 Record created 2012-11-20, last modified 2013-02-12


Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)
  

Videotutorial depósito Trabajos Académicos