Repositorio Zaguan - Universidad de Zaragoza 

Related links

TAZ-PFC-2012-720

Agrupamiento no paramétrico en espacios latentes con selección automática de características relevantes

Almingol Docando, Javier
Montesano del Campo, Luis (dir.)

Universidad de Zaragoza, Escuela de Ingeniería y Arquitectura, 2012
Departamento de Informática e Ingeniería de Sistemas, Área de Lenguajes y Sistemas Informáticos

Ingeniero de Telecomunicación

Resumen: En los últimos años ha aumentado la disponibilidad de cantidades masivas de datos sin etiquetar de diversa naturaleza. Un ejemplo de este tipo de datos son, por ejemplo, trayectorias de personas en centros comerciales o ciudades obtenidas a partir de datos de GPS, cámaras de vigilancia, localización GSM, etc. El análisis de este tipo de datos tiene diversas aplicaciones en detección de comportamientos, programación de robots por demostración, detección de anomalías entre otras, para ello es necesario etiquetar o clasificar las trayectorias en diferentes grupos. El etiquetado presenta dos dificultades principales, en primer lugar las trayectorias pueden estar muy mezcladas en el espacio de medida a pesar de existir una representación latente (oculta) donde pueden ser separadas de una forma más sencilla, en segundo lugar el número de clases puede ser desconocido y necesita ser obtenido a partir de los datos. En este Proyecto Fin de Carrera derivamos un algoritmo basado en Procesos de Dirichlet que nos permite clasificar elementos en distintas clases en función de los parámetros latentes que caracterizan a cada una de ellas, además de determinar el número de clases existentes en el conjunto de datos de forma automática. La estimación de parámetros la realizaremos a partir de una regresión Bayesiana penalizada basada en la norma L1 denominada Lasso Bayesiano que nos permitirá realizar de facto una selección de características relevantes. Plantearemos el modelo jerárquico del algoritmo conjunto así como resolveremos sus implicaciones matemáticas. Finalmente, codificaremos el algoritmo en Matlab y lo validaremos con cuatro conjuntos de datos: datos generados aleatoriamente, trayectorias 2D, trayectorias de robot 6D y trayectorias reales de movimiento humano.


Palabra(s) clave (del autor): algoritmo ; clusterización ; procesos de dirichlet ; lasso bayesiano ; clusterización de trayectorias ; algoritmo bayesiano no paramétrico
Tipo de Trabajo Académico: Proyecto Fin de Carrera

El autor NO autoriza la consulta a texto completo


 

 Registro creado el 2012-11-20, última modificación el 2013-02-12


Valore este documento:

Rate this document:
1
2
3
 
(Sin revisiones)
  

Videotutorial depósito Trabajos Académicos