Resumen: El objetivo es desarrollar un sistema basado en aprendizaje automático para clasificar funciones extraídas de binarios de Linux (formato ELF), con el fin de identificar similitudes entre ellas, incluso cuando provienen de arquitecturas distintas o han sido compiladas con diferentes opciones. Para ello, se emplearán modelos de representación y análisis estructural del código binario que permitan entrenar {\em autoencoders} multicapa capaces de generar {\em embeddings} representativos de cada función. El trabajo aborda el reto de comparar funciones compiladas sin información simbólica, lo que dificulta los enfoques clásicos basados en nombres o estructuras conocidas.