TAZ-TFM-2021-236


Sistema de transcripción multitímbrica basado en redes neuronales profundas

Hernández López, Carlos
Beltrán Blázquez, José Ramón (dir.)

Universidad de Zaragoza, EINA, 2021
Ingeniería Electrónica y Comunicaciones department, Tecnología Electrónica area

Máster Universitario en Ingeniería Electrónica

Abstract: El objetivo de este trabajo es conseguir una transcripción MIDI a partir de un archivo WAV en melodías polifónicas (varias notas sonando al mismo tiempo) y multitímbrica (para diferentes instrumentos) , haciendo uso del deep learning. Para ello, se entrenan dos modelos, uno que detecta las notas completas (frames) y otro que se centra únicamente en los inicios de notas (onsets), finalizando con un algoritmo de note tracking que unirá ambos modelos. El deep learning es una herramienta que ha evolucionado en gran medida estos últimos años gracias al avance de la tecnología. La implementación se realiza mediante Python en el entorno de Anaconda, sobre todo, con los programas de Spyder y Jupyter notebook. Además, para facilitar el trabajo con las redes neuronales se utilizará Tensorflow.


Tipo de Trabajo Académico: Trabajo Fin de Master

Creative Commons License



El registro pertenece a las siguientes colecciones:
Academic Works > Trabajos Académicos por Centro > escuela-de-ingeniería-y-arquitectura
Academic Works > End-of-master works



Back to search

Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)