TAZ-TFM-2021-236


Sistema de transcripción multitímbrica basado en redes neuronales profundas

Hernández López, Carlos
Beltrán Blázquez, José Ramón (dir.)

Universidad de Zaragoza, EINA, 2021
Departamento de Ingeniería Electrónica y Comunicaciones, Área de Tecnología Electrónica

Máster Universitario en Ingeniería Electrónica

Resumen: El objetivo de este trabajo es conseguir una transcripción MIDI a partir de un archivo WAV en melodías polifónicas (varias notas sonando al mismo tiempo) y multitímbrica (para diferentes instrumentos) , haciendo uso del deep learning. Para ello, se entrenan dos modelos, uno que detecta las notas completas (frames) y otro que se centra únicamente en los inicios de notas (onsets), finalizando con un algoritmo de note tracking que unirá ambos modelos. El deep learning es una herramienta que ha evolucionado en gran medida estos últimos años gracias al avance de la tecnología. La implementación se realiza mediante Python en el entorno de Anaconda, sobre todo, con los programas de Spyder y Jupyter notebook. Además, para facilitar el trabajo con las redes neuronales se utilizará Tensorflow.


Tipo de Trabajo Académico: Trabajo Fin de Master

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Escuela de Ingeniería y Arquitectura
Trabajos académicos > Trabajos fin de máster



Volver a la búsqueda

Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)