TAZ-PFC-2014-139


Conversión automática de emociones para la transformación del habla independiente del locutor

Navarro Lou, Samuel
Silen, Hanna (dir.)

Ortega Giménez, Alfonso (ponente)

Universidad de Zaragoza, EINA, 2014
Ingeniería Electrónica y Comunicaciones department, Teoría de la Señal y Comunicaciones area

Ingeniero de Telecomunicación

Abstract: Las emociones en el habla son parte fundamental de cualquier diálogo natural. En la vida diaria, la interacción vocal con las personas a menudo implica emociones como parte intrínseca de la conversación en mayor o menor medida. Consecuentemente,la inclusión de emociones en sistemas de diálogo hombre-máquina es crucial para alcanzar un grado aceptable de naturalidad en la comunicación. Este proyecto se centra en la conversión automática de emociones en el habla, una técnica cuyo objetivo es transformar la voz producida en estilo emocional neutro para producir la sensación de que se ha producido con otro estilo emocional, con la meta adicional de realizarlo en un contexto independiente del locutor. La conversión de emociones representa un reto ya que éstas afectan de forma signicativa a todas las partes del sistema de producción humana de voz, y en el proceso de conversión toda la casuística debe ser considerada. Los métodos usados en la literatura se basan en una técnica conocida como conversión de voz, cuyo objetivo es transformar la identidad de un determinado hablante, con modicaciones menores que permitan crear la sensación de emoción. En este proyecto se toma la idea principal de la conversión de voz, pero el proceso habitual de regresión para transformar el espectro del habla se divide en dos subprocesos para proporcionar una normalización de identidad adicional, eliminando la dependencia intrínseca del locutor que presentan estos sistemas, aplicando un procedimiento conocido como normalización de la longitud del tracto vocal como técnica de preproceso. Adicionalmente, se propone un método para transformar la curva de entonación de la frase y las duraciones de los diferentes sonidos usando un método que toma en consideración información contextual.


Free keyword(s): conversión de voz ; emociones ; habla emocional ; modelado de prosodia
Tipo de Trabajo Académico: Proyecto Fin de Carrera

Creative Commons License

El registro pertenece a las siguientes colecciones:
Academic Works > Trabajos Académicos por Centro > escuela-de-ingeniería-y-arquitectura
Academic Works > Final Degree Projects



Back to search

Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)