TAZ-PFC-2014-139


Conversión automática de emociones para la transformación del habla independiente del locutor

Navarro Lou, Samuel
Silen, Hanna (dir.)

Ortega Giménez, Alfonso (ponente)

Universidad de Zaragoza, EINA, 2014
Departamento de Ingeniería Electrónica y Comunicaciones, Área de Teoría de la Señal y Comunicaciones

Ingeniero de Telecomunicación

Resumen: Las emociones en el habla son parte fundamental de cualquier diálogo natural. En la vida diaria, la interacción vocal con las personas a menudo implica emociones como parte intrínseca de la conversación en mayor o menor medida. Consecuentemente,la inclusión de emociones en sistemas de diálogo hombre-máquina es crucial para alcanzar un grado aceptable de naturalidad en la comunicación. Este proyecto se centra en la conversión automática de emociones en el habla, una técnica cuyo objetivo es transformar la voz producida en estilo emocional neutro para producir la sensación de que se ha producido con otro estilo emocional, con la meta adicional de realizarlo en un contexto independiente del locutor. La conversión de emociones representa un reto ya que éstas afectan de forma signicativa a todas las partes del sistema de producción humana de voz, y en el proceso de conversión toda la casuística debe ser considerada. Los métodos usados en la literatura se basan en una técnica conocida como conversión de voz, cuyo objetivo es transformar la identidad de un determinado hablante, con modicaciones menores que permitan crear la sensación de emoción. En este proyecto se toma la idea principal de la conversión de voz, pero el proceso habitual de regresión para transformar el espectro del habla se divide en dos subprocesos para proporcionar una normalización de identidad adicional, eliminando la dependencia intrínseca del locutor que presentan estos sistemas, aplicando un procedimiento conocido como normalización de la longitud del tracto vocal como técnica de preproceso. Adicionalmente, se propone un método para transformar la curva de entonación de la frase y las duraciones de los diferentes sonidos usando un método que toma en consideración información contextual.


Palabra(s) clave (del autor): conversión de voz ; emociones ; habla emocional ; modelado de prosodia
Tipo de Trabajo Académico: Proyecto Fin de Carrera

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Escuela de Ingeniería y Arquitectura
Trabajos académicos > Proyectos fin de carrera



Volver a la búsqueda

Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)