000013542 001__ 13542
000013542 005__ 20150325205432.0
000013542 037__ $$aTAZ-PFC-2014-139
000013542 041__ $$aspa
000013542 1001_ $$aNavarro Lou, Samuel
000013542 24500 $$aConversión automática de emociones para la transformación del habla independiente del locutor
000013542 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2014
000013542 506__ $$aby-nc-sa$$bCreative Commons$$c3.0$$uhttp://creativecommons.org/licenses/by-nc-sa/3.0/
000013542 520__ $$aLas emociones en el habla son parte fundamental de cualquier diálogo natural. En la vida diaria, la interacción vocal con las personas a menudo implica emociones como parte intrínseca de la conversación en mayor o menor medida. Consecuentemente,la inclusión de emociones en sistemas de diálogo hombre-máquina es crucial para alcanzar un grado aceptable de naturalidad en la comunicación. Este proyecto se centra en la conversión automática de emociones en el habla, una técnica cuyo objetivo es transformar la voz producida en estilo emocional neutro para producir la sensación de que se ha producido con otro estilo emocional, con la meta adicional de realizarlo en un contexto independiente del locutor. La conversión de emociones representa un reto ya que éstas afectan de forma signicativa a todas las partes del sistema de producción humana de voz, y en el proceso de conversión toda la casuística debe ser considerada. Los métodos usados en la literatura se basan en una técnica conocida como conversión de voz, cuyo objetivo es transformar la identidad de un determinado hablante, con modicaciones menores que permitan crear la sensación de emoción. En este proyecto se toma la idea principal de la conversión de voz, pero el proceso habitual de regresión para transformar el espectro del habla se divide en dos subprocesos para proporcionar una normalización de identidad adicional, eliminando la dependencia intrínseca del locutor que presentan estos sistemas, aplicando un procedimiento conocido como normalización de la longitud del tracto vocal como técnica de preproceso.  Adicionalmente, se propone un método para transformar la curva de entonación de la frase y las duraciones de los diferentes sonidos usando un método que toma en consideración información contextual.
000013542 521__ $$aIngeniero de Telecomunicación
000013542 540__ $$aDerechos regulados por licencia Creative Commons
000013542 6531_ $$aconversión de voz
000013542 6531_ $$aemociones 
000013542 6531_ $$ahabla emocional
000013542 6531_ $$amodelado de prosodia
000013542 700__ $$aSilen, Hanna$$edir.
000013542 7102_ $$aUniversidad de Zaragoza$$bIngeniería Electrónica y Comunicaciones$$cTeoría de la Señal y Comunicaciones
000013542 7202_ $$aOrtega Giménez, Alfonso$$eponente
000013542 8560_ $$f591411@celes.unizar.es
000013542 8564_ $$s1598725$$uhttps://zaguan.unizar.es/record/13542/files/TAZ-PFC-2014-139.pdf$$yMemoria (spa)
000013542 8564_ $$s480893$$uhttps://zaguan.unizar.es/record/13542/files/TAZ-PFC-2014-139_ANE.pdf$$yAnexos (spa)
000013542 909CO $$ooai:zaguan.unizar.es:13542$$pproyectos-fin-carrera$$pdriver
000013542 950__ $$a
000013542 980__ $$aTAZ$$bPFC$$cEINA