TAZ-TFG-2015-2632


Evaluación perceptual de vocoders para síntesis de voz basada en HMM

Martín Lana, Fernando
Vicente Borruel, Luis (dir.)

Universidad de Zaragoza, EINA, 2015
Ingeniería Electrónica y Comunicaciones department, Teoría de la Señal y Comunicaciones area

Graduado en Ingeniería de Tecnologías y Servicios de Telecomunicación

Abstract: Hoy en día, la síntesis de voz basada en modelos ocultos de Markov es uno de los métodos más utilizados y conocidos para sintetizar voz. Una de las características de este tipo de síntesis es la parametrización de la señal de voz que hace que la síntesis sea más flexible y eficiente. En este trabajo se da una visión general de tres de los vocoders que se utilizan actualmente en síntesis de voz basada en modelos ocultos de Markov, viendo algunas de sus características básicas. Los vocoders analizados son: SPTK, AHO-coder y STRAIGHT. Estos vocoders han sido comparados perceptualmente desde el punto de vista de la audición humana para determinar cuál de todos proporciona un mayor nivel de calidad vocal. Para ello se ha implementado en la herramienta matlab la recomendación P.862 de la ITU (más conocida como PESQ), un estándar que define un método objetivo de evaluar la calidad de códecs vocales de banda estrecha. Este método objetivo es una aproximación o predicción de la nota de calidad MOS que se obtendría en un experimento subjetivo de escucha. El nivel de calidad de cada vocoder ha sido evaluado en resíntesis, es decir, en el proceso en el cual se parametriza la señal de voz y, con dichos parámetros, inmediatamente se sintetiza. Se ha utilizado la base de datos de voz Albayzin para realizar el proceso de evaluación y se ha desarrollado en matlab todo el software necesario para hacer la resíntesis de la base de datos con los diferentes vocoders y obtener el valor de calidad perceptual mediante PESQ. En la parte final del trabajo se presenta un análisis detallado de los resultados obtenidos, mostrando el valor de calidad promedio para cada vocoder y realizando un análisis detallado por diferentes grupos (por sexo y edad). Finalmente se presentan las conclusiones extraídas del trabajo y se nombran algunas líneas futuras de trabajo.

Tipo de Trabajo Académico: Trabajo Fin de Grado

Creative Commons License

El registro pertenece a las siguientes colecciones:
Academic Works > Trabajos Académicos por Centro > escuela-de-ingeniería-y-arquitectura
Academic Works > End-of-grade works



Back to search

Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)