Repositorio Zaguan - Universidad de Zaragoza 

Related links

TAZ-TFM-2012-1218

Estudio de técnicas de aprendizaje no supervisado en sistemas de reconocimiento automático del habla en dominios restringidos

Olcoz Martínez, Julia
Ortega Giménez, Alfonso (dir.)

Universidad de Zaragoza, Escuela de Ingeniería y Arquitectura, 2012
Ingeniería Electrónica y Comunicaciones department, Teoría de la Señal y Comunicaciones area

Máster en Tecnología de la Información y Comunicaciones en Redes Móviles

Abstract: El Reconocimiento Automático del Habla (RAH) pretende, dada una señal de voz, extraer la secuencia de palabras que han sido pronunciadas. Para que la tarea de evaluación pueda llevarse a cabo, es necesario que el reconocedor adquiera previamente ciertos conocimientos a través de una fase de entrenamiento. Se trata de un aprendizaje basado en dos tipos de Modelados: Acústico, para la caracterización de la señal de voz, y del Lenguaje, relativo al vocabulario en ella utilizado. Sin embargo, la salida del sistema no suele ser limpia y contiene errores provocados por el ruido ambiente, el propio locutor, la distorsión del canal de comunciación, etc. Este Trabajo Fin de Máster tiene por objetivo estudiar distintas Medidas de Confianza (CM) que evalúen la fiabilidad de las transcripciones de salida obtenidas, de manera que el sistema por sí mismo sea capaz de seleccionar aquellos fragmentos correctamente reconocidos para utilizarlos en adaptaciones posteriores (no supervisadas), dotándolo así de mayor inteligencia. Bajo estas premisas, y en el ámbito de los Modelos Acústicos, son dos las vertientes en las que trabajamos: en la primera de ellas, consideramos un modelo genérico de partida y lo adaptamos utilizando diferentes particiones de la base de datos constituida por los partes meteorológicos de TVE (desde Enero de 2.011 hasta Enero de 2.012), aplicando las Técnicas MAP y MLLR, analizando a continuación los resultados de reconocimiento obtenidos con cada uno de los modelos adaptados. Seguidamente, nos centramos en el estudio de las CM comenzando con una medida oráculo, para determinar el grado de mejora que se alcanzaría haciendo uso de dichas herramientas; acto seguido, particularizamos para las medidas de tal índole devueltas directamente por el reconocedor Vivoreco; y finalmente abordamos las Medidas de Confianza en el contexto de la Decodificación Acústico Fonética. La realización de este trabajo nos permite constatar que hoy en día el uso de Estrategias de Adaptación No Supervisada en el ámbito del RAH sigue siendo un campo de investigación en el que profundizar. Se trata de un problema no completamente resuelto, cuyo desarrollo contribuirá a mejoras relacionadas con la usabilidad y el nivel de robustez de las aplicaciones desarrolladas con las tecnologías de reconocimiento del habla.


Free keyword(s): reconocimiento automático del habla (rah) ; medidas de confianza en rah ; aprendizaje no supervisado en rah ; rah en dominios restringidos ; automatic speech recognition (asr) ; confidence measures in asr ; unsupervised learning in asr ; asr in restricted domains
Tipo de Trabajo Académico: Trabajo Fin de Master

Fulltext view has been restricted by the author


 

 Record created 2012-11-22, last modified 2013-02-14


Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)
  

Videotutorial depósito Trabajos Académicos