Repositorio Zaguan - Universidad de Zaragoza 

Related links

000009808 001__ 9808
000009808 037__ $$aTAZ-TFM-2012-1218
000009808 041__ $$aspa
000009808 1001_ $$aOlcoz Martínez, Julia
000009808 24500 $$aEstudio de técnicas de aprendizaje no supervisado en sistemas de reconocimiento automático del habla en dominios restringidos
000009808 260__ $$aZaragoza$$bUniversidad de Zaragoza$$c2012
000009808 506__ $$adenied
000009808 520__ $$aEl Reconocimiento Automático del Habla (RAH) pretende, dada una señal de voz, extraer la secuencia de palabras que han sido pronunciadas. Para que la tarea de evaluación pueda llevarse a cabo, es necesario que el reconocedor adquiera previamente ciertos conocimientos a través de una fase de entrenamiento. Se trata de un aprendizaje basado en dos tipos de Modelados: Acústico, para la caracterización de la señal de voz, y del Lenguaje, relativo al vocabulario en ella utilizado. Sin embargo, la salida del sistema no suele ser limpia y contiene errores provocados por el ruido ambiente, el propio locutor, la distorsión del canal de comunciación, etc. Este Trabajo Fin de Máster tiene por objetivo estudiar distintas Medidas de Confianza (CM) que evalúen la fiabilidad de las transcripciones de salida obtenidas, de manera que el sistema por sí mismo sea capaz de seleccionar aquellos fragmentos correctamente reconocidos para utilizarlos en adaptaciones posteriores (no supervisadas), dotándolo así de mayor inteligencia. Bajo estas premisas, y en el ámbito de los Modelos Acústicos, son dos las vertientes en las que trabajamos: en la primera de ellas, consideramos un modelo genérico de partida y lo adaptamos utilizando diferentes particiones de la base de datos constituida por los partes meteorológicos de TVE (desde Enero de 2.011 hasta Enero de 2.012), aplicando las Técnicas MAP y MLLR, analizando a continuación los resultados de reconocimiento obtenidos con cada uno de los modelos adaptados. Seguidamente, nos centramos en el estudio de las CM comenzando con una medida oráculo, para determinar el grado de mejora que se alcanzaría haciendo uso de dichas herramientas; acto seguido, particularizamos para las medidas de tal índole devueltas directamente por el reconocedor Vivoreco; y finalmente abordamos las Medidas de Confianza en el contexto de la Decodificación Acústico Fonética. La realización de este trabajo nos permite constatar que hoy en día el uso de Estrategias de Adaptación No Supervisada en el ámbito del RAH sigue siendo un campo de investigación en el que profundizar. Se trata de un problema no completamente resuelto, cuyo desarrollo contribuirá a mejoras relacionadas con la usabilidad y el nivel de robustez de las aplicaciones desarrolladas con las tecnologías de reconocimiento del habla.
000009808 521__ $$aMáster en Tecnología de la Información y Comunicaciones en Redes Móviles
000009808 540__ $$aEl autor no autoriza la difusión del texto completo de su obra
000009808 6531_ $$areconocimiento automático del habla (rah)
000009808 6531_ $$amedidas de confianza en rah
000009808 6531_ $$aaprendizaje no supervisado en rah
000009808 6531_ $$arah en dominios restringidos
000009808 6531_ $$aautomatic speech recognition (asr)
000009808 6531_ $$aconfidence measures in asr
000009808 6531_ $$aunsupervised learning in asr
000009808 6531_ $$aasr in restricted domains
000009808 700__ $$aOrtega Giménez, Alfonso$$edir.
000009808 7102_ $$aUniversidad de Zaragoza$$bIngeniería Electrónica y Comunicaciones$$cTeoría de la Señal y Comunicaciones
000009808 8560_ $$f537333@celes.unizar.es
000009808 8564_ $$s1834465$$uhttp://zaguan.unizar.es/TAZ/EINA/2012/9808/TAZ-TFM-2012-1218.pdf$$zMemoria (spa)
000009808 950__ $$a
000009808 980__ $$aTAZ$$bTFM$$cEINA
Videotutorial depósito Trabajos Académicos