首页> 外文会议>Conference on Computational Linguistics and Speech Processing >類神經網路訓練結合環境群集及專家混合系統於強健性語音辨識
【24h】

類神經網路訓練結合環境群集及專家混合系統於強健性語音辨識

机译:类神经网路训练结合环境群集及专家混合系统于强健性语音辨识

获取原文

摘要

近年來,神經網路(Neural Network)在語音辨識上的研究有著豐碩的成果,有效地減少環境以及語者變異對語音訊號造成的影響,大幅提升辨識率,但系統的語音辨識能力仍有改善空間。本論文即提出新的自動語音辨識系統架構,結合Environment Clustering (EC) 、 Mixture of Experts與類神經網路以進一步提升系統效能。我們將辨識系統分為Offline與Online兩階段:Offline階段依據聲學特性將整個訓練資料集分割成多個子訓練資料集,並建立各子訓練資料集的類神經網路(以類神經子網路稱之)。Online階段則使用GMM-gate來控制類神經子網路的輸出。新提出的系統架構保留子訓練資料. 集的聲學特性,強健語音辨識系統。實驗上,我們使用Aurora 2連續數字語音資料庫,依據字錯誤率(word error rate, WER)比較我們提出的語音辨識系統架構與傳統以類神經網路建立的辨識系統,平均字錯誤率進步5.9% ,由5.25%降低至4.94% 。
机译:近年来,神经网路(Neural Network)在语音辨识上的研究有着丰硕的成果,有效地减少环境以及语者变异对语音讯号造成的影响,大幅提升辨识率,但系统的语音辨识能力仍有改善空间。本论文即提出新的自动语音辨识系统架构,结合Environment Clustering (EC) 、 Mixture of Experts与类神经网路以进一步提升系统效能。我们将辨识系统分为Offline与Online两阶段:Offline阶段依据声学特性将整个训练资料集分割成多个子训练资料集,并建立各子训练资料集的类神经网路(以类神经子网路称之)。 Online阶段则使用GMM-gate来控制类神经子网路的输出。新提出的系统架构保留子训练资料. 集的声学特性,强健语音辨识系统。实验上,我们使用Aurora 2连续数字语音资料库,依据字错误率(word error rate, WER)比较我们提出的语音辨识系统架构与传统以类神经网路建立的辨识系统,平均字错误率进步5.9 % ,由5.25%降低至4.94% 。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号