首页> 中文学位 >基于WFST的中文语音识别解码器的研究
【6h】

基于WFST的中文语音识别解码器的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

S1.1 研究背景

S1.2 国内外研究现状

S1.3 本文研究内容

第二章 加权有限状态转换器

S2.1 有限状态自动机

S2.2 加权有限状态自动机

S2.3 加权有限状态转换器

第三章 加权有限状态转换器的构建

S3.1 合并演算法

S3.2 声学模型

S3.3 发音词典

S3.4 语言模型

第四章 加权有限状态转换器的整合及优化

S4.1 加权有限状态转换器的整合

S4.2 加权有限状态转换器的确定化

S4.3 加权有限状态转换器的最小化

第五章 解码器的设计与实现

S5.1 解码器的设计

S5.2 实验环境与实验结果

结论与展望

参考文献

致谢

展开▼

摘要

语音识别技术,主要是通过计算机语音处理技术,实现一种人机界面,为人与人和人与计算机之间的顺畅交流提供一种便捷的方式。自语音识别技术发展以来,已经取得了一定的研究成果,国内外诸多大公司也加大了对大词汇量中文语音识别技术的开发和研究。在语音识别技术中,解码器是最为关键的部分。
  近年来,有限状态转换器被广泛应用于语音识别技术中。由于有限状态转换器不仅可以使用于模拟讯号模型,更可以进一步模拟自然语言中许多重要且繁复的文法结构与文法特性。因此,有限状态转换器成为语音研究有力的工具。
  本文主要讨论带权有限状态转换器在大词汇量中文语音识别系统中的应用。它的基本思想是,将声学模型、发音词典、语言模型分别用一个加权有限状态转换器来表示。然后通过组合演算法将其整合为一个完整的加权有限状态转换器模型,从而可以得到一个同一维度的语音识别搜索空间。
  本论文可分为四个部分:第一个部分是带权有限状态机相关的基本概念和理论推导;第二部分讨论如何将传统语音识别中所使用的声学模型、发音词典和语音模型分别建立成有限状态转换器形式,以及介绍合并演算法,用来减少各有限状态转换器的状态数和转移数;第三部分讨论如何以组合算法将各带权有限状态转换器整合成为一个搜索空间,以及优化问题;第四部分,设计并实现解码器,在给出测试语料的基础上进行试验。最后,将实验结果与传统的基于HTK工具的识别结果,分别在识别率和解码速度两个方面进行比较,得出结论。证明基于加权有限状态转换器的识别系统的正确性及优越性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号