首页> 中文学位 >基于元音长度调整的中语言语音识别
【6h】

基于元音长度调整的中语言语音识别

代理获取

摘要

语音识别一直都是国内外的一个重要的研究课题。目前的语音识别系统对发音人的语速具有一定的自适应调整能力。但对于不同的发音人来说,这些自适应调整能力都是不够的,往往在识别那些语速过快或过慢的语音的时候,得到的识别率都比较低。
   本文从研究语音识别的一些基本理论入手,为了改善语音发音长短不同,而导致识别率下降的问题,重点研究了基于HMM模型以及动态时间规整算法的元音长度调整算法和元音分组算法,并进行了仿真与比较。本文的主要研究工作如下:
   1.本文先对隐马尔可夫模型(Hidden Markov Model,HMM)和动态时间规整算法(Dynamic Time Warping,DTW)进行了详细的分析,并对基础模型、算法进行了仿真实验。将基于DTW算法的仿真结果,作为后续章节研究的基础识别率,从而可清晰地看出改进算法对识别率的提高。
   2.根据汉语语音发音时,每一个音节都含有元音,元音长度占音节长度的主要部分,但是却不包含发音的主要信息这些特点,研究了在语音的元音部分,利用相关系数寻找相似波形,然后对元音部分进行相似波形的插入或删除的方法,来改变元音部分的长度,进而调整语速。在对元音部分进行实际操作时,提出了一种新的计算方法,相对于原先的“调整-判断-再调整-再判断”方法,在算法速度上有了很大的提高。
   3.由于元音长度调整算法当中,阈值参数Lmax和Lmin的取值,不能完全兼顾到所有的孤立词。本文提出了一种改进算法,即元音分组算法。该算法使用三种分组方法,分别根据元音的类型、元音的相似性以及元音的长度进行分组。针对不同的元音组,选择不同的阈值参数Lmax和Lmin,真正做到“区别对待”。仿真实验结果表明,相较于元音长度调整算法,这种改进的算法对系统的识别率,有更为显著的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号