首页> 中文学位 >基于HMM的噪声语音端点检测方法研究
【6h】

基于HMM的噪声语音端点检测方法研究

代理获取

摘要

目前,语音端点检测已经成为语音识别,语音编码及语音分类等语音处理过程中必不可少的一部分。作为语音技术的预处理,语音端点检测(VoiceActivityDetection,VAD)准确率的微小改进都将会在整个语音系统的处理效果上带来长远的影响。
   传统的基于双门限的语音端点检测方法已经远远不能满足日益复杂的噪声环境。于是,许多基于统计模型的最大似然比(LikelihoodRatioTest,LRT)的端点检测方法已经提出来,它们在噪声环境下也能具有很好的检测效果,特别是基于隐马尔科夫模型(HMM)的统计方法。但是传统的基于HMM的VAD在复杂的低信噪比环境下,不能有效的判断语音与非语音的差别,从这一思想出发,本文提出了基于双模型多状态HMMs的VAD方法。该方法能将语音和噪声的细微差别进行有效的放大,提高了语音端点检测的准确率。
   本文的主要工作如下:
   1.通过分析二元状态的HMM模型在语音帧与非语音帧之间识别过程的不足,提出了基于双模型四状态的HMMs的VAD算法。该算法在后续的比较实验中对语音端点检测效果有明显的改进。
   2.采用了基于自相关函数的短时幅度特性,语音信号的分形维特征以及二阶差分的MFCC对语音段进行特征提取。通过实验比较了这三种特征在不同信噪比下的检测效果。而二阶的MFCC特征能够很好的模拟人的听觉系统,并具有良好的抗噪性和鲁棒性,因而更能刻画语音非语音的特征曲线。
   3.将二阶差分MFCC特征与双模型四状态的HMMs结合计算语音非语音的统计模型的最大似然比LRT,得到的LRT特征曲线能够更接近语音的特征性质。然后用K-means对LRT曲线聚类,得到了区分语音非语音的判别门限。最后通过对比实验说明其VAD效果比基于二元状态的HMM模型的VAD有更好的噪声鲁棒性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号