首页> 中文学位 >基于二值掩蔽和感知小波包变换的语音增强研究
【6h】

基于二值掩蔽和感知小波包变换的语音增强研究

代理获取

摘要

在现实生活中,语音的传输不可避免地受到周围环境和传输媒介的影响。受干扰的语音信号不但会使人耳容易产生听觉疲劳,而且会严重降低语音编码、语音识别等语音信号处理系统的性能。为了消除噪声的影响,对语音增强技术的研究是非常有必要的。
   本文在对谱减类语音增强算法的研究基础上,提出了基于二值掩蔽和感知小波包变换的语音增强系统。主要工作包括:
   针对目前听觉掩蔽效应算法只考虑同时掩蔽效应的问题,将同时掩蔽效应和短时掩蔽效应相结合并提出了一种瞬时掩蔽因子,更符合人耳的听觉感知特性。将初步增强的语音信号与纯净语音信号之差表示为语音失真和残留噪声的叠加,定义代价函数将二者结合起来。根据残留噪声能量应低于掩蔽阈值的约束条件,将语音失真降至最低来优化增益函数,从而得到能够根据听觉掩蔽阈值自适应调整的最优谱减参数,进而实现语音增强。
   针对语音增强算法容易损失清音部分的问题,提出了一种基于二值掩蔽的清音增强方法。根据计算听觉场景分析,将带噪清音信号划分为若干时频单元,用训练好的二值掩蔽模型判断每个时频单元是语音主导还是噪声干扰主导,语音主导的时频单元将被保留,噪声干扰主导的时频单元将被去除。最后将增强后的清音部分与基于感知小波包变换增强的浊音部分合成,就得到了完整的增强语音。
   对本文方法进行了实验仿真,分别用主客观评价标准对增强语音进行了评价。结果表明,本文方法与常用算法相比,可以更好地去除背景噪声,抑制残留噪声,同时语音失真最小,有效地保护了清音。
   最后指出了本文方法中存在的缺点,并给出了解决的思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号