首页> 中文学位 >听觉-声学混合LPC方法研究
【6h】

听觉-声学混合LPC方法研究

代理获取

摘要

语音编码中,感觉加权滤波器、综合滤波器、对数增益滤波器都涉及到线性预测分析技术,这种技术在语音处理中发挥着核心作用。本文的主要工作是提出一种结合声学特性与听觉特性的混合LPC(Auditory-Acoustic-Hybrid-LPC)系数,使得编码后的合成语音听觉质量有了改善,提高了PESQ值。实验结果表明H-LPC可以改善编码算法的合成语音质量,对编码算法的研究有积极意义。
   本文首先对H-LPC的求解算法进行了研究,基于对美尔倒谱系数(MFCC)与LPC美尔倒谱系数(LPCMCC)的原理分析和算法实现,将MFCC与LPCMCC的听觉特性结合,用MFCC的峰谷值特性去调节LPCMCC,以增强其听觉特性,使之能够真实准确地反映声音的听觉特性,进而将这种听觉性质反馈到LPC系数上。
   为检测H-LPC加入听觉特性的程度以及声学特性的损耗,实验中对LPC系数进行功率谱密度(PSD)估计检测。原始语音的PSD采用直接法求解,LPC系数的PSD选用AR模型功率谱估计中的Yule-Walker法估计。实验结果表明,H-LPC的PSD相较于传统LPC有一定程度的减弱,但是已经基本达到目前LPC的使用要求,对于原始语音PSD的体现率达到了95[%]以上。
   在H-LPC应用在编码算法之前,将其求解算法中的各个参数与编码算法中综合滤波器的参数进行了同一化工作。关键技术是混合窗的加入,通过对MFCC求解算法以及LPCMCC求解流程的对比研究,证明MFCC可以直接使用混合窗代替哈明窗而对运算过程不产生叠加递归影响,LPCMCC的求解中涉及到自相关函数的递归叠加运算,将这部分运算过程修正。同一化工作结束后,求出H-LPC加入8Kbit/s LD-aCELP编码算法。
   对加入H-LPC的8Kbit/s LD-aCELP语音编码算法得到的合成语音进行收听与PESQ检测。实验结果表明使用综合听觉特性与声学特性的H-LPC系数编解码得到的合成语音质量与G.728编码算法得到的合成语音质量相当,比LD-aCELP算法的合成语音质量高,加入H-LPC的LD-aCELP算法的PESQ值为3.630。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号