首页> 中文学位 >基于多带激励模型的低速率语音编码技术研究
【6h】

基于多带激励模型的低速率语音编码技术研究

代理获取

摘要

随着无线通信技术的不断发展和无线通信需求的日益增长,无线通信业务得到了越来越广泛的普及和应用。在众多无线通信服务中,语音是最基本、最常用的服务。为了降低传输成本、提高传输效率,从而实现在低码率或低存储空间情况下高质量传输语音,模拟语音信号通常经过数字化处理以比特流的形式传输,这个过程称为语音编码。
   参量编码是众多语音编码算法中的一类,它的特点是能够实现低码率。因此参量编码广泛应用于保密通信、卫星通信和语音信箱等诸多领域。语音信号的参量主要包括基音周期、频谱包络和清/浊音信息。参量的提取、量化精度直接影响合成语音质量。近年来,许多专家学者对参量提取和量化进行了广泛研究。在此基础上,本文针对多带激励(Multi-Band Excitation,MBE)语音编码模型、参量提取算法和参量量化等关键技术进行了深入研究,提出了若干改进算法,主要创新性成果如下:
   1.提出一种基于线性预测系数(Linear Predictive Coefficient,LPC)自适应前后向量化的MBE算法。该算法由MBE算法和(LPC系数)自适应前后向量化组成。MBE算法用于提取语音模型参量;自适应前后向量化利用语音信号相邻帧统计特性的相似性实现LPC系数的变速率编码,降低编码速率。提出一种基于线性预测系数自适应前后向量化的MBE算法的改进方案。改进方案增设一个线谱频率(Linear Spectral Frequency,LSF)系数自适应后向码本,并通过对该码本中相邻帧的LSF系数进行线性内插的方法,提高LPC系数自适应后向码本的精度。客观测试结果表明,与基于LPC系数自适应前后向量化的MBE算法相比,改进算法提高了平均后向量化使用率,进一步降低了平均编码速率。
   2.针对子带快速傅里叶反变换的线性误差对真实包络估计器(True EnvelopeEstimator,TE)实时算法的影响,提出一种采用修正因子消除线性误差的改进型TE三实时算法。首先,推导出TE算法及其实时算法的累加型实现方案;然后,根据累加型TE实时算法分析出,子带快速傅里叶反变换的线性误差会导致TE实时算法所提取包络的精度降低,TE实时算法的收敛速度减慢;最后,推导出子带快速傅里叶反变换的线性误差的误差公式和修正因子的计算公式。提出一种基于美尔卷曲的改进型TELPC(TE-Linear Predictive Coding)频谱包络估计实时算法。该算法以改进型TE实时算法为基础,并根据人耳对频谱低频段分辨率更高的听觉特性,将提取的频谱包络映射到美尔刻度进行线性预测分析,并采用幅度压缩技术减小卷曲频谱包络的动态范围。客观测试结果表明,与改进型TELPC实时算法相比,基于美尔卷曲的改进型TELPC实时算法有效减小了所提取包络在低频段的拟合误差。
   3.提出一种采用时间加权均方误差准则的LSF系数轨迹压缩算法。在轨迹压缩算法的基础上,该算法利用人耳对浊音帧和高能量帧感知更加敏感的特性,采用对均方误差准则不等权重加权的方法,提高曲线对感知重要帧LSF系数的拟合精度,从而改善合成语音质量。在由MBE-LPC语音编码算法构成的测试系统中,与原轨迹压缩算法相比,LSF系数时间加权轨迹压缩算法可以提高合成语音MOS(Mean Opinion Score,MOS)分数约0.022。
   4.提出一种用于信号边缘检测的经验模式分解域自适应滤波方法。该方法由经验模式分解(Empirical Mode Decomposition,EMD)和空域自适应滤波两个部分组成。经验模式分解用于获得原信号的各级残差分量的一阶导数信号;空域自适应滤波利用空间相关函数增强残差分量一阶导数中信号边缘所对应峰值,抑制噪声。同时,给出EMD域自适应滤波方法中噪声功率阈值的两种估计方法:基于一致性EMD的噪声功率估计方法;基于中位数绝对离差的噪声功率估计方法。仿真实验表明EMD域自适应滤波方法可以准确提取信号边缘信息,并可应用于语音信号的基音周期检测。提出一种基于集合EMD域多尺度乘积的基音周期检测算法。该算法通过集合EMD域相邻多个尺度上残差分量一阶导数信号直接相乘来增强声门闭合时刻峰值;通过对多尺度乘积信号进行自相关分析来提取基音周期。客观测试结果表明该方法在安静和噪声环境中都可以提供较高的基音周期检测正确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号