基于高斯混合模型的压缩域语音增强方法

梁岩; 鲍长春; 夏丙寅; 何玉文; 周璇; 李娜

首页> 中文期刊> 《电子学报》 >基于高斯混合模型的压缩域语音增强方法

基于高斯混合模型的压缩域语音增强方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了有效利用纯净语音导抗谱频率参数( ISFs)的先验知识,本文针对ITU-TG.722.2宽带语音编码标准提出了一种基于高斯混合模型的压缩域语音增强方法.首先,将含噪语音、纯净语音的导抗谱频率参数,以及对应的增益调整因子构成特征矢量,并利用高斯混合模型拟合其概率密度；然后,在最小均方误差( MMSE)准则下对纯净语音的特征参数进行最优贝叶斯估计.为了兼容编码器中的非连续性传输模式,当处理信号为非语音信息时,算法在保持噪声帧谱包络参数不变的前提下,按固定比例调整对数帧能量；且若出现帧擦除情况,算法不调整接收到的码流,并按正常帧处理方式调整恢复后的参数以更新相关历史.本文采用ITU-TG.160标准进行了性能测试,结果表明,与参考方法相比,所提方法在保证信噪比提高能力的同时,可以达到更大的噪声衰减量,且增强语音的客观质量更优.%A Gaussian Mixture Model (GMM) based speech enhancement method in compressed domain used for ITU-T G. 722.2 wideband speech codec is proposed to take full advantage of the prior knowledge of the Immittance Spectral Frequencies (IS-Fs) for the clean speech. Firstly, GMM is adopted to model the joint probability density of feature vectors which are composed by the ISFs of noisy speech and clean speech with the corresponding gain scaling factor. Secondly, an optimal Bayesian estimation of feature parameters derived from clean speech is obtained under the minimum mean square error (MMSE) criterion. To be compatible with the DTX (Discontinuous Transmission) mode,the logarithmic energy is attenuated and the ISFs remain when a SID (Silence Insertion Descriptor) frame is received.Furthermore,if ao erased frame is received,the bit stream is unchanged and the proposed method is performed on the recovered parameters for the memory update.The evaluation is conducted under the ITU-T G. 160. The results indicate that,comparing with the reference method,the proposed method can produce larger amount of noise level reduction with better objective speech quality, while the SNR improvement remains acceptable.

著录项

来源
《电子学报》 |2012年第10期|2031-2038|共8页
作者
梁岩; 鲍长春; 夏丙寅; 何玉文; 周璇; 李娜;
展开▼
作者单位

北京工业大学电子信息与控制工程学院,北京100124;

北京工业大学电子信息与控制工程学院,北京100124;

北京工业大学电子信息与控制工程学院,北京100124;

北京工业大学电子信息与控制工程学院,北京100124;

北京工业大学电子信息与控制工程学院,北京100124;

北京工业大学电子信息与控制工程学院,北京100124;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音增强;
关键词
语音增强; 参数域; 高斯混合模型; 贝叶斯估计; 非连续性传输; 帧擦除;

相似文献

中文文献
外文文献
专利

1. 基于子空间域噪声特征值估计的语音增强方法 [J] . 吴北平 ,李辉 ,戴蓓倩 . 信号处理 . 2009,第003期
2. 基于模糊域奇异值分解的语音增强方法 [J] . 王金芳 ,杨宝俊 ,李月 . 江西科学 . 2008,第003期
3. 基于机器学习的压缩域图像均衡增强方法 [J] . 何山 ,赵越 ,乔孟锐 . 计算机仿真 . 2021,第003期
4. 基于 MPEG-AAC 编码器的压缩域音频增强方法 [J] . . 电子学报 . 2014,第007期
5. 基于Retinex理论的压缩域图像增强方法研究 [J] . 汪荣贵 ,张新龙 ,张璇 . 计算机研究与发展 . 2011,第002期
6. 基于多阈值的小波域语音增强方法 [C] . 高克芳 ,刘银春 . 中国电子学会第十三届青年学术年会 . 2007
7. 基于小波域高斯混合模型的绝缘子红外图像去噪方法研究 [A] . 韩子媛 . 2010

基于高斯混合模型的压缩域语音增强方法

摘要

著录项

相似文献

相关主题

期刊订阅