公开/公告号CN116343815A
专利类型发明专利
公开/公告日2023-06-27
原文格式PDF
申请/专利权人 杭州电子科技大学;
申请/专利号CN202310318001.X
发明设计人
申请日2023-03-24
分类号G10L21/0232;
代理机构
代理人
地址 310018 浙江省杭州市钱塘区白杨街道2号大街1158号
入库时间 2024-04-18 19:54:10
技术领域
本发明属于语音增强技术领域,具体涉及一种基于先验信噪比的维纳滤波和改进谱减法的语音增强方法。
背景技术
由于在现实生活中,我们所听到的声音往往会被一些背景噪声所包围,而噪声往往会直接降低语音信号的清晰度,为了提高听者的舒适度以及语音清晰度,减少背景噪声的干扰是非常关键的任务,而语音增强正是对一段被各种各样的噪音干扰或者淹没的语音信号中提取出接近纯净的语音信号并抑制、降低噪声干扰的技术。
维纳滤波由于其较小的运算复杂度以及不错的将造型优势,在语音增强领域方面发挥着非常重要的作用,也广泛应用于语音增强方面,但由于基础的维纳滤波在处理后还是会留下一些残留噪声,使得最后的语音信号清晰度降低。因此采用先验信噪比的方式来初步减少残留噪声。
谱减法在语音增强领域使用非常广泛,其思想是从带噪语音信号中减去噪声功率谱,从而得到最终接近原生的语音频谱。谱减法的特点为计算量小、复杂度低,更适合实时处理的场景,但处理后同样也会产生一些音乐噪声影响语音识别度。因此采用改进谱减法进一步去噪的同时,也可以大大减少音乐噪声的干扰。
发明内容
本发明的目的在于通过多种改进结合语音增强方法解决现有技术下维纳滤波或谱减法降噪效果不佳并存在不少音乐噪音的问题,提供一种基于先验信噪比的维纳滤波和改进谱减法的语音增强方法。
为了实现上述目的,本发明采用一种基于先验信噪比的维纳滤波和改进谱减法的语音增强方法,包括以下步骤:
S1、输入带噪语音信号,并进行加窗分帧处理;
S2、对经加窗分帧处理后的带噪语音信号进行傅里叶变换得到纯净语音信号;
S3、基于先验信噪比的维纳滤波算法对傅里叶变换得到纯净语音信号进行信号增强处理,得到初级语音增强信息;
S4、基于谱减法,将步骤S3中得到的初级语音增强信息进行进一步处理,得到二次语音增强信息;
S5、对二次语音增强信息进行反傅里叶变换,得到最终所需的语音增强信号。
作为优选,所述带噪语音信号由加性噪声信号和纯净语音信号构成,并对该其进行加窗分帧处理后,对任何一帧进行傅里叶变换后,对于第i帧带噪语音信号公式如下:
X
其中X
作为优选,所述步骤S3包括如下子步骤:
S3-1、根据傅里叶变换后的纯净语音信号得到其频谱估计;
S3-2、基于最小均方误差的判别方法,求解频谱估计其中的增益函数;
S3-3、最后基于DD判别法,求解增益函数中所需的先验信噪比和后验信噪比;
作为优选,所述基于先验信噪比的维纳滤波方法,对于纯净语音信号的频谱估计,表达式如下:
其中H(δ
作为优选,所述基于先验信噪比的维纳滤波方法,对于纯净语音信号的频谱估计中的增益函数,基于最小均方误差的判别方法求解增益函数,求解后表达式如下:
其中H(δ
作为优选,基于DD判别法,求解增益函数中所述的两个信噪比δ
δ
其中
作为优选,所述步骤S4包括如下子步骤:
S4-1、根据初步信号增强处理后的初级语音增强信号进行功率谱转换得到纯净语音信息的初步功率谱;
S4-2、采用平均法根据已知的前导无语音段对其进行噪声谱估计,其得到的估计值来代替加性噪声谱;
S4-3、基于改进谱减法处理,根据加性噪声的噪声谱估计进一步对其纯净语音信号功率谱估计调整机制,并加入相位信息得到最终的二次语音增强信号;
作为优选,所述改进谱减法,其纯净语音信息估计功率谱公式改进的调整机制如下:
其中,a为过减因子,取值范围为3≤a≤6,b为补偿因子,取值范围0≤b<<1,
本发明具有以下特点和有益效果
本发明基于先验信噪比的维纳滤波和改进谱减法的语音增强方法,由于单一使用一个处理标准会使带来大量的音乐噪声,该维纳滤波与过程中的信噪比相关联并作出调整,改进后的谱减法相比传统的谱减法语音调整为线性方式,并设置了阈值,并在一定范围引入了合理参数进行调整,对传统算法下单一的处理方式做出了优化与改进,因此提取出的语音信号,在保持噪声平稳性的同时也提升了信噪比,有效降低噪声以及提高语音质量,改善了传统算法下音乐噪声的大量产生。
附图说明
图1为本发明实施例的一种基于先验信噪比的维纳滤波和改进谱减法的语音增强方法的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
本发明实施例的提供了一种基于先验信噪比的维纳滤波和改进谱减法的语音增强方法,如图1所示,包括以下步骤:
S1、输入外部带噪语音信号,假定该待噪语音信号由纯净语音信号与加性噪声语音所组成,并对其进行加窗分帧处理后,其时域下任何一帧的表达如下。
x
其中x
S2、对外部带噪语音信号的任何一帧进行傅里叶变换,并求取其幅值和相位角,不对其进行具体的解释和说明。
其中其频域表达式如下:
X
其中X
S3、基于先验信噪比的维纳滤波算法,将所述外部带噪语音信号进行初步处理,得到初步语音增强信息。
S4、基于改进谱减法的方法,将上一步骤得到的语音信息进行进一步处理,得到二次语音增强信息。
S5、对基于改进谱减法的方法处理后的二次语音增强信息进行反傅里叶变换,得到最终所需的语音增强信号。
本发明的进一步设置,步骤S3包括如下子步骤:
S3-1、根据傅里叶变换后的纯净语音信号得到其频谱估计。
其中纯净语音信号的频谱估计具体如下:
其中为H(δ
S3-2、基于最小均方误差的判别方法,由频谱估计中求解其中的增益函数;
其中对于增益函数H(δ
其中δ
S3-3、最后基于DD判别法,求解增益函数中所需的先验信噪比和后验信噪比,属于常规技术手段,因此本实施例中,不对其进行具体的解释和说明,具体的计算公式如下;
δ
其中|X
需要说明的是,前提假设了s(t)与n(t)互不相关,则可用前导无语音段获得的估计值以及平均法用该噪声段的平均能量来代替噪声段估计,若已知噪声段时长为IS,秒帧数为N,即:
其中δ
本发明的进一步设置,步骤S4包括如下子步骤:
S4-1、根据初步信号增强处理后的初级语音增强信号进行功率谱转换得到纯净语音信息的初步功率谱;
具体来说,根据带噪语音信号在傅里叶变换后的表达式下同时求平方,则可以得到其功率谱的表达式,公式如下:
|x
需要说明的是,该式子在平方后存在S
E[|X
S4-2、采用平均法根据已知的前导无语音段对其进行噪声谱估计,其得到的估计值来代替加性噪声谱;
需要说明的是,由于加性噪声谱在初步处理后是未知的,所以用平均法来估计已知前导无语音段的估计值来代替噪声谱,实际效果等同于步骤S3中所使用的。
S4-3、基于改进谱减法处理,根据加性噪声的噪声谱估计进一步对其纯净语音信号功率谱估计调整机制,并加入相位信息得到最终的二次语音增强信号;
基于改进谱减法的对于纯净语音信号计算机制如下:
其中,a为过减因子,取值范围为3≤a≤6,b为补偿因子,取值范围0≤b<<1,
需要说明的是,a的值越大,可以使得音乐噪声的幅度更小,对残留噪声由更好的效果,更加能有效提取出较为纯净的语音信号。b的值越大,实际上是为了减少在语音信号中的毛刺,它可以保留原有频谱上很小一部分的噪声分量,从而使得人耳对于残留噪声的感觉降低,接受度更高。
参数因子a和b的取值,在不同的背景环境下能带来不同的效果,它们都能直接影响到最终的语音增强效果,若a的值过大,会导致噪声功率谱过大,严重的情况下会导致语音失真;若b的值过大,就会混入大量的背景噪声,降低信噪比的同时又使得听感降低,因此需要折中的方式达到更好的效果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
机译: 基于先验图像的计算机层析成像系统和图像改进方法
机译: 基于改进的中间暗通道先验的除雾方法和装置
机译: 基于动态范围具有降低的饱和度和改进的信噪比的图像捕获方法和装置