首页> 中国专利> 基于快速收敛特性的变步长回声消除方法

基于快速收敛特性的变步长回声消除方法

摘要

本发明公开了一种基于快速收敛特性的变步长回声消除方法,包括对当前帧的远端参考信号x,麦克风接收信号d,分别进行傅里叶变换,得到对应的远端参考频域信号X(k)和麦克风接收频域信号D(k);根据远端参考频域信号X(k)和麦克风接收频域信号D(k),计算先验误差E(k);计算滤波器的传递参数T′i;计算滤波器的更新步长μ(k),并根据更新步长μ(k),对滤波器进行更新;根据更新后的滤波器系数重新对当前帧计算,得到后验误差Ep(k);将后验误差Ep(k)进行反傅里叶变换,并取后半部数据,得到当前帧的时域信号,并返回步骤(A),处理下一帧。本发明在实时语音对话系统及其实时性要求较高的场景下中具有良好的应用前景。

著录项

  • 公开/公告号CN109754813A

    专利类型发明专利

  • 公开/公告日2019-05-14

    原文格式PDF

  • 申请/专利权人 南京时保联信息科技有限公司;

    申请/专利号CN201910231065.X

  • 发明设计人 王青云;姜涛;梁瑞宇;徐飞;丁帆;

    申请日2019-03-26

  • 分类号G10L21/0208(20130101);G10L21/0216(20130101);

  • 代理机构32358 南京创略知识产权代理事务所(普通合伙);

  • 代理人闫方圆

  • 地址 210000 江苏省南京市玄武区珠江路185号

  • 入库时间 2024-02-19 10:10:54

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-25

    授权

    授权

  • 2019-06-07

    实质审查的生效 IPC(主分类):G10L21/0208 申请日:20190326

    实质审查的生效

  • 2019-05-14

    公开

    公开

说明书

技术领域

本发明涉及声学回声抵消技术领域,具体涉及一种基于快速收敛特性的变步长回声消除方法。

背景技术

随着智能语音技术的快速发展,越来越多的智能硬件提供了语音交互的功能,而声学回声抵消性能是检测一个语音交互系统的主要指标。目前,回声抵消的设计主要是在硬件系统上增加一个回声消除芯片,这个回声消除芯片一方面从麦克风获取系统的语音输入;另一方面获取硬件控制单元输出给扬声器的信号作为参考信号。通常麦克风信号是由用户发出的语音指令和智能硬件本身通过扬声器播出的声音混杂形成的信号,而这个参考信号则是扬声器播出的信号,回声抵消器的作用是把麦克风信号中与参考信号相同的部分消除。

声学回声消除的常规方法是采用自适应滤波器来估计扬声器和麦克风之间的声学路径。自适应滤波器的时域算法主要有NLMS算法,AP和RLS算法及其各类改进算法。但对于实时要求极高的语音通讯系统和资源有限的语音终端设备,频域的NLMS的应用更为广泛。但是,固定步长的FDAF算法在收敛速率和稳态失调量存在矛盾,因此,在实时语音会议系统中,变步长方案被广泛应用。这些方案的主要思想是让滤波器根据收敛状态来自适应地更新步长:滤波器处于瞬态时,采用大步长进行更新来获得快速收敛特性,而在稳态时采用小步长以获得较低的稳态失调量。

G.Enzner提出基于声学路径的状态空间(State-Space,SS)建模的方案。该类方案的主要思想是采用一阶马尔科夫模型来近似时变声学路径(LEM),同时,将与之相关的经典滤波理论应用于自适应滤波器的系数更新上。将卡尔曼滤波器的频域实现拆解到频域自适应滤波器(FDAF)模型中,其中,FDAF模型中的更新步长被巧妙替换为卡尔曼增益。该方法同时在收敛速率,稳态失调量和双讲时的鲁棒性取得非常好的平衡。而且,该方法没有过多的参数配置,但是,其路径变化的跟踪能力和稳态失调是一个特别突出的矛盾。FDAF模型中,系统传递参数取值越大,系统稳态失调越小,但应对路径突变时滤波器跟踪能力显著恶化,甚至出现滤波器冻结现象,只有将信道传递参数设置较小,系统才能较好地跟踪突变路径,但其稳态失调却会增大。

因此,如何克服上述问题,增加变步长回声消除的效果,是当前需要解决的。

发明内容

本发明的目的是克服现有技术的缺点。本发明的基于快速收敛特性的变步长回声消除方法,在保证失调量小的情况下,有效提高系统对于回声路径突变时的跟踪性能,计算量小,在实时语音对话系统及其实时性要求较高的场景下中具有良好的应用前景。

为了达到上述目的,本发明所采用的技术方案是:

一种基于快速收敛特性的变步长回声消除方法,包括以下步骤,

步骤(A),对当前帧的远端参考信号x,麦克风接收信号d,分别进行傅里叶变换,得到对应的远端参考频域信号X(k)和麦克风接收频域信号D(k),其中,k为频点标号,不失一般性,若采用N点傅里叶变换,频点标号k的取值为0至N-1;

步骤(B),根据远端参考频域信号X(k)和麦克风接收频域信号D(k),计算先验误差E(k);

步骤(C),计算滤波器的传递参数Ti′;

步骤(D),计算滤波器的更新步长μ(k),并根据更新步长μ(k),对滤波器进行更新;

步骤(E),根据更新后的滤波器系数重新对当前帧计算,得到后验误差Ep(k);

步骤(F),将后验误差Ep(k)进行反傅里叶变换得到时域信号,取后半部数据作为回声消除处理后的最终输出信号e(n),并返回步骤(A),处理下一帧。

前述的基于快速收敛特性的变步长回声消除方法,步骤(B),根据远端参考频域信号X(k)和麦克风接收频域信号D(k),计算先验误差E(k),如公式(1)所示,

其中,为更新的滤波器系数,G为约束因子,该约束因子G保证时域和频域的一致,表达式为公式(2)所示,

前述的基于快速收敛特性的变步长回声消除方法,步骤(C),计算滤波器的传递参数Ti′,包括以下步骤,

(C1),计算当前帧的远端参考信号和误差信号的互功率谱Sxe,远端参考信号的自功率谱密度Sxx,误差信号的自功率谱密度See,并计算估计信号和麦克风接收信号的互功率谱估计信号的目功率谱密度麦克风接收信号的自功率谱密度Sdd,计算过程,如公式(3.1)-(3.5)所示,

Sxe=αSxe+(1-α)X(k)E*(k)(3.1)

Sxx=αSxx+(1-α)X(k)X*(k)(3.2)

See=αSee+(1-α)E(k)E*(k)(3.3)

Sdd=αSdd+(1-α)D(k)D*(k)(3.5)

其中,α为平滑因子,取值为0.93,*为取共轭运算,为估计信号的频域信号;

(C2),根据公式(4),计算远端参考信号和误差信号的相关性测量因子γxe(k),根据公式(5),计算估计信号和麦克风接收信号的相关性测量因子

(C3),根据公式(6),选取γxe(k)的指定频带范围的均值作为滤波器判决因子ζ,

其中,fh=fL+h(fH-fL)/H,[fL,fH]为判决频带范围,fh为第h频点,fL为判决频带的下限,fH为判决频带的上限;

(C4),采用Sigmoid函数和非线性截断函数,将滤波器判决因子ζ映射为软判决因子SD,取值范围限制在[Tmin,η],计算如公式(7)所示,

其中,Tmin为判决因子的最小值,η为判决因子的最大值,β为Sigmoid函数的压缩因子;

(C5),修正传递参数,在滤波器完成初始收敛后,ICflag状态标志位设置为1,软判决因子SD用于修正滤波器的传递参数Ti,其中,i代表频域块编号,为了避免双讲的影响,只有当大于某一阈值τ时,软判决因子SD才对传递参数Ti进行加权,得到修正传递参数Ti′,如计算公式(8)所示,

其中,ICflag为Initial convergence flag,即初始收敛标志位,当系统完成初始收敛后,该值自动置1;阈值τ的取值为0.93。

前述的基于快速收敛特性的变步长回声消除方法,步骤(D),计算滤波器的更新步长μ(k),如公式(9)所示,

其中,T为滤波器的传递参数,取值为[0.99,1],XH(k)是X(k)的共轭转置,P(k)为状态估计误差的方差,如公式(10)所示,

Ψvv为估计,如公式(11)所示,

ΨΔΔ(k)=(1-T2)E[|W(k)|2](11)

其中,W(k)为真实回声路径,为不断估计和更新的滤波器系数。

前述的基于快速收敛特性的变步长回声消除方法,根据更新步长μ(k),对滤波器进行更新,如公式(12)所示,

前述的基于快速收敛特性的变步长回声消除方法,步骤(E),根据更新后的滤波器系数重新对当前帧计算,得到后验误差Ep(k),如公式(13)所示,

本发明的有益效果是:本发明的基于快速收敛特性的变步长回声消除方法,在保证失调量小的情况下,有效提高系统对于回声路径突变时的跟踪性能,计算量小,在实时语音对话系统及其实时性要求较高的场景下中具有良好的应用前景。

具有以下的优点:

(1)通过联合滤波器状态信息,并将其映射加权到滤波器传递参数上,将在保证失调量的情况下,当声学路径发生变化时,滤波器的传递参数T将根据软判决因子SD进行修正,实现滤波器能有效快速跟踪,避免出现滤波器锁死的现象;

(2)在修正滤波器的传递参数时,引入了估计信号和麦克风接收信号的相关性测量因子只有当大于某一阈值时,软判决值才对参数Ti进行加权在该策略能有效避免双讲状态对滤波器传递参数的影响;

(3)该方法较原始的方案增加的计算小,适合实时会议系统或者低功耗的设备。在稳态失调量、收敛的跟踪性能和计算复杂度三者之间取得的平衡较为合适。

附图说明

图1是本发明的的基于快速收敛特性的变步长回声消除方法的流程图。

具体实施方式

下面将结合说明书附图,对本发明作进一步的说明。

本发明的基于快速收敛特性的变步长回声消除方法,通过用一阶马尔科夫模型表征时变声学路径,并用卡尔曼增益替代滤波器的更新步长;计算参考信号和残差的振幅平方相干函数,并将其作为滤波器状态信息;并将滤波器状态信息映射为软判决值,并对信道传递参数进行加权;利用加权的信道传递参数对声学路径进行跟踪,从而快速完成自适应滤波器的收敛过程,如图1所示,具体包括以下步骤,

步骤(A),对当前帧的远端参考信号,麦克风接收信号d,分别进行傅里叶变换,得到对应的远端参考频域信号X(k)和麦克风接收频域信号D(k),其中,k为频点标号,不失一般性,若采用N点傅里叶变换,频点标号k的取值为0至N-1;

步骤(B),根据远端参考频域信号X(k)和麦克风接收频域信号D(k),计算先验误差E(k),如公式(1)所示,

其中,为更新的滤波器系数,G为约束因子,该约束因子G保证时域和频域的一致,表达式为公式(2)所示,

步骤(C),计算滤波器的传递参数T′i,包括以下步骤,

(C1),计算当前帧的远端参考信号和误差信号的互功率谱Sxe,远端参考信号的自功率谱密度Sxx,误差信号的自功率谱密度See,并计算估计信号和麦克风接收信号的互功率谱估计信号的自功率谱密度麦克风接收信号的自功率谱密度Sdd,计算过程,如公式(3.1)-(3.5)所示,

Sxe=αSxe+(1-α)X(k)E*(k)(3.1)

Sxx=αSxx+(1-α)X(k)X*(k)(3.2)

See=αSee+(1-α)E(k)E*(k)(3.3)

Sdd=αSdd+(1-α)D(k)D*(k)(3.5)

其中,α为平滑因子,取值为0.93,*为取共轭运算,为估计信号的频域信号;

(C2),根据公式(4),计算远端参考信号和误差信号的相关性测量因子γxe(k),根据公式(5),计算估计信号和麦克风接收信号的相关性测量因子

(C3),根据公式(6),选取γxe(k)的指定频带范围的均值作为滤波器判决因子ζ,

其中,fh=fL+h(fH-fL)/H,[fL,fH]为判决频带范围,fh为第h频点,fL为判决频带的下限,fH为判决频带的上限;

(C4),采用Sigmoid函数和非线性截断函数,将滤波器判决因子ζ映射为软判决因子SD,取值范围限制在[Tmin,η],计算如公式(7)所示,

其中,Tmin为判决因子的最小值,η为判决因子的最大值,β为Sigmoid函数的压缩因子;

(C5),修正传递参数,在滤波器完成初始收敛后,ICflag状态标志位设置为1,此时软判决因子SD用于修正滤波器的传递参数Ti,其中,i代表频域块编号,为了避免双讲的影响,只有当大于某一阈值τ时,软判决因子SD才对传递参数Ti进行加权,得到修正传递参数Ti′,如计算公式(8)所示,

其中,ICflag(Initial convergence flag)为初始收敛标志位,当系统完成初始收敛后,该值自动置1;阈值τ的取值为0.93;

步骤(D),计算滤波器的更新步长μ(k),并根据更新步长μ(k),对滤波器进行更新,其中,计算滤波器的更新步长μ(k),如公式(9)所示,

其中,T为滤波器的传递参数,一般为[0.99,1],XH(k)为X(k)的共轭转置,P(k)为状态估计误差的方差,如公式(10)所示,

Ψvv为估计,如公式(11)所示,

ΨΔΔ(k)=(1-T2)E[|W(k)|2](11)

其中,W(k)代表真实回声路径,为不断估计和更新的滤波器系数;

根据更新步长μ(k),对滤波器进行更新,如公式(12)所示,

步骤(E),根据更新后的滤波器系数重新对当前帧计算,得到后验误差Ep(k),如公式(13)所示,

步骤(F),将后验误差Ep(k)进行反傅里叶变换得到时域信号,取后半部数据作为回声消除处理后的最终输出信号e(n),理想情况下,e(n)中只含有近端信号,不含扬声器的耦合信号,并返回步骤(A),处理下一帧。

综上所述,本发明的基于快速收敛特性的变步长回声消除方法,在保证失调量小的情况下,有效提高系统对于回声路径突变时的跟踪性能,计算量小,在实时语音对话系统及其实时性要求较高的场景下中具有良好的应用前景,不并具有以下的优点:

(1)通过联合滤波器状态信息,并将其映射加权到滤波器传递参数上,将在保证失调量的情况下,当声学路径发生变化时,滤波器的传递参数T将根据软判决因子SD进行修正,实现滤波器能有效快速跟踪,避免出现滤波器锁死的现象;

(2)在修正滤波器的传递参数时,引入了估计信号和麦克风接收信号的相关性测量因子只有当大于某一阈值时,软判决值才对参数Ti进行加权在该策略能有效避免双讲状态对滤波器传递参数的影响;

(3)该方法较原始的方案增加的计算小,适合实时会议系统或者低功耗的设备。在稳态失调量、收敛的跟踪性能和计算复杂度三者之间取得的平衡较为合适。

以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号