首页> 中国专利> 一种基于改进独立向量分析算法的声信号盲分离方法

一种基于改进独立向量分析算法的声信号盲分离方法

摘要

本发明提供一种基于改进独立向量分析算法的声信号盲分离方法,包括:步骤1,通过M个传感器采集N个源信号的卷积混合信号,以得到M个观测信号;步骤2,通过短时傅里叶变换将所述观测信号从时域转换到频域,并建立基于分离矩阵的频域分离信号模型;步骤3,逐频点对频域的所述观测信号和分离矩阵进行预处理;步骤4,采用基于自适应更新的自然梯度独立向量分析算法逐频点进行盲分离处理,以得到频域的分离信号;步骤5,对频域的分离信号进行逆短时傅里叶变换,以得到时域的分离信号。本发明考虑声信号的卷积混合,自适应更新,能够更精确地恢复源信号,更快达到收敛;算法对更新步长的初始值不敏感,鲁棒性好,稳定性高。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-05-15

    授权

    授权

  • 2017-11-14

    专利申请权的转移 IPC(主分类):G10L21/0272 登记生效日:20171026 变更前: 变更后: 申请日:20170301

    专利申请权、专利权的转移

  • 2017-07-18

    实质审查的生效 IPC(主分类):G10L21/0272 申请日:20170301

    实质审查的生效

  • 2017-06-23

    公开

    公开

说明书

技术领域

本发明涉及盲源分离信号处理领域,特别是涉及一种基于改进独立向量分析算法的声信号盲分离方法。

背景技术

随着数字信号处理理论和技术的发展以及相关学科的不断深入,大量有效的盲分离算法不断被提出,使盲分离问题逐渐成为当今信息处理领域中最热门的研究课题之一。在无线通信、图像处理、地震信号处理、阵列信号处理和生物医学信号处理等领域得到了广泛的应用。盲源分离用于解决瞬时线性混合问题目前已经有很成熟的算法,而且也得到了很好的应用,例如在图像增强和瞬时混合信号分离。

在实际系统中,传感器接收到的信号往往是源信号经过不同时延的线性组合,即传感器得到的观测信号是源信号的卷积和,称为线性卷积混合模型。这种混合模型更接近实际。所以语音信号的混合是典型的卷积混合信号,但是现有算法解决卷积混合信号分离问题并不是很有效,因为混合语音分离问题有其自身的难点,例如很多卷积盲分离算法是针对平稳信号的,而语音信号是典型的非平稳信号,因而关于实际情况中声信号的盲分离是一个亟待解决的难题。

发明内容

针对上述现有技术的不足,本发明提供一种基于改进独立向量分析算法的声信号盲分离方法。

为实现上述目的,本发明采用如下技术方案:

一种基于改进独立向量分析算法的声信号盲分离方法,包括以下步骤:

步骤1,通过M个传感器采集N个源信号的卷积混合信号,以得到M个观测信号;

步骤2,通过短时傅里叶变换将所述观测信号从时域转换到频域,并建立基于分离矩阵的频域分离信号模型;

步骤3,逐频点对频域的所述观测信号和分离矩阵进行预处理;

步骤4,采用基于自适应自然梯度的独立向量分析算法逐频点进行盲分离处理,以得到频域的分离信号;

步骤5,对频域的分离信号进行逆短时傅里叶变换,以得到时域的分离信号。

进一步地,在所述步骤1中,将N个源信号表示为s(t)=[s1(t),s2(t),...,sN(t)]T,M个观测信号表示为x(t)=[x1(t),x2(t),...,xM(t)]T,则在每一时刻t有如下关系式:

在式(1)中,aij(l)表示第i个源信号到第j个传感器的冲激响应,L表示冲激响应的长度,且L<∞。

进一步地,在所述步骤2中,通过短时傅里叶变换将式(1)变换到频域,得到Xf(n)=AfSf(n),并建立频域分离信号模型Yf(n)=Wf·Xf(n);

其中,f表示频点,且f=1,2,…,F,F表示频点数目,Af和Wf分别表示第f个频点对应的混合矩阵和分离矩阵。

进一步地,在所述步骤3中,所述预处理包括使观测信号Xf(n)零均值化和白化,并使分离矩阵Wf正交。

进一步地,在所述步骤4中,所述自适应自然梯度的独立向量分析算法通过以下步骤实现:

步骤41,构建目标函数为:

在式(2)中,q(yi)为分离信号yi的概率密度函数,p(y1…yN)为联合概率密度函数,I为单位矩阵;

步骤42,采用自然梯度更新算法得到分离矩阵Wf,即,令第k+1次迭代公式表示为:

Wf(k+1)=Wf(k)+μ(k)[I-f(yf)(yf)T]Wf(k)(3),

在式(3)中,μ(k)表示更新步长,且μ(k)的表达式如下:

μ(k)=α|1-eβ·RE|(4),

在式(4)中,α和β是经验常数,RE为目标函数的相对误差;

步骤43,根据Yf(n)=Wf·Xf(n)逐频点得到频域的分离信号Yf(n)。

优选地,在所述步骤42中,α取0.7,β取0.3。

进一步地,在所述步骤5中,对Yf(n)进行逆短时傅里叶变换,以得到时域的分离信号。

由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:

本发明利用改进的独立向量分析算法进行声信号的盲分离,相比传统的盲源分离算法,本发明考虑声信号的卷积混合,采用步长自适应的频域盲分离算法,能够更精确地恢复源信号,更快达到收敛条件;而且本发明对更新步长的初始值不敏感,自适应更新,具有很好的鲁棒性,稳定性。本发明在无线通信,雷达信号处理以及声信号处理等领域具有很好的应用前景。

附图说明

图1为本发明一种基于改进独立向量分析算法的声信号盲分离方法的流程图;

图2为本发明一种基于改进独立向量分析算法的声信号盲分离方法的处理框架图;

图3为本发明中采用的自适应更新自然梯度独立向量分析算法的流程图;

图4为本发明一个实例中源信号的波形图;

图5为本发明一个实例中混合信号的波形图;

图6为本发明一个实例中得到的分离信号的波形图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

在现有技术中,对于声音信号的卷积混合基本处理思想为:将观测信号通过STFT变换到频域,然后使用复数域上的瞬时盲源分离算法对每个频段依次进行分离,最后再通过短时傅里叶逆变换ISTFT将分离所得的信号变换回时域。

基于上述内容,本发明提供一种基于改进的独立向量分析(IVA)算法的声信号盲分离方法,如图1所示,本发明的方法包括以下步骤:步骤1,通过M个传感器采集N个独立的源信号的卷积混合信号,得到M个观测信号;步骤2,通过短时傅里叶变换(STFT)将观测信号从时域转换到频域,并建立基于分离矩阵的频域分离信号模型;步骤3,逐频点对频域的观测信号和分离矩阵进行预处理;步骤4,采用基于自然梯度的独立向量分析算法逐频点进行盲分离处理,以得到频域的分离信号;步骤5,对频域的分离信号进行逆短时傅里叶变换,以得到时域的分离信号。

下面结合图2和图3,对本发明各步骤进行详细描述:

在步骤1中,N个源信号表示为s(t)=[s1(t),s2(t),...,sN(t)]T,M个观测信号表示为x(t)=[x1(t),x2(t),...,xN(t)]T,其中,si(t)表示t时刻的第i(i=1,2,…,N)个源信号,xj(t)表示t时刻的第j(j=1,2,…,M)个观测信号。周知的是,观测信号是由N个源信号卷积混合而成,则在每一时刻t都有如下关系式:

式(1)写成向量形式为X(t)=AS(t),aij(t)为混合矩阵A的第i行、第j列的元素。

在式(1)中,aij(l)表示第i个源信号到第j个传感器的冲激响应,L表示冲激响应的长度,理论上L<∞。在一个实施例中,一源信号的波形见图4,一观测信号的波形图见图5。

在步骤2中,本发明采用STFT将观测信号从时域变换到频域,转换为复数瞬时混合问题,建立频域分离信号模型。具体来说,在频域将时域时间t用对应的n表示,n对应于每个短时傅里叶变换,得到频域观测信号Xf(n)=AfSf(n),则可建立对应的频域分离信号模型Yf(n)=Wf·Xf(n)。

其中,f表示频点,f=1,2,…,F,F为频点数目,Af和Wf分别表示第f个频点对应的混合矩阵和分离矩阵。

在步骤3中,预处理包括使观测数据Xf(n)零均值化和白化,并使分离矩阵Wf正交,从而保持Yf(n)均值化和白化。在本发明中,白化处理采用PCA降维方法,目的是去除信号之间的相关性,即保证分离矩阵Wf的各行之间保持正交,以减少复杂度和更好的收敛性。

在步骤4中,本发明采用多元变量目标函数,选择两个函数之间的KL散度(相对熵)来度量信号的独立性。在第f个频点内,构建目标函数为:

在式(2)中,q(yi)为每个分离信号yi的概率密度函数,p(y1…yN)为联合概率密度。

本发明采用了自然梯度更新算法来更新分离矩阵Wf,令第k+1次迭代公式表示为:

Wf(k+1)=Wf(k)+μ(k)[I-f(yf)(yf)T]Wf(k)(3),

其中,I为单位矩阵;认为分离信号服从多元变量超高斯分布,

特别地,本发明采用了如下步长自适应更新公式:

μ(k)=α|1-eβ·RE|(4),

其中α和β是经验常数,一般α取0.7,β取0.3,收敛条件是目标函数的相对误差小于10-6。RE为目标函数的相对误差,第k次迭代时对应的RE即为目标函数在第k次迭代时的瞬时估计值与在第k-1次迭代时的瞬时估计值之差。利用本发明的自适应算法迭代约25次就能达到收敛,比未改进的IVA算法快了很多倍。

然后,根据Yf(n)=Wf·Xf(n)逐频点对频域观测信号进行源信号恢复,得到频域的分离信号Yf(n)。

在步骤5中,对频域的分离信号Yf(n)进行逆短时傅里叶变换,即可得到时域的分离信号。输出的分离信号语音可懂度高,其波形图见图5。

不难发现,本发明采用改进独立向量分析算法,充分利用了源信号在频段间的相关信息,同时采用自适应步长更新的自然梯度算法。相比现有的盲源分离算法,能够有效分离实际卷积混合的声音信号,并且算法结构简单,收敛更快,鲁棒性好,稳定性高。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号