首页> 中国专利> 基于Hilbert变换的欠定声音信号分离方法及装置

基于Hilbert变换的欠定声音信号分离方法及装置

摘要

本发明公开了一种基于Hilbert变换的欠定盲源声音信号分离方法及装置,属于欠定盲信号处理技术领域;该方法包括以下步骤:一,对采集的混合声音信号进行去噪预处理;二,将经过步骤一预处理后的声音信号进行Hilbert变换;三,对经过步骤二变换后的信号进行微分处理,并将经过微分处理后得到的信号与采集的声音信号进行合成,形成非欠定声音信号;四,根据得到的非欠定声音信号确定源声音信号数目;五,根据源声音信号数目将非欠定声音信号转换为适定信号;六,对得到的适定信号进行独立分量分析;该方法能够方便、高效地对欠定盲声音信号进行分离,且适用于多种源信号,具有抗噪性好,分离信号彻底、唯一等优点。

著录项

  • 公开/公告号CN103198836A

    专利类型发明专利

  • 公开/公告日2013-07-10

    原文格式PDF

  • 申请/专利权人 机械工业第三设计研究院;

    申请/专利号CN201310052607.X

  • 发明设计人 毛伟;宋斌华;

    申请日2013-02-18

  • 分类号G10L21/0272;

  • 代理机构北京同恒源知识产权代理有限公司;

  • 代理人赵荣之

  • 地址 400041 重庆市九龙坡区石桥铺渝州路十七号

  • 入库时间 2024-02-19 19:20:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-02-08

    未缴年费专利权终止 IPC(主分类):G10L21/0272 专利号:ZL201310052607X 申请日:20130218 授权公告日:20150429

    专利权的终止

  • 2015-04-29

    授权

    授权

  • 2013-08-07

    实质审查的生效 IPC(主分类):G10L21/0272 申请日:20130218

    实质审查的生效

  • 2013-07-10

    公开

    公开

说明书

技术领域

本发明属于欠定盲信号处理技术领域,涉及一种基于Hilbert变换的欠定盲源声音信号 分离方法及装置。

背景技术

盲信号分离(Blind source separation)技术兴起于20世纪80年代,是根据一组混合 的采集信号恢复源信号。盲信号分离技术在混合声音信号处理中的典型应用是解决“鸡尾酒 会”问题,即在多个说话人环境中分离某个说话人的声音。按照采集信号和源信号的相对数 量不同,盲信号分离分为欠定盲信号分离和非欠定盲信号分离。采集信号数目M小于源信号 数目N的情况为欠定盲信号分离,采集信号数目M大于或等于源信号数目N的情况为超定或 适定盲信号分离。

欠定盲信号分离是一个更符合实际情况、更具有挑战性的问题,它要求采集信号个数少 于源信号个数,更符合实际应用的需要。

独立分量分析(Independent components analysis,ICA),也称独立成分分析,是一种 近几年才发展起来的利用统计原理进行计算的方法。它是一个线性变换,这个变换把数据或 信号分离成统计独立的非高斯的信号源的线性组合。由于主成分分析(Principal Component  Analysi,PCA)和奇异值分解(Singular Value Decomposition,SVD)是基于信号二阶统计 特性的分析方法,其目的是去除信号各分量之间的相关性,主要用于数据的压缩。而ICA则 是基于信号高阶统计特性的分析方法,经ICA分离出的各信号分量之间是相互独立的,正是 因为这一特点,ICA在信号处理领域受到了广泛的关注。ICA模型的主要方法有非高斯最大化、 互信息最小化和最大似然函数估计。

ICA适用于适定盲信号分离,对于欠定盲信号分离,ICA显得无能为力。若进行分离,得 到的各信号分量不是源信号,而是多个源信号的叠加,分离不彻底、不唯一。本发明正是在 此背景下提出的。

发明内容

有鉴于此,本发明的目的在于提供一种基于Hilbert变换的欠定盲源声音信号分离方法 及装置,该方法通过Hilbert变换、信号微分和信号合成等,将欠定盲信号变成非欠定盲信 号,再根据协方差矩阵和奇异值分解确定源信号数目,将非欠定盲信号变为适定盲信号,然 后采用ICA恢复源信号;该方法能够方便、高效地对欠定盲信号进行分离。

为达到上述目的,本发明提供如下技术方案:

一种基于Hilbert变换的欠定盲源声音信号分离方法,包括以下步骤:步骤一:对采集 的混合声音信号进行去噪预处理;步骤二:将经过步骤一预处理后的声音信号进行Hilbert 变换;步骤三:对经过步骤二变换后的信号进行微分处理,并将经过微分处理后得到的信号 与采集的声音信号进行合成,形成非欠定声音信号;步骤四:根据步骤三得到的非欠定声音 信号确定源声音信号数目;步骤五:根据步骤四得到的源声音信号数目将非欠定声音信号转 换为适定信号;步骤六:对步骤五中得到的适定信号进行独立分量分析。

进一步,在步骤一中采用小波变换的方法去除采集的声音信号的噪声。

进一步,所述小波变换的方法包括以下步骤:步骤一:对信号进行小波分解,选择小波 类型并确定分解层次n;步骤二:对小波分解的高频系数进行门限阈值量化处理;步骤三: 根据小波分解的第n层低频系数和经过量化后1至n层高频系数进行小波重构。

进一步,通过MATLAB实现信号去噪,小波函数选sym8,分解层次取3~5层,阈值tptr 设置:固定阈值形式和启发式阈值形式,阈值sorh设置:软门限阈值处理方式。

进一步,步骤四具体包括非欠定采集声音信号协方差矩阵的求解和奇异值分解两部分。

本发明的另一方面提供了一种基于Hilbert变换的欠定盲源声音信号分离装置,技术方 案如下:一种基于Hilbert变换的欠定盲源声音信号分离方法及装置,包括声音信号采集装 置、源信号重构和分离装置、分离信号输出装置;声音信号采集装置用于对混合声音信号进 行采集,并将采集到的信号传送至源信号重构和分离装置;源信号重构和分离装置用于对采 集的混合声音信号进行重构处理,将欠定声音信号转换为适定声音信号并进行分离;分离信 号输出装置用于将经过源信号重构和分离装置分离的声音信号进行输出。

进一步,所述声音信号采集装置采用理音多通道振动数据采集器SA-02进行多通道声音 信号采集,将采集到的源声音信号保存为*.wav格式文件,然后通过MATLAB程序语言wavread 读入,形成数字信号。

进一步,所述源信号重构和分离装置包括噪声处理模块、Hilbert变换模块、信号微分 及合成模块、信号数目确定模块和独立分量分析模块;噪声处理模块对采集的混合声音信号 进行去噪处理;Hilbert变换模块对经过去噪处理后的声音信号进行Hilbert变换;信号微 分及合成模块对经过Hilbert变换后的声音信号进行微分处理,再将微分处理后的声音信号 与采集的混合声音信号合成为非欠定声音信号;信号数目确定模块用于根据非欠定声音信号 确定源声音信号数目,并根据得到的源声音信号数目将非欠定采集声音信号转换为适定信号; 独立分量分析模块对适定信号进行独立分量分析,分离出源声音信号。

本发明的有益效果在于:采用本发明所述的基于Hilbert变换的欠定盲源声音信号分离 方法能够方便、高效地对欠定盲声音信号进行分离,且适用于多种源信号,具有抗噪性好, 分离信号彻底、唯一等优点。

附图说明

为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:

图1为本发明所述方法的流程图;

图2为实验1源声音信号图;

图3为实验1采集信号图;

图4为实验1去噪后采集信号图;

图5为实验1分离的源声音信号图;

图6为实验2采集信号图;

图7为实验2去噪后采集信号图;

图8为实验2分离的源声音信号图。

具体实施方式

下面将结合附图,对本发明的优选实施例进行详细的描述。

图1为本发明所述方法的流程图,本发明所述的基于Hilbert变换的欠定盲源声音信号 分离方法,包括以下步骤:步骤一:对采集的混合声音信号进行去噪预处理;步骤二:将经 过步骤一预处理后的采集声音信号进行Hilbert变换;步骤三:对经过步骤二变换后的信号 进行微分处理,并将经过微分处理后得到的信号与采集的声音信号进行合成,形成非欠定声 音信号;步骤四:根据步骤三得到的非欠定声音信号确定源声音信号数目;步骤五:根据步 骤四得到的源声音信号数目将非欠定声音信号转换为适定信号;步骤六:对步骤五中得到的 适定信号进行独立分量分析。

具体来说,对于未知传输通道、源信号信息情况下接收的声音信号,将其作为采集的混 合声音信号xi(i=1,2,…,M),通过以下步骤分离出的源声音信号(i=1,2,…,N),(其中 M<N≤2M,采集的混合声音信号xi(i=1,2,…,M)和源声音信号si(i=1,2,…,N)长度 均为K):

第一步,对采集的混合声音信号进行去噪预处理,目的是提高信噪比,降低噪声影响。 在本实施例中采用小波变换去除采集的混合声音信号xi(i=1,2,…,M)的噪声。采集的混合 声音信号是一种非平稳信号,而小波变换不仅适用于非平稳信号,而且具有较好的性能。

小波变换去噪基本步骤为:首先对信号进行小波分解,选择小波类型并确定分解层次n; 然后对小波分解的高频系数进行门限阈值量化处理;最后根据小波分解的第n层低频系数和 经过量化后1至n层高频系数进行小波重构,达到消除噪声的目的。

经过对小波变换去噪各种参数的对比研究,在MATLAB中对声音信号的处理采用如下参数 可得到更好的去噪效果:小波函数选sym8,分解层次取3~5层,阈值tptr设置:固定阈值 形式(sqtwolog)和启发式阈值形式(heursure),阈值sorh设置:软门限阈值处理方式。

第二步,将经过步骤一预处理后的混合声音信号进行Hilbert变换。Hilbert变换 作为一种常用的线性变换,对任一实时间信号x(t),其Hilbert变换的数学描述为

x^(t)=1π-x(τ)t-τ=x(t)*h(t)---(1)

式中,“*”表示线性卷积,h(t)=1/πt称为Hilbert变换器或Hilbert滤波器。Hilbert 滤波器是幅频特性为1的全通滤波器,实信号x(t)通过后,其负频率成分作+90°相移, 正频率成分作-90°相移,而信号频谱的幅值保持不变。

因此,对采集的混合声音信号xi(i=1,2,…,M)进行Hilbert变换,得到(i=1,2,…,M)。

第三步,对经过步骤二变换后的信号进行微分处理,并将经过微分处理后得到的信 号与采集的混合声音信号进行合成,形成非欠定声音信号。在本步骤中,先对变换后的 信号(i=1,2,…,M)进行微分,得到(i=1,2,…,M);再将采集的混合声音信号xi(i=1,2,…,M)和信号(i=1,2,…,M)组合到一起,得到非欠定信号,即(i=1,2,…,2M)。

第四步,确定源声音信号数目。求非欠定信号(i=1,2,…,2M)的协方差矩阵C2M×2M。 信号和(i,j=1,2,…,2M)的协方差为:

cov(x~i,x~j)=Σk=1K(x~ik-xi)(x~jk-xj)K-1---(2)

式中,i,j=1,2,…,2M

xi=Σk=1Kx~ikK,xj=Σk=1Kx~jkK---(3)

从而,协方差矩阵C2M×2M为:

C2M×2M=(cij,cij=cov(x~i,x~j))---(4)

对协方差矩阵C2M×2M进行奇异值分解(SVD),得到矩阵的奇异值σii,i=1,2,…,2M,奇异 值由大到小排列。如果存在整数N,使得

σN>1000σN+1,N=1,2,…,2M-1    (5)

则源声音信号数目为N;如果不存在整数N满足式(5),则源声音信号数目N=2M。

第五步,根据源声音信号数目将非欠定声音信号转换为适定信号。若源声音信号数目为 N<2M,则在协方差矩阵C2M×2M主对角元素cii(i=M+1,M+2,…,2M)中选取数值较大的前 2M-N个,并去掉对应信号从而得到(i=1,2,…,N)。

第六步,独立分量分析。根据ICA理论,设混合矩阵为A,源声音信号为S,处理后采 集声音信号则

X~=AS---(6)

在分离矩阵W已知的情况下,根据处理后采集声音信号可以得到重构源声音信号即

S~=WX~---(7)

分离矩阵W的确定:根据非高斯最大化、互信息最小化或最大似然函数估计要求,确定 的相应准则函数,按照一定的步长、方向或随机梯度进行搜索,得到相应准则函数的极值, 从而确定最优分离矩阵W。

本发明的另一方面提供了一种基于Hilbert变换的欠定盲源声音信号分离装置,包括声 音信号采集装置、源信号重构和分离装置、分离信号输出装置;声音信号采集装置用于对采 集的混合声音信号进行采集,并将采集到的信号传送至源信号重构和分离装置;源信号重构 和分离装置用于对采集的混合声音信号进行重构处理,将欠定声音信号转换为适定声音信号 并进行分离;分离信号输出装置用于将经过源信号重构和分离装置分离的声音信号进行输出。

所述源信号重构和分离装置包括噪声处理模块、Hilbert变换模块、信号微分及合成模 块、信号数目确定模块和独立分量分析模块;噪声处理模块对采集的源声音信号进行去噪处 理;Hilbert变换模块对经过去噪处理后的源声音信号进行Hilbert变换;信号微分及合成 模块对经过Hilbert变换后的声音信号进行微分处理,再将微分处理后的声音信号与采集的 混合声音信号合成为非欠定声音信号;信号数目确定模块用于根据非欠定声音信号确定源声 音信号数目,并根据得到的源声音信号数目将非欠定声音信号转换为适定信号;独立分量分 析模块对适定信号进行独立分量分析,分离出源声音信号。

在本实施例中,所述声音信号采集装置采用理音多通道振动数据采集器SA-02进行多通 道声音信号采集,将采集到的源声音信号保存为*.wav格式文件,然后通过MATLAB程序语言 wavread读入,形成数字信号。

为了对本发明的实施效果进一步说明,现例举以下实验数据及指标,但不构成对本发明 的限制。

实验1:

选取两段*.wav格式源声音文件,其中一段为读书声,记为s1,另一段为歌声,记为s2。 通过MATLAB程序语言wavread读入,形成数字信号,信号时长为2秒,采样频率为96kHz, 源声音信号如图2所示。混合信号取为x1=0.8s1+0.5s2,并加入10db高斯白噪声,即为采集 信号,如图3所示。根据本发明方法,对采集信号进行去噪处理,去噪后信号如图4所示。 然后经Hilbert变换、信号微分、信号合成、协方差矩阵,奇异值分解确定源声音信号数目 为2,然后经过ICA分离得到分离的源声音信号和如图5所示。对分离出的源声音信 号和通过MATLAB程序语言wavwrite输出,生成*.wav格式文件。与初始*.wav格式源 声音文件进行试听比较,发现人耳较难发现二者差异,进而说明本发明方法可行、有效,抗 噪性好。

实验2:

在某声音采集实验室,采用理音多通道振动及噪音声音信号分析仪测振仪数据采集器 SA-02进行3个通道声音信号采集,声音信号为多种声源的混合声音信号,保存为*.wav格式 文件,然后通过MATLAB程序语言wavread读入,形成数字信号,信号时长为2秒,采样频率 为96kHz,即为采集信号x1,x2和x3,如图6所示。

根据本发明方法,对采集信号进行去噪处理,去噪后信号如图7所示。然后经Hilbert 变换、信号微分、信号合成、协方差矩阵,奇异值分解确定源声音信号数目为4,然后经过 ICA分离得到分离的源声音信号和如图8所示。

对分离出的源声音信号和通过MATLAB程序语言wavwrite输出,生成*.wav 格式文件。进行试听发现,分离出的源声音信号和分别为吹风机响声、音乐声、 男声朗诵声和敲桌子声,进而说明本发明方法可行、有效。

最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述 优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和 细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号