首页> 中国专利> 基于Hilbert变换的欠定声音信号分离方法及装置

基于Hilbert变换的欠定声音信号分离方法及装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于Hilbert变换的欠定盲源声音信号分离方法及装置，属于欠定盲信号处理技术领域；该方法包括以下步骤：一，对采集的混合声音信号进行去噪预处理；二，将经过步骤一预处理后的声音信号进行Hilbert变换；三，对经过步骤二变换后的信号进行微分处理，并将经过微分处理后得到的信号与采集的声音信号进行合成，形成非欠定声音信号；四，根据得到的非欠定声音信号确定源声音信号数目；五，根据源声音信号数目将非欠定声音信号转换为适定信号；六，对得到的适定信号进行独立分量分析；该方法能够方便、高效地对欠定盲声音信号进行分离，且适用于多种源信号，具有抗噪性好，分离信号彻底、唯一等优点。

著录项

公开/公告号CN103198836A

专利类型发明专利
公开/公告日2013-07-10

原文格式PDF
申请/专利权人机械工业第三设计研究院;
展开▼

申请/专利号CN201310052607.X
发明设计人毛伟;宋斌华;
展开▼

申请日2013-02-18
分类号G10L21/0272;
代理机构北京同恒源知识产权代理有限公司;
代理人赵荣之
地址 400041 重庆市九龙坡区石桥铺渝州路十七号
入库时间 2024-02-19 19:20:08

法律信息

法律状态公告日

法律状态信息

法律状态
2022-02-08

未缴年费专利权终止 IPC(主分类):G10L21/0272 专利号:ZL201310052607X 申请日:20130218 授权公告日:20150429

专利权的终止
2015-04-29

授权

授权
2013-08-07

实质审查的生效 IPC(主分类):G10L21/0272 申请日:20130218

实质审查的生效
2013-07-10

公开

公开

说明书

技术领域

本发明属于欠定盲信号处理技术领域，涉及一种基于Hilbert变换的欠定盲源声音信号分离方法及装置。

背景技术

盲信号分离（Blind source separation）技术兴起于20世纪80年代，是根据一组混合的采集信号恢复源信号。盲信号分离技术在混合声音信号处理中的典型应用是解决“鸡尾酒会”问题，即在多个说话人环境中分离某个说话人的声音。按照采集信号和源信号的相对数量不同，盲信号分离分为欠定盲信号分离和非欠定盲信号分离。采集信号数目M小于源信号数目N的情况为欠定盲信号分离，采集信号数目M大于或等于源信号数目N的情况为超定或适定盲信号分离。

欠定盲信号分离是一个更符合实际情况、更具有挑战性的问题，它要求采集信号个数少于源信号个数，更符合实际应用的需要。

独立分量分析（Independent components analysis，ICA），也称独立成分分析，是一种近几年才发展起来的利用统计原理进行计算的方法。它是一个线性变换，这个变换把数据或信号分离成统计独立的非高斯的信号源的线性组合。由于主成分分析(Principal Component Analysi，PCA)和奇异值分解（Singular Value Decomposition，SVD）是基于信号二阶统计特性的分析方法，其目的是去除信号各分量之间的相关性，主要用于数据的压缩。而ICA则是基于信号高阶统计特性的分析方法，经ICA分离出的各信号分量之间是相互独立的，正是因为这一特点，ICA在信号处理领域受到了广泛的关注。ICA模型的主要方法有非高斯最大化、互信息最小化和最大似然函数估计。

ICA适用于适定盲信号分离，对于欠定盲信号分离，ICA显得无能为力。若进行分离，得到的各信号分量不是源信号，而是多个源信号的叠加，分离不彻底、不唯一。本发明正是在此背景下提出的。

发明内容

有鉴于此，本发明的目的在于提供一种基于Hilbert变换的欠定盲源声音信号分离方法及装置，该方法通过Hilbert变换、信号微分和信号合成等，将欠定盲信号变成非欠定盲信号，再根据协方差矩阵和奇异值分解确定源信号数目，将非欠定盲信号变为适定盲信号，然后采用ICA恢复源信号；该方法能够方便、高效地对欠定盲信号进行分离。

为达到上述目的，本发明提供如下技术方案：

一种基于Hilbert变换的欠定盲源声音信号分离方法，包括以下步骤：步骤一：对采集的混合声音信号进行去噪预处理；步骤二：将经过步骤一预处理后的声音信号进行Hilbert 变换；步骤三：对经过步骤二变换后的信号进行微分处理，并将经过微分处理后得到的信号与采集的声音信号进行合成，形成非欠定声音信号；步骤四：根据步骤三得到的非欠定声音信号确定源声音信号数目；步骤五：根据步骤四得到的源声音信号数目将非欠定声音信号转换为适定信号；步骤六：对步骤五中得到的适定信号进行独立分量分析。

进一步，在步骤一中采用小波变换的方法去除采集的声音信号的噪声。

进一步，所述小波变换的方法包括以下步骤：步骤一：对信号进行小波分解，选择小波类型并确定分解层次n；步骤二：对小波分解的高频系数进行门限阈值量化处理；步骤三：根据小波分解的第n层低频系数和经过量化后1至n层高频系数进行小波重构。

进一步，通过MATLAB实现信号去噪，小波函数选sym8，分解层次取3～5层，阈值tptr 设置：固定阈值形式和启发式阈值形式，阈值sorh设置：软门限阈值处理方式。

进一步，步骤四具体包括非欠定采集声音信号协方差矩阵的求解和奇异值分解两部分。

本发明的另一方面提供了一种基于Hilbert变换的欠定盲源声音信号分离装置，技术方案如下：一种基于Hilbert变换的欠定盲源声音信号分离方法及装置，包括声音信号采集装置、源信号重构和分离装置、分离信号输出装置；声音信号采集装置用于对混合声音信号进行采集，并将采集到的信号传送至源信号重构和分离装置；源信号重构和分离装置用于对采集的混合声音信号进行重构处理，将欠定声音信号转换为适定声音信号并进行分离；分离信号输出装置用于将经过源信号重构和分离装置分离的声音信号进行输出。

进一步，所述声音信号采集装置采用理音多通道振动数据采集器SA-02进行多通道声音信号采集，将采集到的源声音信号保存为*.wav格式文件，然后通过MATLAB程序语言wavread 读入，形成数字信号。

进一步，所述源信号重构和分离装置包括噪声处理模块、Hilbert变换模块、信号微分及合成模块、信号数目确定模块和独立分量分析模块；噪声处理模块对采集的混合声音信号进行去噪处理；Hilbert变换模块对经过去噪处理后的声音信号进行Hilbert变换；信号微分及合成模块对经过Hilbert变换后的声音信号进行微分处理，再将微分处理后的声音信号与采集的混合声音信号合成为非欠定声音信号；信号数目确定模块用于根据非欠定声音信号确定源声音信号数目，并根据得到的源声音信号数目将非欠定采集声音信号转换为适定信号；独立分量分析模块对适定信号进行独立分量分析，分离出源声音信号。

本发明的有益效果在于：采用本发明所述的基于Hilbert变换的欠定盲源声音信号分离方法能够方便、高效地对欠定盲声音信号进行分离，且适用于多种源信号，具有抗噪性好，分离信号彻底、唯一等优点。

附图说明

为了使本发明的目的、技术方案和有益效果更加清楚，本发明提供如下附图进行说明：

图1为本发明所述方法的流程图；

图2为实验1源声音信号图；

图3为实验1采集信号图；

图4为实验1去噪后采集信号图；

图5为实验1分离的源声音信号图；

图6为实验2采集信号图；

图7为实验2去噪后采集信号图；

图8为实验2分离的源声音信号图。

具体实施方式

下面将结合附图，对本发明的优选实施例进行详细的描述。

图1为本发明所述方法的流程图，本发明所述的基于Hilbert变换的欠定盲源声音信号分离方法，包括以下步骤：步骤一：对采集的混合声音信号进行去噪预处理；步骤二：将经过步骤一预处理后的采集声音信号进行Hilbert变换；步骤三：对经过步骤二变换后的信号进行微分处理，并将经过微分处理后得到的信号与采集的声音信号进行合成，形成非欠定声音信号；步骤四：根据步骤三得到的非欠定声音信号确定源声音信号数目；步骤五：根据步骤四得到的源声音信号数目将非欠定声音信号转换为适定信号；步骤六：对步骤五中得到的适定信号进行独立分量分析。

具体来说，对于未知传输通道、源信号信息情况下接收的声音信号，将其作为采集的混合声音信号x_i（i＝1,2,…,M），通过以下步骤分离出的源声音信号（i＝1，2,…,N），（其中 M＜N≤2M，采集的混合声音信号x_i（i＝1,2,…,M）和源声音信号s_i（i＝1,2,…,N）长度均为K）：

第一步，对采集的混合声音信号进行去噪预处理，目的是提高信噪比，降低噪声影响。在本实施例中采用小波变换去除采集的混合声音信号x_i（i＝1,2,…,M）的噪声。采集的混合声音信号是一种非平稳信号，而小波变换不仅适用于非平稳信号，而且具有较好的性能。

小波变换去噪基本步骤为：首先对信号进行小波分解，选择小波类型并确定分解层次n；然后对小波分解的高频系数进行门限阈值量化处理；最后根据小波分解的第n层低频系数和经过量化后1至n层高频系数进行小波重构，达到消除噪声的目的。

经过对小波变换去噪各种参数的对比研究，在MATLAB中对声音信号的处理采用如下参数可得到更好的去噪效果：小波函数选sym8，分解层次取3～5层，阈值tptr设置：固定阈值形式(sqtwolog)和启发式阈值形式(heursure)，阈值sorh设置：软门限阈值处理方式。

第二步，将经过步骤一预处理后的混合声音信号进行Hilbert变换。Hilbert变换作为一种常用的线性变换，对任一实时间信号x(t)，其Hilbert变换的数学描述为

$\hat{x} (t) = \frac{1}{π} \int_{- \infty}^{\infty} \frac{x (τ)}{t - τ} dτ = x (t) * h (t) - - - (1)$

式中，“*”表示线性卷积，h(t)＝1/πt称为Hilbert变换器或Hilbert滤波器。Hilbert 滤波器是幅频特性为1的全通滤波器，实信号x(t)通过后，其负频率成分作+90°相移，正频率成分作-90°相移，而信号频谱的幅值保持不变。

因此，对采集的混合声音信号x_i（i＝1,2,…,M）进行Hilbert变换，得到（i＝1,2,…,M）。

第三步，对经过步骤二变换后的信号进行微分处理，并将经过微分处理后得到的信号与采集的混合声音信号进行合成，形成非欠定声音信号。在本步骤中，先对变换后的信号（i＝1,2,…,M）进行微分，得到（i＝1,2,…,M）；再将采集的混合声音信号x_i（i＝1,2,…,M）和信号（i＝1,2,…,M）组合到一起，得到非欠定信号，即（i＝1,2,…,2M）。

第四步，确定源声音信号数目。求非欠定信号（i＝1,2,…,2M）的协方差矩阵C_2M×2M。信号和（i,j＝1,2,…,2M）的协方差为：

$cov ({\tilde{x}}_{i}, {\tilde{x}}_{j}) = \frac{Σ_{k = 1}^{K} ({\tilde{x}}_{ik} - {\overline{x}}_{i}) ({\tilde{x}}_{jk} - {\overline{x}}_{j})}{K - 1} - - - (2)$

式中，i,j＝1,2,…,2M

${\overline{x}}_{i} = \frac{Σ_{k = 1}^{K} {\tilde{x}}_{ik}}{K}, {\overline{x}}_{j} = \frac{Σ_{k = 1}^{K} {\tilde{x}}_{jk}}{K} - - - (3)$

从而，协方差矩阵C_2M×2M为：

$C_{2 M \times 2 M} = (c_{ij}, c_{ij} = cov ({\tilde{x}}_{i}, {\tilde{x}}_{j})) - - - (4)$

对协方差矩阵C_2M×2M进行奇异值分解（SVD），得到矩阵的奇异值σ_ii,i＝1,2,…,2M，奇异值由大到小排列。如果存在整数N，使得

σ_N＞1000σ_N+1,N＝1,2,…,2M-1 （5）

则源声音信号数目为N；如果不存在整数N满足式（5），则源声音信号数目N＝2M。

第五步，根据源声音信号数目将非欠定声音信号转换为适定信号。若源声音信号数目为 N＜2M，则在协方差矩阵C_2M×2M主对角元素c_ii(i＝M+1,M+2,…,2M)中选取数值较大的前 2M-N个，并去掉对应信号从而得到（i＝1,2,…,N）。

第六步，独立分量分析。根据ICA理论，设混合矩阵为A，源声音信号为S，处理后采集声音信号则

$\tilde{X} = AS - - - (6)$

在分离矩阵W已知的情况下，根据处理后采集声音信号可以得到重构源声音信号即

$\tilde{S} = W \tilde{X} - - - (7)$

分离矩阵W的确定：根据非高斯最大化、互信息最小化或最大似然函数估计要求，确定的相应准则函数，按照一定的步长、方向或随机梯度进行搜索，得到相应准则函数的极值，从而确定最优分离矩阵W。

本发明的另一方面提供了一种基于Hilbert变换的欠定盲源声音信号分离装置，包括声音信号采集装置、源信号重构和分离装置、分离信号输出装置；声音信号采集装置用于对采集的混合声音信号进行采集，并将采集到的信号传送至源信号重构和分离装置；源信号重构和分离装置用于对采集的混合声音信号进行重构处理，将欠定声音信号转换为适定声音信号并进行分离；分离信号输出装置用于将经过源信号重构和分离装置分离的声音信号进行输出。

所述源信号重构和分离装置包括噪声处理模块、Hilbert变换模块、信号微分及合成模块、信号数目确定模块和独立分量分析模块；噪声处理模块对采集的源声音信号进行去噪处理；Hilbert变换模块对经过去噪处理后的源声音信号进行Hilbert变换；信号微分及合成模块对经过Hilbert变换后的声音信号进行微分处理，再将微分处理后的声音信号与采集的混合声音信号合成为非欠定声音信号；信号数目确定模块用于根据非欠定声音信号确定源声音信号数目，并根据得到的源声音信号数目将非欠定声音信号转换为适定信号；独立分量分析模块对适定信号进行独立分量分析，分离出源声音信号。

在本实施例中，所述声音信号采集装置采用理音多通道振动数据采集器SA-02进行多通道声音信号采集，将采集到的源声音信号保存为*.wav格式文件，然后通过MATLAB程序语言 wavread读入，形成数字信号。

为了对本发明的实施效果进一步说明，现例举以下实验数据及指标，但不构成对本发明的限制。

实验1：

选取两段*.wav格式源声音文件，其中一段为读书声，记为s₁，另一段为歌声，记为s₂。通过MATLAB程序语言wavread读入，形成数字信号，信号时长为2秒，采样频率为96kHz，源声音信号如图2所示。混合信号取为x₁＝0.8s₁+0.5s₂，并加入10db高斯白噪声，即为采集信号，如图3所示。根据本发明方法，对采集信号进行去噪处理，去噪后信号如图4所示。然后经Hilbert变换、信号微分、信号合成、协方差矩阵，奇异值分解确定源声音信号数目为2，然后经过ICA分离得到分离的源声音信号和如图5所示。对分离出的源声音信号和通过MATLAB程序语言wavwrite输出，生成*.wav格式文件。与初始*.wav格式源声音文件进行试听比较，发现人耳较难发现二者差异，进而说明本发明方法可行、有效，抗噪性好。

实验2：

在某声音采集实验室，采用理音多通道振动及噪音声音信号分析仪测振仪数据采集器 SA-02进行3个通道声音信号采集，声音信号为多种声源的混合声音信号，保存为*.wav格式文件，然后通过MATLAB程序语言wavread读入，形成数字信号，信号时长为2秒，采样频率为96kHz，即为采集信号x₁,x₂和x₃，如图6所示。

根据本发明方法，对采集信号进行去噪处理，去噪后信号如图7所示。然后经Hilbert 变换、信号微分、信号合成、协方差矩阵，奇异值分解确定源声音信号数目为4，然后经过 ICA分离得到分离的源声音信号和如图8所示。

对分离出的源声音信号和通过MATLAB程序语言wavwrite输出，生成*.wav 格式文件。进行试听发现，分离出的源声音信号和分别为吹风机响声、音乐声、男声朗诵声和敲桌子声，进而说明本发明方法可行、有效。

最后说明的是，以上优选实施例仅用以说明本发明的技术方案而非限制，尽管通过上述优选实施例已经对本发明进行了详细的描述，但本领域技术人员应当理解，可以在形式上和细节上对其作出各种各样的改变，而不偏离本发明权利要求书所限定的范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于Hilbert变换的欠定声音信号分离方法及装置 [P] . 中国专利： CN103198836B . 2015.04.29
2. 基于Hilbert变换的欠定声音信号分离方法及装置 [P] . 中国专利： CN103198836A . 2013-07-10
3. ACOUSTIC SIGNAL SEPARATION DEVICE, ACOUSTIC SIGNAL SEPARATION METHOD, AND ACOUSTIC SIGNAL SEPARATION PROGRAM [P] . 日本专利： JP2015031889A . 2015-02-16

机译：声音信号分离装置，声音信号分离方法以及声音信号分离程序
4. Apparatus, method, and computer-readable recording medium for measuring the magnitude of an electrocardiogram signal using Hilbert transform [P] . KR20210110724A . 2021-09-08

机译：用于测量使用HILBERT变换的电磁图信号的幅度的装置，方法和计算机可读记录介质
5. Method for transformation and quantization based on transformation mode and apparatus for transformation and quantization based on transformation mode [P] . 韩国专利： KR101760779B1 . 2017-07-25

机译：基于变换模式的变换量化方法及基于变换模式的变换量化装置