首页> 中国专利> 一种干扰信号与语音调制信号混叠的窄带干扰识别方法

一种干扰信号与语音调制信号混叠的窄带干扰识别方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及数字信号处理领域的语音信号干扰处理技术，特别涉及语音信号窄带干扰的识别方法。本发明首先对接收语音信号进行分块处理，然后对块内信号做FFT变换，利用语音信号与干扰信号频域响应幅度和宽度上的差异性对语音载频、干扰频率和干扰个数进行预识别，然后再利用前面的块记录中干扰源和干扰频点出现次数最多的组合来对窄带干扰进行最终识别，块间记录的统计信息能进一步的提高正确识别结果。本发明尤其适用于窄带干扰的识别。

著录项

公开/公告号CN104361892A

专利类型发明专利
公开/公告日2015-02-18

原文格式PDF
申请/专利权人电子科技大学;同方电子科技有限公司;电子科技大学成都研究院;
展开▼

申请/专利号CN201410477810.6
发明设计人黄际彦;徐保根;陆川;万群;饶中初;王碧雯;
展开▼

申请日2014-09-18
分类号G10L21/02(20130101);G10L15/20(20060101);
代理机构成都宏顺专利代理事务所(普通合伙);
代理人李玉兴
地址 611731 四川省成都市高新区(西区)西源大道2006号
入库时间 2023-12-17 03:53:39

法律信息

法律状态公告日

法律状态信息

法律状态
2017-05-17

授权

授权
2015-03-25

实质审查的生效 IPC(主分类):G10L21/02 申请日:20140918

实质审查的生效
2015-02-18

公开

公开

说明书

技术领域

本发明属于数字信号处理领域的语音信号干扰处理技术，特别涉及语音信号窄带干扰的识别方法。

背景技术

无论是军用还是民用,人们都希望利用高科技手段改善语音通信的质量,提高其清晰度和可懂度。在很多理论和应用中，所用的语音数据大部分都是在近似理想的条件下采集的。大多数语音识别和语音编码在开始研究时都要在高保真设备上录制语音，尤其要在无噪环境下录音。然而，当在实际应用时，由于噪声的存在会产生很多问题。比如，环境噪声的污染使得许多语音处理系统的性能急剧恶化。语音识别正在步入实用阶段，但识别系统大都是在安静环境中工作的，在噪声环境中尤其是强噪声环境，语音识别系统的识别率将受到严重影响。而窄带干扰(NBI)普遍存在于各种语音通信系统中,特别是在军事应用中,许多场合噪声干扰还相当严重,严重影响语音通信的质量。

干扰抑制,就是尽可能消除干扰的能量；语音增强,就是从带噪语音中提取尽可能纯净的语音。语音通信系统中的干扰抑制属于语音增强的范畴。语音增强目前已发展成为语音信号处理的一个重要分支。语音增强技术在国外发展较早,近年来国内也做了大量的工作。在近20年,语音增强算法的发展可以概括为以下几个方面:(1)频域研究以谱相减为代表的幅度谱估计算法,围绕减小音乐噪声和残留噪声,减小失真等性能,发展和产生了许多改进的谱相减算法；(2)时域研究围绕滤波器设计,研究诸如自适应陷波、最小均方误差(LMS)等自适应滤波算法；(3)其他变换域或处理空间的算法,例如小波变换和奇异矩阵分解等。

上述语音增强技术的实现是基于干扰信号的识别技术，首先通过干扰信号识别技术将语音信号与干扰信号区分，然后采用频域谱相减方法、时域滤波方法或其他变换域如小波变换等方法去除干扰信号，提取尽可能纯净的语音信号。现有的干扰信号的识别技术都是假设已知语音信号的接收频率，通过信号与干扰不同的频点来区分信号与干扰。而在很多军用或民用场合，特别是如汽车、火车和飞机等高速移动的语音信号接收平台上，多普勒频移严重，语音信号的接收频率相对于发射频率有了较大的频率偏移。由于无法准确预估多普勒频移，因此不能通过语音信号的发射频率来推断语音信号的接收频点，也就无法通过信号与干扰的频率差异性来区分信号与干扰。

发明内容

本发明的目的，就是针对现有语音通信中干扰信号的识别技术需要预知语音信号的接收频率，无法适应高速移动的语音信号接收平台的缺陷，提出一种干扰信号与语音调制信号混叠的窄带干扰识别方法。

本发明的技术方案：一种干扰信号与语音调制信号混叠的窄带干扰识别方法，其特征在于，包括以下步骤：

a.信号分块：对接收的信号进行采样，然后将采样的信号进行分块；

b.窄带干扰预识别，具体包括以下步骤：

b1.将步骤a中分块后所得的块数据内时域信号进行傅里叶频域变换(FFT)变换后得到接收信号的频域响应，然后与预设的接收信号频域响应幅度值门限进行比较，得出大于门限值的频点；这些频点即为载频和干扰信号所在频点，低于门限值的频点为噪声和语音信号的低频部分；频域响应幅度值门限的设定依赖于接收语音信号频域幅度值的统计特征，首先统计块内信号频域幅度值的标准差，然后将频域响应幅度值门限设定为该标准差的s倍，其中s的设置和信号与干扰特性有关。语音信号成分的频率幅度值往往小于载频和窄带干扰的频率幅度值，通过该门限值即可将载频和干扰频点从语音信号中区分出来。语音信号中的窄带干扰一般为单频干扰，其频谱宽度很窄。虽然载频信号一般也是单频信号，但是经过语音信号调制过的载频信号，其频谱宽度得到扩展。因此可比较门限值以上的频谱宽度，最大宽度的频谱对应的频率即为载频信号的频率，其余频谱对应的频率为干扰信号频率。在某些情况下，由于FFT的栅栏效应，可能出现存在两个以上相同宽度的最大频谱，此时通过频谱宽度的判别方法已无法判别，将在后续的窄带干扰最终识别阶段进行判别。

b2.将大于门限值的频点进行分组，其中每一组的频点同属于一个干扰源或载频；计算属于同一个干扰源或者载频的频点个数即可得到该干扰源或者载频的频谱宽度；根据所得的频谱宽度，判断是否存在多个相同宽度的最大频谱，若是，则进入步骤c，若否，则将所得的最大宽度的频谱对应的频率识别为载频信号的频率，其余频谱对应的频率为干扰信号频率，大于门限值的频点分组的个数减去载频个数即为干扰源个数；

c.窄带干扰识别：重复步骤b，依次对步骤a中信号分块所得的每一块数据进行预识别，每次完成步骤b后记录该次预识别的块数据的载频频率、干扰频率和干扰源个数；为根据搜索已经记录的所有块数据的干扰源个数，将出现次数最多的干扰源个数作为本次干扰源个数识别结果；干扰频率为根据搜索已经记录的所有块数据的干扰频率，出现次数最多的干扰频率即为本次干扰信号的频率。由于FFT的栅栏效应，某些情况下在前面窄带干扰预识别阶段利用频谱宽度的识别方法可能无效或识别错误，此时需要利用前面的窄带干扰识别结果记录来修正最终识别结果。窄带干扰一般是由于接受设备造成的，在短时内具有平稳性，即在几秒时间内，干扰源的个数和频率是固定的，因此利用前面的块记录中干扰源和干扰频点出现频率最高的组合来对窄带干扰进行最终识别是可行的

具体的，步骤a中对接收的信号进行采样的采样频率至少为信号载频的2倍，将采样的信号进行分块后的块内样本数为2的指数倍。

按照奈奎斯特采样定理，采样频率需为信号载频的2倍以上，为方便后续频域变换，块内样本数需为2的指数倍，如128、256、512和1024等。块内样本数的设置需要根据时延和性能要求进行，块内样本数越大，识别效果越好，但其造成的语音时延也越大。如采样频率为31.75KHz，每块样本数为512，则语音时延为16ms。

具体的，步骤a中对接收的信号进行采样的采样频率至少为信号载频的3倍。

然而高速移动的语音信号接收平台存在多普勒频移，本方案为了抑制多普勒频移对采样的影响，采样频率需设定为信号载频的3倍以上。

本发明的有益效果为，本发明首先对接收语音信号进行分块处理，然后对块内信号做FFT变换，利用语音信号与干扰信号频域响应幅度和宽度上的差异性对语音载频、干扰频率和干扰个数进行预识别，然后再利用前面的块记录中干扰源和干扰频点出现次数最多的组合来对窄带干扰进行最终识别，块间记录的统计信息能进一步的提高正确识别结果。由于本发明利用语音信号与干扰信号频域响应幅度和宽度上的差异性而不是频率值的差异性来区分语音信号与干扰，该方法无需获知语音信号接收频率和语音接收设备的背景先验信息，适应于语音信号与窄带干扰识别的所有场合(高速或低速接收平台)，计算方法简单，计算量小，易于实现，是一种低成本、高性能的盲语音通信窄带干扰识别技术。

附图说明

图1为本发明的方法流程示意图。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述

如图1所示，本发明的方法首先将接收信号进行采样，按照奈奎斯特采样定理，采样频率需为信号载频的2倍以上，然后将采样后的信号按时延和性能要求进行分块，为方便后续频域变换，块内样本数需为2的指数倍，如128、256、512和1024等；对块内时域信号进行傅里叶频域变换(FFT)得到接收信号的频域响应，根据设定的频域响应幅度值门限，找到大于该门限值的频点。这些频点即为载频和干扰信号所在频点，低于门限值的频点为噪声和语音信号的低频部分。测量高于门限值频点的宽度，最大宽度的频谱对应的频率即为载频信号的频率，其余频谱对应的频率为干扰信号频率。若存在两个以上相同宽度的最大频谱，则不作处理；记录上一步中估计的该块数据的载频频率、干扰频率、和干扰源个数，搜索之前记录，出现次数最多的干扰源个数n作为本次干扰源个数识别结果，再次搜索之前记录，出现次数最多的n个干扰频率即为干扰信号的频率，作为当前块数据干扰信号的识别结果。

本发明方法主要包括一下几个步骤：

A、信号分块：首先将接收信号进行采样，然后将采样后的信号进行分块。按照奈奎斯特采样定理，采样频率需为信号载频的2倍以上，然而高速移动的语音信号接收平台存在多普勒频移，为了抑制多普勒频移对采样的影响，采样频率需设定为信号载频的3倍以上。为方便后续频域变换，块内样本数需为2的指数倍，如128、256、512和1024等。块内样本数的设置需要根据时延和性能要求进行，块内样本数越大，识别效果越好，但其造成的语音时延也越大。如采样频率为31.75KHz，每块样本数为512，则语音时延为16ms。

B、窄带干扰预识别：首先将块内时域信号进行FFT变换得到接收信号的频域响应，然后根据接收信号的设定的频域响应幅度值门限，找出大于该门限值的频点。这些频点即为载频和干扰信号所在频点，低于门限值的频点为噪声和语音信号的低频部分。测量高于门限值频点的宽度，最大宽度的频谱对应的频率即为载频信号的频率，其余频谱对应的频率为干扰信号频率。若存在两个以上相同宽度的最大频谱，则不作处理。频域响应幅度值门限的设定依赖于接收语音信号频域幅度值的统计特征，首先统计块内信号频域幅度值的标准差，然后将频域响应幅度值门限设定为该标准差的s倍，其中s的设置和信号与干扰特性有关。语音信号成分的频率幅度值往往小于载频和窄带干扰的频率幅度值，通过该门限值即可将载频和干扰频点从语音信号中区分出来。语音信号中的窄带干扰一般为单频干扰，其频谱宽度很窄。虽然载频信号一般也是单频信号，但是经过语音信号调制过的载频信号，其频谱宽度得到扩展。因此可比较门限值以上的频谱宽度，最大宽度的频谱对应的频率即为载频信号的频率，其余频谱对应的频率为干扰信号频率。在某些情况下，由于FFT的栅栏效应，可能出现存在两个以上相同宽度的最大频谱，此时通过频谱宽度的判别方法已无法判别，将在后续的窄带干扰最终识别阶段进行判别。

C、窄带干扰最终识别：记录上一步中估计的该块数据的载频频率、干扰频率、和干扰源个数，搜索之前记录，出现次数最多的干扰源个数n作为本次干扰源个数识别结果，再次搜索之前记录，出现次数最多的n个干扰频率即为干扰信号的频率，作为当前块数据干扰信号的识别结果。由于FFT的栅栏效应，某些情况下在前面窄带干扰预识别阶段利用频谱宽度的识别方法可能无效或识别错误，此时需要利用前面的窄带干扰识别结果记录来修正最终识别结果。窄带干扰一般是由于接受设备造成的，在短时内具有平稳性，即在几秒时间内，干扰源的个数和频率是固定的，因此利用前面的块记录中干扰源和干扰频点出现频率最高的组合来对窄带干扰进行最终识别是可行的。

本发明的具体的处理流程为：

将接受的语音信号以f_s的采样频率进行采样，将采样后的时域语音信号分块，块内样本数为N，第t个块内信号为：

y_t＝[y_(t-1)N+1,…,y_tN]^T

对块内时域信号进行FFT，将信号从时域变换到频域，频域输出为：

Y_t＝[Y₁,…,Y_N]^T

统计块内信号频域幅度值的标准差：

$> \sqrt{E {{[| Y_{t} | - E (| Y_{t} |)]}^{2}}}$ >

窄带干扰预识别频域响应幅度值门限的设定为：

$> Th = s \sqrt{E {{[| Y_{t} | - E (| Y_{t} |)]}^{2}}}$ >

其中s的设置和信号与干扰特性有关。寻找频域响应幅度大于该门限的频点，并记录该频点对应的数组下标：

freindex＝[i₁,i₂,…,i_M]^T

其中M为频域响应幅度大于该门限的频点个数。计算干扰源和载频频谱宽度的主要思路是当i_k+1＝i_k+1时，则第i_k和i_k+1个频点属于同一个干扰源或者载频，否则属于不同的干扰源或者载频。若窄带干扰和载频的总个数为L，则根据上述方法，可将freindex重新划分为：

$> freindex = {[{i_{1}, . . ., i_{w_{1}}}, . . ., {i_{M - w_{L} + 1}, . . ., i_{M}}]}^{T}$ >

计算属于同一个干扰源或者载频的频点个数即可得到该干扰源或者载频的频谱宽度：

w＝[w₁,…,w_n,…,w_L]^T

其中

$> w_{n} = length ([i_{(Σ_{j = 1}^{n - 1} w_{j}) + 1}, . . ., i_{Σ_{j = 1}^{n} w_{j}}])$ >

其对应的中心频率为：

f＝[f₁,…,f_n,…,f_L]^T

其中

$> f_{n} = f_{s} \times E [i_{(Σ_{j = 1}^{n - 1} w_{j}) + 1}, . . ., i_{Σ_{j = 1}^{n} w_{j}}] / N$ >

寻找w中最大的值w_max，若只有一个w_max，则其对应的中心频率f_max为载频频率，其余频率为窄带干扰频率。若有多个相同的w_max，则预识别失效，转入下一步操作。将窄带干扰频率和干扰个数存入以下数组：

$> finter = {[{finter}_{11}, . . ., {finter}_{{1 K}_{1}}, . . ., {finter}_{t 1}, . . ., {finter}_{{tk}_{t}}]}^{T}$ >

K＝[K₁,…,K_t]^T

其中为第t块信号的窄带干扰频率预识别结果，K_t为第t块信号的窄带干扰个数预识别结果。在K中搜索出现次数最多的K_mosttimes值，该值即为第t块信号的窄带干扰个数最终识别结果。在finter中搜索出现次数最多的K_mosttimes个干扰频率即为第t块信号的窄带干扰频率的最终识别结果。

实施例：

以一个时长为20s的纯净语音信号进行采样，采样频率f_s为31.75KHz的语音信号为例，采样后信号为：

$> x = {[x_{1}, . . ., x_{{6.35 \times 10}^{5}}]}^{T}$ >

对该信号进行调幅(AM)调制：

$> y_{j} = (A + x_{j}) e^{2 πfc (j - 1) / fs + θ_{s}}, j = 1, . . ., 6.35 \times 10^{5}$ >

$> y = {[y_{1}, . . ., y_{{6.35 \times 10}^{5}}]}^{T}$ >

其中f_c＝2.011KHz为载频频率，A＝max(|x-E(x)|)，θ_s为服从[0,2π]的一个随机相位。对该信号进行归一化得y＝y/σ_y，其中σ_y为y的标准差,对y加入测量噪声:

y＝y+n

其中n是方差为10^-SNR/10的高斯噪声，SNR＝30dB是信噪比。窄带干扰建模为：

$> y_{j} = y_{j} + a_{i} e^{2 π f_{i} (j - 1) / fs + θ_{i}}, j = 1, . . ., 6.25 \times 10^{5}$ >

其中a_i＝10^-ISR/10为窄带干扰幅度，ISR＝10dB为干信比，f_i＝1.5426KHz为窄带干扰频率，θ_i为窄带干扰相位,为服从[0,2π]的一个随机数。

步骤一：信号分块，综合考虑性能和时延要求，将y按每块N＝512个样本点进行分块，此时系统时延为16ms，则第1个块内信号为：

y₁＝[y₁,…,y₅₁₂]^T

步骤二：窄带干扰预识别，对块内时域信号进行FFT，将信号从时域变换到频域，频域输出为：

Y₁＝[Y₁,…,Y₅₁₂]^T

窄带干扰预识别频域响应幅度值门限的设定为：

$> Th = 6 \sqrt{E {{[| Y_{1} | - E (| Y_{1} |)]}^{2}}} = 61.15$ >

寻找频域响应幅度大于该门限的频点，并记录该频点对应的数组下标：

freindex＝[26,33,34]^T

即|Y₂₆|≥Th，|Y₃₃|≥Th和|Y₃₄|≥Th。计算干扰源和载频频谱宽度，将freindex重新划分为：

freindex＝[{26},{33,34}]^T

由上式可知，第1块数据内存在2个主频率分量，其宽度分别为：

w＝[w₁,w₂]^T＝[1,2]^T

其对应的中心频率为：

f＝[f₁,f₂]＝[1.612×10³,2.077×10³]^T

由于w₂＞w₁，因此f₁＝1.612KHz为干扰频率，f₂＝2.077KHz为载频频率，对比f_i和f_c可知，我们的判断是正确的，f₁，f₂，f_i和f_c之间的误差是由于FFT的栅栏效应造成的，增加块内样本点N值可以提高估计精度。将窄带干扰频率和干扰个数存入以下数组：

finter＝[1.612×10³]^T

K＝[1]^T

步骤三：窄带干扰最终识别。由于处理的是第1块内的信号，finter和K中没有之前的记录，因此1.612×10³将作为窄带干扰第1块信号的窄带干扰频率的最终识别结果。重复上述步骤，对后续信号进行处理。

为了进一步验证本发明方法的准确性，采用本实施方式在不同信噪比(SNR)和干信比(ISR)下，当用上述信号对窄带干扰进行识别时，其正确识别率都接近于100％(99.98％)，

表1为ISR＝10dB，不同SNR下得正确识别率：

SNR(dB)102030正确识别率99.98％99.98％99.98％

表2为SNR＝30dB，不同ISR下得正确识别率：

从上述验证结果可以看出：在不同信噪比(SNR)和干信比(ISR)下，本实施方式均能达到99.98％的正确识别率，其正确识别率完全满足常规语音信号处理的要求。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种干扰信号与语音调制信号混叠的窄带干扰识别方法 [P] . 中国专利： CN104361892B . 2017.05.17
2. 一种干扰信号与语音调制信号混叠的窄带干扰识别方法 [P] . 中国专利： CN104361892A . 2015-02-18
3. A method for speaker-dependent speech recognition and voice recognition system therefor [P] . 德国专利： DE10313310A1 . 2004-10-21

机译：一种基于说话者的语音识别方法及其语音识别系统
4. A method for speech recognition and speech recognizer [P] . 德国专利： DE10034235C1 . 2001-08-09

机译：一种语音识别方法和语音识别器
5. Speech identification system and identification method of a kind of robot system [P] . 韩国专利： KR20170103925A . 2017-09-13

机译：一种语音识别系统及一种机器人系统的识别方法