首页> 中国专利> 一种水下目标gammachirp倒谱系数听觉特征提取方法

一种水下目标gammachirp倒谱系数听觉特征提取方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提出的一种水下目标gammachirp倒谱系数听觉特征提取方法，以傅里叶变换和对数压缩为基础，结合gammachirp听觉滤波器组，首先对实测的噪声数据进行预处理，以使目标信号在短时内表示为近似平稳，然后对预处理后的数据进行傅里叶变换，将时域信号处理转化为频域信号进行处理，接着让其通过gammachirp听觉滤波器组进行听觉滤波并使用对数压缩，最后对对数压缩后的数据进行离散余弦变换，使其维数降低。这种基于gammachirp频率听觉感知倒谱系数的特征提取方法，可以提取出水下目标辐射噪声有效的听觉特征，从而提高水下目标的正确识别率。

著录项

公开/公告号CN103559893A

专利类型发明专利
公开/公告日2014-02-05

原文格式PDF
申请/专利权人西北工业大学;
展开▼

申请/专利号CN201310488534.9
发明设计人杨益新;吴姚振;
展开▼

申请日2013-10-17
分类号G10L25/24(20130101);
代理机构61204 西北工业大学专利中心;
代理人王鲜凯
地址 710072 陕西省西安市友谊西路127号
入库时间 2024-02-19 22:23:04

法律信息

法律状态公告日

法律状态信息

法律状态
2016-06-08

授权

授权
2014-03-12

实质审查的生效 IPC(主分类):G10L25/24 申请日:20131017

实质审查的生效
2014-02-05

公开

公开

说明书

技术领域

本发明涉及一种水下目标gammachirp倒谱系数听觉特征提取方法，可应用于水下目标辐射噪声的分类识别。

背景技术

水下目标特征提取是指从经过预处理的水下目标辐射噪声波形中提取反映其特点、类型的一组特征（时域特征提取），或者使用某种方法把目标辐射噪声波形进行变换，然后在变换域中提取反映其特点、目标类型的一组特征（变换域特征提取）。特征提取是目标识别中的关键环节之一，它直接影响到目标的最终识别结果。目前，主要使用的特征提取方法有：

1)功率谱估计及LOFAR谱分析

2)DEMON谱分析

3)小波变换及时频谱分析

虽然上述特征提取方法的研究取得了很多令人鼓舞的成果，但在实际应用中，由于海洋环境的复杂性、水声信道的特殊性及水下目标的多样性，上述特征提取方法提取出的特征无法达到满意的识别效果，目标的最终判定很大程度上仍然依赖于听音员的耳听判型。有经验的听音员能够在复杂的海况下，对水下目标做出正确的类型判别。为此，研究者从仿生学的角度来进行听觉感知特征提取技术的研究，特别是对人耳听觉系统模仿的研究。

人类的听觉系统是人类获取外界信息的主要器官。正常人的听觉系统是极为灵敏的，可听声音的频率范围为20Hz-20kHz，人类听觉器官对声波的音高、音强及动态频率具有良好的分析感知能力。听觉建模是研究人耳听觉系统的一个重要手段，因为听觉模型最接近人耳对声音信号的处理过程，提取的特征最能反映声音的本质，且具有很好的稳健性。

近年来，国内外研究者从人耳听觉感知机理出发，研究适用于水下目标辐射噪声的新的特征提取方法，寻找人耳主观听觉量中的有效感知量，从而提高水下目标的正确识别率。

目前，使用最为广泛的一种准听觉模型是MFCC（Mel-Frequency Cepstral Coefficients）算法模型，具有计算简单和目标特征有效表示的特性，其主要思想是用傅里叶变换模拟人耳听觉系统的基底膜频率分解功能，用对数变换模拟听觉系统的非线性特性。MFCC算法的主要过程是：首先对实测的噪声数据进行预处理，以使目标信号在短时内表示为近似平稳，然后对预处理后的数据进行傅里叶变换，将时域信号处理转化为频域信号处理，接着让其通过三角滤波器组进行听觉滤波，同时使用对数压缩，最后对对数压缩后的数据进行离散余弦变换，并取前N个系数。

MFCC算法易受噪声的影响，信号稍有干扰，频谱的幅值、相位和频率都有可能产生较大的误差。而Gammachirp滤波器组能精确模拟人耳滤波器的非线性特性及生理学特性，且具有简单的冲激响应函数，其输出特别适合于进行耳蜗内的谱分析。因此，使用gammachirp滤波器组对水下目标噪声进行滤波后获得倒谱系数，形成仿人耳的听觉特征矢量，是一种可行的特征提取方法。

发明内容

要解决的技术问题

为了避免现有技术的不足之处，本发明提出一种水下目标gammachirp倒谱系数听觉特征提取方法，使用gammachirp听觉滤波器组输出形成倒谱系数，给出水下目标的听觉特征矢量，可在复杂海洋环境干扰条件下，提高水下目标信号特征提取的稳健性，从而提高水下目标识别的正确率。

技术方案

一种水下目标gammachirp倒谱系数听觉特征提取方法，其特征在于步骤如下：

步骤1：将所要分析的目标数据进行分帧处理，分帧时一帧的长度包含2～5节奏周期，然后将每帧信号加Hamming窗，Hamming窗函数为：

$ω (n) = 0.54 - 0.46 \cos (\frac{2 πn}{N - 1}), 0 \leq n \leq N - 1$

式中N为每帧信号的采样点数；

步骤2：对步骤1得到的多帧信号进行快速傅里叶变换，经变换可得到信号的频谱；

步骤3：步骤2得到的频谱信号通过gammachirp听觉滤波器组，得到多组子带能量谱；Gammachirp滤波器的冲激响应为：

g_c(t)＝at^n-1exp(-2πbERB(f_r)t)exp(j2πf_rt+jclnt+jφ)

式中：a表示gammachirp滤波器的幅度因子；n表示gammachirp滤波器的阶数； f_r表示gammachirp滤波器的渐近频率；2πbERB(f_r)表示阻尼因子；c表示chirp因子； lnt表示时间t的自然对数；φ表示gammatone滤波器的初始相位；ERB表示等矩形带宽，其表达式为：ERB(f_r)＝24.7+0.108f_r；

步骤4：对步骤3得到的多组子带能量谱进行非线性变换，得到gammachirp听觉感知特征；非线性变换函数包括内毛细胞输出函数和响度函数，其内毛细胞输出函数为：

H(ω)＝[GC(ω)]²

式中GC(ω)表示gammachirp滤波器的输出；

响度函数为：y(ω)＝[H(ω)]^0.33；

步骤5：对步骤4得到的gammachirp听觉感知特征进行对数压缩和离散余弦变换，得到gammachirp听觉感知倒谱系数，其具体表达式为：

${GCFCC}_{m} = \sqrt{\frac{2}{N}} Σ_{n = 0}^{N - 1} \log (Y_{n}) \cos [\frac{πm}{N} (n + \frac{1}{2})], 1 \leq m \leq M$

式中Y_n表示第n个频率子带的信号能量；N表示gammachirp滤波器的个数；M表示gammachirp听觉感知倒谱系数的个数。

所述步骤1中一帧的长度为100ms。

有益效果

本发明将水下目标辐射噪声的特征表示成gammachirp听觉感知倒谱系数，有效地解决了传统特征提取方法的一系列问题，并得到海上实录数据的验证，结果表明：本发明相对于MFCC算法以及在其基础上产生的改进算法而言，更好地模拟了人耳的听觉系统，同时没有增加计算负担。本发明相对于MFCC算法以及在其基础上产生的改进算法得到的谱图，由本发明处理得到的谱图背景比前者更加“清晰”，提高了水下目标辐射噪声识别的正确率。

附图说明

图1：Gammachirp滤波器的冲激响应波形；

图2：Gammachirp滤波器的幅频响应；

图3：离散余弦变换基函数在时域和频域的形式；

图4：本发明方法的流程图。

具体实施方式

现结合实施例、附图对本发明作进一步描述：

本实施例为海上实录的水下目标辐射噪声，水中目标辐射噪声经22.05kHz采样率采样得到，信噪比大约大于6dB。

针对实录得到的水下目标辐射噪声数据，本发明实现的主要步骤如下：

步骤1：对实录的水下目标辐射噪声进行预处理，包括分帧和加窗处理，窗函数使用Hamming窗，其形式为

$ω (n) = 0.54 - 0.46 \cos (\frac{2 πn}{N - 1}), 0 \leq n \leq N - 1 - - - (7)$

式中N为每帧信号的采样点数。

步骤2：对预处理后的信号进行快速傅里叶变换，得到频谱信号。

步骤3：利用gammachirp滤波器组对步骤2得到的频谱信号进行听觉滤波， gammachirp滤波器的冲激响应形式为：

g_c(t)＝at^n-1exp(-2πbERB(f_r)t)exp(j2πf_rt+jclnt+jφ) （8）

其中a表示gammachirp滤波器的幅度因子；n表示gammachirp滤波器的阶数；f_r表示 gammachirp滤波器的渐近频率；2πbERB(f_r)表示阻尼因子；c表示chirp因子；lnt表示时间t的自然对数；φ表示gammatone滤波器的初始相位。研究发现n＝4和b＝1.019的 gammachirp滤波器较好地模拟了人耳的基底膜的滤波特性，其冲激响应和幅频响应如图1、2所示。Gammachirp滤波器的傅里叶变换如下：

$(\begin{matrix} G_{C} (f) = \frac{aΓ (n + jc) e^{jφ}}{{2 πbERB (f_{r}) + j 2 π (f - f_{r})}^{n + jc}} \\ = \frac{\overline{a}}{{2 π \sqrt{{\overline{b}}^{2} + {(f - f_{r})}^{2}} \cdot e^{jθ}}^{n + jc}} \\ = \overline{a} \cdot \frac{1}{{2 π \sqrt{{\overline{b}}^{2} + {(f - f_{r})}^{2}}}^{n} \cdot e^{jnθ}} \cdot \frac{1}{2 π {\sqrt{{\overline{b}}^{2} + {(f - f_{r})}^{2}}}^{jc} \cdot e^{- cθ}} \end{matrix}) - - - (9)$

$θ = \arctan \frac{f - f_{r}}{\overline{b}} - - - (10)$

式中 $\overline{a} = aΓ (n + jc) e^{jφ}$ 为常数， $\overline{b} = bERB (f_{r}) .$

Gammachirp滤波器的幅度谱可以表示为

$| G_{C} (f) | = \frac{\overline{a}}{{2 π \sqrt{{\overline{b}}^{2} + {(f - f_{r})}^{2}}}^{n}} \cdot e^{cθ} - - - (11)$

步骤4：利用非线性变换对步骤3滤波后的结果进行变换，得到gammachirp听觉感知特征。非线性变换主要使用内毛细胞输出函数和响度函数，其内毛细胞输出函数为：

H(ω)＝[GC(ω)]² （12）

式中GC(ω)表示gammachirp滤波的输出。响度函数为：

y(ω)＝[H(ω)]^0.33 （13）

步骤5：利用对数压缩和离散余弦变换对步骤4得到的gammachirp听觉感知特征进行变换，得到gammachirp听觉感知倒谱系数，具体的表达式为：

${GCFCC}_{m} = \sqrt{\frac{2}{N}} Σ_{n = 0}^{N - 1} \log (Y_{n}) \cos [\frac{πm}{N} (n + \frac{1}{2})], 1 \leq m \leq M - - - (14)$

式中Y_n表示第n个频率子带的信号能量；N表示gammachirp滤波器的个数；M表示 gammachirp听觉感知倒谱系数的个数。

离散余弦变换的表示形式：

$λ_{k} \sqrt{\frac{2}{N}} \cos (\frac{πk}{N} (n + \frac{1}{2})), 0 \leq n < N, 0 \leq k < N - - - (15)$

其基函数在时域和频域的形式如图3所示。

在本实例中，计算的中心频率范围为50Hz到10500Hz，将提取的水下目标辐射噪声特征矢量送入训练好的BP神经网络进行分类识别，结果表明提取的特征表现出了较高的正确识别率，有效地证明了本发明提出的方法。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种水下目标gammachirp倒谱系数听觉特征提取方法 [P] . 中国专利： CN103559893B . 2016.06.08
2. 一种水下目标gammachirp倒谱系数听觉特征提取方法 [P] . 中国专利： CN103559893A . 2014-02-05
3. Easily tunable auditory-based speech signal feature extraction method and apparatus for use in automatic speech recognition [P] . 美国专利： US2002062211A1 . 2002-05-23

机译：易调谐的基于听觉的语音信号特征提取方法和装置，用于自动语音识别
4. A METHOD OF FITTING A HEARING DEVICE TO A USER, A FITTING SYSTEM FOR A HEARING DEVICE AND A HEARING DEVICE [P] . 欧洲知识产权局专利： EP3021600B1 . 2017-10-11

机译：一种适合用户的听觉设备的方法，一种用于听觉设备的听觉系统以及一种听觉设备
5. A METHOD OF FITTING A HEARING DEVICE TO A USER, A FITTING SYSTEM FOR A HEARING DEVICE AND A HEARING DEVICE [P] . 欧洲知识产权局专利： EP3021600A1 . 2016-05-18

机译：一种适合用户的听觉设备的方法，一种用于听觉设备的听觉系统以及一种听觉设备