首页> 中国专利> 基于Gammatone滤波器组的车型特征提取方法

基于Gammatone滤波器组的车型特征提取方法

摘要

本发明公开了基于Gammatone滤波器组的车型特征提取方法,属于模式识别领域,涉及车辆辐射声信号的特征提取方法,具体来讲是一种通过计算车辆声信号在Gammatone滤波器组下的倒谱系数模拟人耳听觉特性的特征提取方法。该方法利用Gammatone滤波器组可模拟人耳非线性频率分解的特性,将车辆声信号滤波划分为不同子带信号并求取倒谱系数。本发明基于听觉特性中频率分解原理,对车辆声信号提取Gammatone倒谱系数,得到原始信号频带-能量特征,其中涉及计算均为常用信号处理技术,原理简单,步骤明了,便于编程实现,适用性广。

著录项

  • 公开/公告号CN103714810A

    专利类型发明专利

  • 公开/公告日2014-04-09

    原文格式PDF

  • 申请/专利权人 西北核技术研究所;

    申请/专利号CN201310665449.5

  • 申请日2013-12-09

  • 分类号G10L15/02(20060101);

  • 代理机构61211 西安智邦专利商标代理有限公司;

  • 代理人王少文

  • 地址 710024 陕西省西安市69信箱

  • 入库时间 2024-02-19 22:57:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-05-25

    授权

    授权

  • 2014-05-07

    实质审查的生效 IPC(主分类):G10L15/02 申请日:20131209

    实质审查的生效

  • 2014-04-09

    公开

    公开

说明书

技术领域

本发明属于模式识别领域,涉及车辆辐射声信号的特征提取方法,具体来 讲是一种计算车辆声信号在Gammatone滤波器组下的倒谱系数的特征提取方 法,所得特征可模拟人耳的听觉特性。

背景技术

车型识别的过程主要包括特征提取与分类器的训练识别两个部分。特征提 取是模式识别的关键技术之一,利用车辆运动产生声信号对其进行分类识别是 车型识别的一种重要方式。车型识别被广泛应用于交通管理、区域防护与要地 警戒等领域。

目前,车辆声信号的特征提取主要基于信号的频率特征,AR参数模型是 广泛采用的计算信号功率谱的频谱分析方法,有严格的理论支持与成熟的技术 实现,但对于不同环境条件下的应用,提高特征分类精度的难度较大;此外还 有基于小波及小波包的能量系数特征提取方法,进一步提高了特征的分类精 度,但其原理深奥、实现复杂;近几年还出现了采用高阶谱分析、Mel倒谱系 数、经验模式分解等新原理的基于频率的特征提取方法,可以得到相对精确的 声信号特征,但整体而言,计算量大,实现复杂,且有的提取方法对背景噪声 依赖较强,应用具有局限性。

发明内容

本发明目的是提供一种较为简单易行的基于Gammatone滤波器组的车型 特征提取方法,该方法基于人耳非线性频率分解的听觉特性,利用听觉外周模 型广泛采用的Gammatone滤波器组,过滤、划分车辆声信号并计算滤波得到 子带信号的倒谱系数。

本发明的技术解决方案是:

一种基于Gammatone滤波器组的车型特征提取方法,其特殊之处在于: 包括以下步骤:

1】采集原始车辆声信号s(n),n表示采样数据序列中数据点的编号,采样 率fs满足奈奎斯特采样定理,即fs≥2fmax,fmax为信号的最高频率;对采样率为 fs的原始车辆声信号s(n)进行预滤波、归一化、加窗分帧的预处理,得到时域 的短时信号x(n);相应计算如下所示:

信号预滤波:y(n)=s(n)+0.9375·s(n-1)  (1)

信号归一化:y(n)=y(n)|y(n)max|---(2)

加窗分帧:x(n)=y(n)·w(n)---(3)

所述加窗分帧采用重叠分帧,w(n)为加窗函数,采用hamming窗,其函数表达 式如下:

w(n)=h(n)=0.54-0.46cos[2πn/(N-1)],0nN-10,else---(4)

其中,N为窗函数数据序列长度,即序列包含数据点数;n为此数据序列 中任一数据点编号;

2】确定滤波器组应用的频率范围[fL,fH](fL为滤波范围的频率下界,fH为 滤波范围的频率上界)、滤波器个数M与滤波器的阶数r,实现M个一组的 Gammatone滤波器组:

gm(n)=12πjGm(z)zn-1dz---(5)

其中,Gm(z)为滤波器在离散系统中的对应函数,z为Z变换中的复变量, n为离散系统中数据序列的任一数据点编号(n为整数),j为虚数单位,m表示 滤波器组中任一滤波器的编号,

3】短时信号x(n)通过Gammatone滤波器组,划分为M个子带信号(M为 滤波器个数)xm(n):

xm(n)=x(n)*gm(n)  1≤m≤M  (6)

4】对子带信号xm(n)作N点的FFT计算,N为子带信号数据序列长度, 得到子带信号的功率谱Xm(k),进一步对其取模平方,得到子带信号的能量谱 Em(k);再除以子带信号帧长度N得到信号的功率谱Gm(k);对各子带信号平均 功率谱Gm(k)加和并取对数,得到子带信号的对数功率值,相应计算如下所示:

子带信号能量谱:Em(k)=|Xm(k)|2  (7)

子带信号功率谱:Gm(k)=Em(k)N---(8)

子带信号对数功率值:em=log(Σk=1NGm(k)),1mM---(9)

其中,k代表子带信号数据序列中任一点编号,m代表子带信号编号,与 各滤波器编号对应,

5】得到车型识别特征系数,实现车型识别:

5.1】对各子带信号的对数功率值组成的数据序列e(m)按照定义进行离散 余弦变换,得到子带信号的原始p阶倒谱系数C(n),转换公式为:

C(n)=2MΣm=1Me(m)cos[πnM(m-0.5)],n=1,2,...,p---(10)

式中:

e(m)={e1,…,em,…,eM};

n代表得到倒谱系数数据序列点的编号;

p为倒谱系数的阶数;

5.2】对得到的原始p阶倒谱系数C(n),根据半正弦窗函数表达式(11)进行 升半正弦倒谱提升,得到提升后的车型识别特征系数,如式(12)所示:

w(i)=1+6×sin(πi/N),1≤i≤N  (11)

CG(n)=C(n)×w(i)  (12)

其中,N对应倒谱系数的阶数p,N=p,i代表1到N的正整数,式(12)中’×’表 示C(n)与w(i)两数据序列作点乘运算,即对应位置数据点相乘。

上述步骤2实现M个一组的Gammatone滤波器组,具体如下:

2.1】根据式(13)、式(14)计算得到各滤波器的中心频率及带宽:

中心频率fm为:

fm=(fH+228.7)exp(-vi9.26)-228.7---(13)

其中,fH为滤波器的截止频率上界,vi是滤波器重叠因子,用于指定相邻 滤波器之间的重叠百分比,

再由中心频率fm计算带宽,表达式为

bm=ERB(fm)=24.7×(4.37fm1000+1)---(14)

2.2】对各参数对应的Gammatone滤波器,其冲击响应的典型模式为:

其中,A为滤波器增益,r为滤波器阶数,bm为滤波器带宽,fm为滤波器 的中心频率,为相位,U(t)为阶跃函数,t为时域变量符号,M为滤波器个 数,m表示滤波器组中任一滤波器的编号,简化模型中,取

对上式中gm(t)按照拉普拉斯变换定义,计算得到滤波器在复频域的对应 函数Gm(s):

Gm(s)=-gm(t)e-stdt

=A20tr-1e(-2πERB(fm)t)(ej2πfmt+e-j2πfmt)e-stdt

=A2[(r-1)!(s+b-)n+(r-1)!(s+b+)n]---(16)

其中,A为滤波器增益,r为滤波器阶数,fm是中心频率,是相位,U(t) 为阶跃函数,s为复频率,j为虚数单位,b=2πERB(fm),ω=2πfm,m表示滤波 器组中任一滤波器的编号;

2.3】根据拉普拉斯变换中s平面与Z变换中z平面的映射关系,将Gm(s) 转换为离散系统中Z变换的Gm(z),得到滤波器在离散系统中z变换域的表示 形式,再由逆z变换得定义,计算得到离散系统中一组M个的Gammatone滤 波器的单位冲击响应:

gm(n)=12πjGm(z)zn-1dz---(17)

其中,Gm(z)为滤波器在离散系统中的对应函数,z为Z变换中的复变量, n为离散系统中数据序列的任一数据点编号,n为整数,j为虚数单位,m表示 滤波器组中任一滤波器的编号。

本发明所述的车辆声信号特征方法,基于听觉特征原理,通过计算滤波后 子带信号倒谱系数,得到原始信号频带-能量特征,其中所涉及计算均为常用 的信号处理技术,原理简单,步骤明了,便于编程实现,适用性广。根据该方 法得到的特征具有低维数、高可分性的优点

附图说明

图1是基于Gammatone滤波器组的车辆声信号特征提取方法计算流程图。

图2是一组17个的Gammatone滤波器幅频响应曲线图。

图3是两个不同类型的车辆声信号Gammatone特征向量示意图。

具体实施方式

本发明应用听觉特性中频率分解原理,对车辆声信号进行Gammatone倒 谱系数提取的流程为:

参阅图1,基于Gammatone滤波器组提取车辆声信号特征的方法为:

1)对采样率为fs(满足奈奎斯特采样定理,即fs≥2fmax,fmax为信号的最 高频率)的原始车辆声信号s(n)进行预滤波、归一化、加窗分帧的预处理,得 到时域的短时信号帧x(n)。相应计算如下所示:

信号低频加强:y(n)=s(n)+0.9375·s(n-1)  (1)

信号归一化:y(n)=y(n)|y(n)max|---(2)

加窗分帧:x(n)=y(n)·w(n)---(3)

车辆声信号是非平稳随机信号,在基于信号短时平稳的基础上,再应用平 稳信号处理方法分析。车辆信号在0.2s~1s时间段内可近似平稳,通过对信号 加窗,将原始信号分割为帧片段。此处,采用“重叠分帧”的方法,即前一帧 和后一帧包含重叠数据,更好的保证帧间的连续性。

上式中,w(n)为加窗函数,常采用hamming窗,它的函数表达式如下:

w(n)=h(n)=0.54-0.46cos[2πn/(N-1)],0nN-10,else---(4)

2)根据滤波器覆盖频率范围[fL,fH]、滤波器个数M及滤波器阶数r(r=4), 实现M个一组的Gammatone滤波器组(在信号采集过程中,信号采样率是确 定的,以上其余参数由信号处理者根据实际需求设定),具体步骤如下。

首先,根据式(5)、式(6)计算得到各滤波器的fm及带宽bm

fm=(fH+228.7)exp(-vi9.26)-228.7---(5)

bm=ERB(fm)=24.7×(4.37fm1000+1)---(6)

再根据Gammatone滤波器的典型冲击响应函数(式(7))做拉普拉斯变换, 得到滤波器复频域的表达式Gm(s)。

Gm(s)=-gm(t)e-stdt

=A20tr-1e(-2πERB(fm)t)(ej2πfmt+e-j2πfmt)e-stdt

=A2[(r-1)!(s+b-)n+(r-1)!(s+b+)n]---(8)

其中,A为滤波器增益,r为滤波器阶数,fm是中心频率,是相位,U(t) 为阶跃函数,s为复频率,j为虚数单位,b=2πERB(fm),ω=2πfm,m表示滤波 器组中任一滤波器的编号。

最后,将Gm(s)转换为Z变换的Gm(z)形式,再按照逆Z变换定义计算得 到离散系统下一组M个的Gammatone滤波器的单位冲击响应:

gm(n)=12πjGm(z)zn-1dz---(9)

图2所示是10~2500Hz范围内的17通道4阶Gammatone滤波器组的对数 幅频响应曲线。在线性频率上,随着滤波器编号的增大,相邻滤波器中心频率 的带宽逐渐增大。

3)短时信号帧x(n)通过Gammatone滤波器组,划分为M个子带信号(M 为滤波器个数)xm(n):

xm(n)=x(n)*gm(n)  1≤m≤M  (10)

4)求子带功率谱。对子带信号xm(n)进行快速傅里叶变换(Fast Fourier  Transform,FFT),得到子带信号的功率谱Xm(k),进一步取模平方,除以信号 长度N得到信号的功率谱Gm(k)。取对数,得到子带信号的对数功率谱。相应 计算如下所示:

子带信号能量谱:Em(k)=|Xm(k)|2  (11)

子带信号平均功率谱:Gm(k)=Em(k)N---(12)

子带信号对数功率值:em=log(Σk=1NGm(k)),1mM---(13)

5)求子带倒谱系数。将各子带信号的对数能量谱进行离散余弦变换 (Discrete Cosine Transform,DCT)。转换公式为:

C(n)=2MΣm=1Me(m)cos[πnM(m-0.5)],n=1,2,...,p---(14)

式中,e(m)为各子带信号对数功率值组成序列,即e(m)={e1,…,em,…,eM}; p为倒谱特征系数的阶数。C(n)为得到的原始p阶倒谱系数。再对DCT得到的 特征进行升半正弦倒谱提升,式(15)为半正弦窗函数,得到提升后的特征如 式(16)所示:

w(i)=1+6×sin(πi/N),1≤i≤N  (15)

CG(n)=C(n)×w(i)  (16)

选取两类车辆目标水陆两用作战车(Assault AmphibianVehicle,AAV)、牵 引式货车(Dragon Wagon,DW)运动辐射声信号作为样本库,信号采样率 fs=4960Hz。基于Gammatone滤波器组提取两类车辆声信号特征的方法为:参 阅图1:

1)声信号经预滤波、分帧、加窗等预处理后,得到时域的短时信号帧x(n)。 相应计算如下所示:

信号预滤波:y(n)=s(t/fs)+0.9375·s(t/fs-1)  (17)

信号归一化:y(n)=y(n)|y(n)max|---(18)

加窗分帧:x(n)=y(n)·w(n)---(3)

本例中,Matlab计算如下:

预滤波:y(n)=filter([10.9375],1,s(n));

信号归一化:y(n)=y(n)/max(abs(y(n)));

分帧:xx=enframe(y(n),N1,N2);

其中s(n)为采集待处理的原始车辆声信号,y(n)为信号滤波处理中间结果, N1为信号帧长度,取α=0.2065,N1=FrameSize=α·fs=1024点;N2为帧重叠 点数,取β=0.5,N2=β·N1=512点。

2)根据滤波器组应用的频率范围[fL,fH](fL为滤波范围的频率下界,fH为 滤波范围的频率上界)、滤波器个数M与滤波器的阶数r(r=4),计算得到滤波 器的中心频率fm及等效带宽bm,计算M个一组的Gammatone滤波器组滤波 参数。本例中,取M=17,[fL,fH]=[10,2500]Hz,其他输入采用函数默认值,得 到一组17个的Gammatone滤波器组的滤波系数、中心频率、等效带宽及群延 时,调用Matlab中voicebox工具包中gammabank函数,计算如下:

[b,a,fx,bx,gd]=gammabank(17,4960,′′,[102500]);

gammabank函数原型为:

[b,a,fx,bx,gd]=gammabank(n,fs,w,fc,bw,ph,k)其中,输入参数n 为滤波器个数,fs为信号采样率(单位:Hz),w为可选频率转化方式,fc为 滤波器中心频率,bw为滤波器带宽,ph为滤波器冲击函数响应的相位,k为 滤波器阶数。此处,需确定滤波器个数n,采样频率fs及中心频率覆盖范围 [fL,fH],其他取函数默认参数值。函数输出包括系统模型中滤波器系数a,b,滤波 器中心频率点fx,带宽值bx与各滤波器群延时gd。

gammabank函数采用传递函数模型描述Gammatone滤波器组,传递函数 H(z)的一般表达式如下所示:

H(z)=Y(z)X(z)=b0+b1z-1+b2z-2+···+bN-1z-(N-1)1+a1z-1+a2z-2+···+aM-1z-(M-1)

式中,X(z)表示输入x(n)的Z变换,Y(z)表示输出y(n)的Z变换,bi(i=1,…,m) 和ai(i=1,…,n)是滤波器的分子分母系数。由Gammatone滤波器的时域冲击响 应长度可知,Gammatone滤波器是无限长冲击响应(IIR)滤波器,其阶数为 H(z)的极点个数。gammabank计算滤波器组系数的主要步骤如下:

(1)将线性Hz频率表示的频带范围转化为ERB频率刻度表示范围:

g=abs(frq);

erb=11.17268*sign(frq).*log(1+46.06538*g./(g+14678.4 9));

其中frq为待转换线性Hz频率,分别对滤波器组覆盖最小、最大频率变 换得到ERB刻度下的频率分布范围[fx1,fx2];

(2)在ERB刻度下划分排列各滤波器中心频率:

fx=linspace(fx1,fx2,n);

上式表示取[fx1,fx2]范围的n等分点,其中n为滤波器个数,得到fx为n 个滤波器的中心频率。

(3)计算各滤波器带宽:

bnd=6.23e-6*g.^2+93.39e-3*g+28.52;

bx=1.019bnd;

其中g为各中心频率在ERB刻度下表示频率,bnd为ERB刻度下各中心 频率对应带宽,bx为转化到线性Hz频率下对应带宽。

(4)计算滤波器系数a,b:

ww=exp((1i*fx-bx)*2*pi/fs);%计算滤波器起始频率对应复变量

a=round([1cumprod((-k:-1)./(1:k))]);%构造k(k=4)阶的二 项式系数

b=conv(a,(0:k-1).^(k-1));%通过卷积计算得到k阶二项式对 应初始分子系数

b=exp(1i*ph)*b(1:k);%计算复数空间下滤波器相位对 应各阶系数值

wwp=repmat(ww,1,k+1).^repmat(0:k,nf,1);%计算各通道中

滤波器起始频率对应各阶系数

denc=repmat(a,nf,1).*wwp;%计算各通道中滤波器系数a对 应分式方程系数

numc=b.*wwp(:,1:k);%计算各通道中滤波器系数b对 应分式方程系数

ww=exp(2i*fx*pi/fs);%计算各通道滤波器中心频率对 应复变量

u=polyval(b(i,:),ww(i));%构造系数b下复数空间二项 式

v=polyval(a(i,:),ww(i));%构造系数a下复数空间二项 式

bi=real(conv(numci,conj(denci)))*abs(v-u)%计算各通道滤波 器分子系数bi

ai=real(conv(denci,conj(denci)))%计算各通道滤波 器分母系数ai

式中,i为虚数单位,ph为滤波器相位取为0,k为滤波器阶数取为4,ww 表示传递函数中复变量z,fx为滤波器中心频率,fs为信号采样率。

3)短时信号经Gammatone滤波器组,划分为M个子信号(M为滤波器个 数)。本例中,取两类车辆信号各一帧x1(n),x2(n),在Matlab平台下,调用filter 函数计算信号帧经过Gammatone滤波器组输出。

y=filterbank(b,a,xx(i,:),gd);

4)求子带功率谱。本例中,对两类车辆信号帧经Gammatone滤波后的子 带信号分别进行快速傅里叶变换,取模平方得到子信号的能量谱G1(k),G2(k)。 将子信号能量谱在时间上平均后取对数,得到子带信号的对数功率谱。Matlab 中计算如下:

r=abs(fft(y,1024));

e=log(sum(r.^2/1024));

5)求子带倒谱系数。将各子带信号的对数能量谱进行离散余弦变换 (Discrete Cosine Transform,DCT)。转换公式为:

C(n)=2MΣm=1Me(m)cos[πnM(m-0.5)],n=1,2,...,p---(20)

式中,e(m)为各子带信号对数功率值组成序列,即e(m)={e1,…,em,…,eM}, p为倒谱特征系数的阶数。C(n)为得到的原始p阶倒谱系数。再对DCT得到的 特征进行升半正弦倒谱提升,式(21)为半正弦窗函数,得到提升后的特征如 式(22)所示:

w(i)=1+6×sin(πi/N),1≤i≤N  (21)

CG(n)=C(n)×w(i)  (22)

本例中,p=N=17,由于第一维数据主要代表信号能量值将其去除,余下 的16维组成两类车辆信号的特征向量CG1(n),CG2(n)。Matlab中计算如下:

c=dct(log(sum(r.^2、1024)));

c1=c.*w;

图3中为AAV、DW两类车辆信号各一帧提取得到特征,其中,横轴为特 征维数,纵轴为特征幅度。可见,两类特征各维取值间距大,明显可分,进一 近实验结果证明,相比传统Mel倒谱系数特征提取方法,在特征维数相同时, 本发明方法可提高识别正确率5%~10%。

两类车辆信号Gammatone特征提取完整Matlab程序:

本发明原理:

本发明提取车辆声信号特征的方法,模拟人耳对声信号的非线性频率分解 特性,提取的特征参数CG(n)各维系数代表了车辆声信号按其组成频率的能量 分布情况,有效地表征了车型特征,实现基于声信号的车型识别。

本发明基于人耳非线性频率分解的听觉特性,利用听觉外周模型广泛采用 的Gammatone滤波器组,过滤、划分车辆声信号并计算滤波得到子带信号的 倒谱系数,提供一种较为简单易行的车型特征提取方法,根据该方法得到的特 征具有低维数、高可分性的优点。

Gammatone滤波器是一个标准的耳蜗听觉滤波器,该滤波器组冲击响应的 典型模式为:

式中,A为滤波器增益,r为滤波器阶数,fm是中心频率,是相位,bm为等效带宽,M为滤波器个数,U(t)为阶跃函数。简化模型中,取A=1,r=4, bm=ERB(fm)。

ERB(fm)为等效矩形带宽(Equivalent Rectangular Bandwidth,ERB),它决定 了脉冲响应的衰减速度,与滤波器带宽有关,而每个滤波器带宽与人耳听觉临 界频带(Critical Band,CB)有关,听觉心理学中,ERB(fm)可由式(24)计算得到:

ERB(fm)=24.7×(4.37fm1000+1)---(24)

其中,中心频率fm为:

fm=(fH+228.7)exp(-vi9.26)-228.7---(25)

式中,fH为滤波器的截止频率,vi是滤波器重叠因子,用来指定相邻滤波 器之间重叠的百分比。每个滤波器的中心频率确定后,相应的带宽可由式(24) 计算得出。

Gammatone滤波器组是应用最多的耳蜗基底膜模型,在语音信号的处理 中,主要用于语音信号增强及特征提取。由各种机动车辆目标产生的声信号是 一种多声源噪声,在应用Gammatone滤波器组提取特征时,主要存在以下难 点:(1)车辆运动声源包括气动噪声和机械噪声,信号成分较语音更复杂;(2) 车辆声信号对环境变化十分敏感,路况、车速、自然环境都会引起信号变化; (3)需根据目标车辆声信号的优势频带范围,动态调整Gammatone滤波器覆盖 频带。目前,对Gammatone滤波器处理其他目标声信号的研究相对较少,曾 有文献提出利用听觉模型(Gammatone滤波器及高/低通滤波器组成混合滤波 器组)输出谱特征用于声目标识别,并对水下目标进行试验测试,得到优于传 统方法的识别结果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号