首页> 中国专利> 基于辐射噪声的目标识别方法、系统、装置及介质

基于辐射噪声的目标识别方法、系统、装置及介质

摘要

本发明提供的基于辐射噪声的目标识别方法、系统、装置及存储介质,方法包括:获取第一辐射噪声的音频信号;对音频信号进行分解,得到高谐振分量信号;将高谐振分量信号进行分帧加窗处理,得到分帧信号;根据分帧信号生成频谱,根据频谱在时间域上排列得到频谱样本;根据频谱样本训练得到神经网络模型,获取第二辐射噪声,并根据神经网络模型进行识别分类。方法在一定程度上滤除了辐射噪声中的瞬态非振荡信号和高斯白噪声,更有利于对信号作特征提取,解决了样本受海洋环境干扰严重的问题,并能实现智能精准地辐射噪声的识别,可广泛应用于声学识别技术领域。

著录项

  • 公开/公告号CN112885362A

    专利类型发明专利

  • 公开/公告日2021-06-01

    原文格式PDF

  • 申请/专利权人 珠海市岭南大数据研究院;

    申请/专利号CN202110049764.X

  • 发明设计人 王刚;范海生;王建华;胡方扬;

    申请日2021-01-14

  • 分类号G10L17/26(20130101);G10L17/18(20130101);G10L21/0208(20130101);

  • 代理机构44205 广州嘉权专利商标事务所有限公司;

  • 代理人常柯阳

  • 地址 519000 广东省珠海市香洲区高新区港湾1号港2栋2F

  • 入库时间 2023-06-19 11:11:32

说明书

技术领域

本发明涉及声学识别技术领域,尤其是基于辐射噪声的目标识别方法、系统及存储介质。

背景技术

随着科技的不断发展,人类对于海洋的认识逐步深化。一方面,海洋经济的发展成为国民经济发展的重要引擎,宽广无际的海洋蕴藏着丰富的矿产资源、海洋生物资源以及海水化工资源等,通过提高勘探和开发海洋资源的能力,将海洋资源的优势转化为经济优势,加快经济发展速度,有着至关重要的意义。另一方面,广阔的海洋面积在军事上提供了极大的海洋战略纵深,这也给海洋领土的预警防御和海洋资源保护设置了巨大的考验。在经济活动中,海底探矿、石油平台监测、经济鱼群探测等都需要水下目标的识别与检测,海洋防御中,能否应用水声信号对水下目标进行识别和分类,准确判断水下目标属于寻常水生鱼类,还是未知潜艇甚至鱼雷,对于海军舰艇的生存和作战极为关键。因此,无论是经济上出于海洋开发的目的,还是军事和政治上捍卫主权独立和领海完整的需要,都促使科技工作者们不断地提高水下目标的识别准确率和效率。

但在现有技术中,多数情况下还是通过人工识别和分拣,工作强度大,并且效率较低,同时在识别的过程中较大概率产生识别误差。

发明内容

有鉴于此,为至少部分解决上述技术问题之一,本发明实施例目的在于提供一种高效、便捷且精确度更高的基于辐射噪声的目标识别方法,同时本申请还提供了对应的实现该方法的系统、装置及计算机可读存储介质。

第一方面,本发明的技术方案提供了基于辐射噪声的目标识别方法,其步骤包括:

获取第一辐射噪声的音频信号;

对所述音频信号进行分解,得到高谐振分量信号;

将所述高谐振分量信号进行分帧加窗处理,得到分帧信号;

根据所述分帧信号生成频谱,根据所述频谱在时间域上排列得到频谱样本;

根据所述频谱样本训练得到神经网络模型,获取第二辐射噪声,并根据所述神经网络模型进行识别分类。

在本申请方案的一种可行的实施例中,所述对所述音频信号进行分解,得到高谐振分量信号这一步骤,其包括:

对所述音频信号进行特征增强,得到增强信号;

将所述增强信号进行小波变化,由小波变换后的信号通过形态学成分分析得到所述高谐振分量信号。

在本申请方案的一种可行的实施例中,所述将所述高谐振分量信号进行分帧加窗处理,得到分帧信号这一步骤,其包括:

确定帧移,根据所述帧移截取所述高谐振分量信号得到高谐振分量子信号;

根据所述高谐振分量子信号以及窗函数生成所述分帧信号,并去除所述分帧信号中的奇异样本数据。

在本申请方案的一种可行的实施例中,所述根据所述分帧信号生成频谱,根据所述频谱在时间域上排列得到频谱样本这一步骤,其包括:

对所述分帧信号进行傅里叶变换得到频谱信号;

根据所述频谱信号的生成对数幅度谱并将所述对数幅度谱在时间域上进行排列得到频谱样本。

在本申请方案的一种可行的实施例中,所述小波变化为Q小波变换,所述将所述增强信号进行小波变化这一步骤,其包括:

根据小波基函数以及所述Q小波变换的Q因子,确定复杂信号的稀疏性表示,将所述增强信号进行重构,得到重构信号。

在本申请方案的一种可行的实施例中,所述根据小波基函数以及所述Q小波变换的Q因子,确定复杂信号的稀疏性表示,将所述增强信号进行重构这一步骤,其包括:

构建高通滤波器和低通滤波器,根据所述高通滤波器和所述低通滤波器构建若干分析滤波器组;

通过所述分析滤波器组对所述增强信号进行滤波得到高通滤波信号和低通滤波信号;

将所述低通滤波信号迭代输入至所述分析滤波器组得到次级低通滤波信号,根据所述高通滤波信号和所述次级低通滤波信号构建所述重构信号。

在本申请方案的一种可行的实施例中,所述由小波变换后的信号通过形态学成分分析得到所述高谐振分量信号这一步骤,其包括:

通过形态学成分分析得到所述重构信号高谐振分量的小波系数;

根据所述小波系数从所述重构信号中提取得到所述高谐振分量信号。

第二方面,本发明的技术方案还提供基于辐射噪声的目标识别系统,包括:信号获取单元,用于获取第一辐射噪声的音频信号;

信号分解单元,用于对所述音频信号进行分解,得到高谐振分量信号;

分帧处理单元,用于将所述高谐振分量信号进行分帧加窗处理,得到分帧信号;

时频变换单元,用于根据所述分帧信号生成频谱,根据所述频谱在时间域上排列得到频谱样本;

模型训练单元,用于根据所述频谱样本训练得到神经网络模型;

噪音识别单元,用于获取第二辐射噪声,并根据所述神经网络模型进行识别分类。

第三方面,本发明的技术方案还提供基于辐射噪声的目标识别装置,其包括:

至少一个处理器;

至少一个存储器,用于存储至少一个程序;

当至少一个程序被至少一个处理器执行,使得至少一个处理器运行第一方面中的基于辐射噪声的目标识别方法。

第四方面,本发明的技术方案还提供了一种存储介质,其中存储有处理器可执行的程序,处理器可执行的程序在由处理器执行时用于运行第一方面中的方法。

本发明的优点和有益效果将在下面的描述中部分给出,其他部分可以通过本发明的具体实施方式了解得到:

本申请基于方法通过对辐射噪声的音频信号进行分解,一定程度上滤除了辐射噪声中的瞬态非振荡信号和高斯白噪声,更有利于对信号作特征提取,解决了样本受海洋环境干扰严重的问题;此外对信号进行加窗、分帧,并转换成频谱信号训练得到神经网络模型,针对性地识别特征信号,实现智能精准地辐射噪声的识别。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于辐射噪声的目标识别方法实施例的步骤流程图;

图2为本发明小波变换的过程示意图;

图3为本发明中卷积神经网络模型的结构示意图;

图4为本发明提供的基于辐射噪声的目标识别系统结构示意图。

具体实施方式

下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

在第一方面,如图1所示,本申请提供了基于辐射噪声的目标识别方法,包括步骤S01-S05:

S01、获取第一辐射噪声的音频信号。

具体地,实施例获取一定数量的辐射噪声的样本,并将样本中的音频信号划分为离线标签数据集和在线测试数据集两部分,分别作为后续神经网络模型的离线训练的数据样本和模型在线训练的数据样本。

S02、对音频信号进行分解,得到高谐振分量信号。

具体地,选择步骤S01中的离线标签数据集,实施例采用基于谐振的稀疏信号分解算法(Resonance-based Sparse Signal Decomposition,RSSD)对信号作预处理,并依次读取得到的高谐振分量信号。基于谐振的稀疏信号分解过程,一定程度上滤除了辐射噪声中的瞬态非振荡信号和高斯白噪声,更有利于对信号进行特征提取,分解输出的高谐振分量将分别作为后续循环神经网络以及线谱增强过程的输入。

在一些可选的实施例中,对音频信号进行分解,得到高谐振分量信号这一步骤S02,可以进一步细分为步骤S021-S022:

S021、对音频信号进行特征增强,得到增强信号;

S022、将增强信号进行小波变化,由小波变换后的信号通过形态学成分分析得到高谐振分量信号。

具体地,实施例中首先对离线标签数据集中的音频信号进行特征增强,特征增强的主要是对音频信号进行初步的处理,包括清洗和增强数据,例如识别音频信号中的缺失部分,某条记录缺失部分超过数据记录的50%,则删除该条数据记录。又例如,对离线标签数据集中的音频信号进行归一化或者标准化处理。

在实施例中采用的小波变换为Q小波变换,即Q因子小波变换。且实施例中,将增强信号进行小波变化,由小波变换后的信号通过形态学成分分析得到高谐振分量信号这一步骤S022,其是根据小波基函数以及Q小波变换的Q因子,确定复杂信号的稀疏性表示,将增强信号进行重构,得到重构信号。

具体地,实施例中RSSD算法使用两种不同的小波基函数,对应不同大小的Q因子,获得一个复杂信号的稀疏性表示,并对信号进行重构,如图2所示,RSSD算法将谐振性视为稀疏信号分解的依据,Q因子为对信号谐振性程度的量化。高谐振的信号在时域上表现为更高程度的频率聚合性,更多的同时存在震荡波形,对应着更大的Q因子;低谐振的信号则表现为非震荡、不定性的瞬态信号,对应着更小的Q因子。

更为具体地,在一些可行的实施例中,步骤S022中将增强信号进行重构这一过程,可进一步细分为更为详细的步骤S022a-S022c:

S022a、构建高通滤波器和低通滤波器,根据高通滤波器和低通滤波器构建若干分析滤波器组;

S022b、通过分析滤波器组对增强信号进行滤波得到高通滤波信号和低通滤波信号;

S022c、将低通滤波信号迭代输入至分析滤波器组得到次级低通滤波信号,根据高通滤波信号和次级低通滤波信号构建重构信号。

具体地,实施例中,信号重构即得到重构信号的过程采用TQWT工具箱完成。如其过程主要由分类和综合滤波器组完成。每一层的分析滤波器组都是由高通滤波器H

其中,

Y(w)=X(αw),|w|≤π

其中,Q因子是对信号谐振性程度地量化,其定义如下:

Q=f

其中,f

带宽BW表示为:

BW=0.5βα

因此Q因子可以导出为:

原始信号通过滤波器组之后,低通通道的输出迭代地输入更深层级的滤波器组,直到预设的层次j。同时,通过选择过采样率r以构造小波基函数Φ

因此,TQWT算法中,Q,r,J三个参数均可以通过计算α,β的选取来计算,而α,β地选择受信号固有震荡特性所决定。对于输入信号,分别设置Q,r,J以提取其高、低谐振信息。

在一些可行的实施例中,由小波变换后的信号通过形态学成分分析得到高谐振分量信号这一步骤S022中,由小波变换后的信号通过形态学成分分析得到高谐振分量信号这一过程,其可以进行一步包括更为详细的步骤S022d-S022e:

S022d、通过形态学成分分析得到重构信号高谐振分量的小波系数;

S022e、根据小波系数从重构信号中提取得到高谐振分量信号。

具体地,实施例中采用形态学成分分析(MCA)用来分解具备不同形态学特征的信号。利用MCA算法对辐射噪声进行分离和提取,以构造其高谐振分量和低谐振分量的最优稀疏表示。考虑离散辐射噪声序列则该信号可稀疏地表示为:

x=Φ

其中,w

其中,J

λ

λ

k

通过分解的增广拉格朗日收缩算法可以对J(w

S03、将高谐振分量信号进行分帧加窗处理,得到分帧信号。

具体地,对高谐振分量信号进行加窗、分帧,选择汉宁窗(Hanning)语音信号在宏观上是不平稳的,在微观上是平稳的,具有短时平稳性(10-30ms内可以认为语音信号近似不变),这个就可以把语音信号分为一些短段来进行处理,每一个短段称为一帧(chunk)。后续操作需要加窗,则在分帧的时候,并非背靠背地截取,而是相互重叠一部分。加窗即与一个窗函数相乘,加窗之后是为了进行傅里叶展开,使全局更加连续,避免出现吉布斯效应。加窗过程中,原本没有周期性的语音信号呈现出周期函数的部分特征。加窗的代价是一帧信号的两端部分被削弱了,所以在分帧的时候,帧与帧之间需要有重叠。

在一些可选的实施例中,将高谐振分量信号进行分帧加窗处理,得到分帧信号这一步骤S03可以进一步细分为步骤S031和S032:

S031、确定帧移,根据帧移截取高谐振分量信号得到高谐振分量子信号;

S032、根据高谐振分量子信号以及窗函数生成分帧信号,并去除分帧信号中的奇异样本数据。

具体地,相邻两帧的起始位置的时间差叫做帧移(STRIDE)。实施例中,窗口大小为2048(即fft点数为2048),帧间重叠为75%即确定帧移。对每一帧的信号都需要作归一化和去中心化的处理,信号的功率在时间上均匀且样本的均值为0,即数据被限定在一定范围内,既可以消除奇异样本数据导致的不良影响,同时也可以避免神经元饱和,加快网络的收敛速度。

S04、根据分帧信号生成频谱,根据频谱在时间域上排列得到频谱样本。

具体地,通过傅里叶变换将时域的分帧信号转换为频域的分帧信号。

在一些可选的实施例中,根据分帧信号生成频谱,根据频谱在时间域上排列得到频谱样本这一步骤S04,可以细分为更具体的步骤S041-S042:

S041、对分帧信号进行傅里叶变换得到频谱信号;

S042、根据频谱信号的生成对数幅度谱并将对数幅度谱在时间域上进行排列得到频谱样本。

具体地,对步骤S03得到每一帧信号作傅里叶变换,将变换后的频谱取对数幅度谱并在时间域上排列,取时间轴上64点为一个样本,即得到一个大小为1024*64的LOFAR谱样本。音频的采样频率为52734Hz,每个样本时长约为0.62s。整理各类样本训练集及测试集的数量绘制成表,如表1所示:

表1

表中ID为数据库中音频的标号,根据ID可以获取每段音频对应的舰船类型,作为深度神经网络有监督学习的标签。将获得的样本通过基于多步判决的LOFAR谱线谱增强处理,得到线谱特征增强的LOFAR谱。该LOFAR谱为二维矩阵,可看作单通道图片,将作为卷积神经网络的输入层

S05、根据频谱样本训练得到神经网络模型,获取第二辐射噪声,并根据神经网络模型进行识别分类。

具体地,如图3所示,由于卷积神经网络是属于空间结构层次的静态网络,仅具有全连接或部分连接(层间连接),而不具备层内连接,对于空间上具有局部相关性且样本独立的计算机视觉领域十分契合,但对于时间相关性为主要特征的序列信号只能以分帧的形式将固定大小的数据输入到网络中,对于训练样本时间前后关联性利用有限,而分帧的大小的选择也带来了识别准确率和网络训练时长之间的矛盾。LSTM结构是每个重复模块单元,却具备记忆能力且更为复杂。特有的结构保证了LSTM在长时间步情况下保留较早时间步信息的能力,解决了梯度爆炸和梯度消失的问题。但是由于CNN可以充分利用数据空间相关性的优势,其识别结果将优于LSTM。因此实施例采用CNN模型作为主要训练模型。

第二方面,本发明的一种软件系统实施例,基于辐射噪声的目标识别系统,包括:

信号获取单元,用于获取第一辐射噪声的音频信号;

信号分解单元,用于对音频信号进行分解,得到高谐振分量信号;

分帧处理单元,用于将高谐振分量信号进行分帧加窗处理,得到分帧信号;

时频变换单元,用于根据分帧信号生成频谱,根据频谱在时间域上排列得到频谱样本;

模型训练单元,用于根据频谱样本训练得到神经网络模型;

噪音识别单元,用于获取第二辐射噪声,并根据神经网络模型进行识别分类。

第三方面,如图4所示,本发明实施例还提供基于辐射噪声的目标识别装置,其包括至少一个处理器;至少一个存储器,用于存储至少一个程序;当至少一个程序被至少一个处理器执行,使得至少一个处理器运行如第一方面中的基于辐射噪声的目标识别方法。

例如,在一种可行的实施例中,采用Ubuntu 16.04操作系统,GTX 1080ti显卡;编程语言主要为python 3.6及Matlab R2016b。其中用到的关于深度学习库与软件工具箱有:Keras2.3(tensorflow backed),Librosa音频处理库(python)和TQWT工具箱(Matlab语言)。

本发明实施例还提供了一种存储介质内存储有程序,程序被处理器执行,实现如第一方面中的方法。

从上述具体的实施过程,可以总结出,本发明所提供的技术方案相较于现有技术存在以下优点或优势:

本申请的方法通过对辐射噪声的音频信号进行分解,一定程度上滤除了辐射噪声中的瞬态非振荡信号和高斯白噪声,更有利于对信号作特征提取,解决了样本受海洋环境干扰严重的问题;此外对信号进行加窗、分帧,并转换成频谱信号训练得到神经网络模型,针对性地识别特征信号,实现智能精准地辐射噪声的识别。

在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

其中,功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号