技术领域
本发明属于雷达技术领域,更进一步涉及一种空中微动目标分类在线建库方法,可用于对空中飞机目标分类的原MF模型进行实时、自动地更新,提升雷达的自动化和智能化水平。
背景技术
直升机、螺旋桨飞机和喷气式飞机微动部件的物理结构和运动参数各不相同,会对雷达回波产生不同的微多普勒调制。通过提取突显三类飞机微多普勒调制差异的特征,将其输入到设计好的分类器模型进行训练,可以完成空中飞机目标分类任务。首先,窄带雷达工作中,采集的每个样本需要成百上千个脉冲积累,因此短时间内获得的样本总数较少。其次,飞机在运动过程中,由于姿态和距离不断变化,导致样本在空间中非线性分布。而随机森林RF模型是若干分类决策树组成的集合,可有效解决小样本、非线性分类问题。因此,RF模型常被用于空中飞机目标分类任务。然而实际工作中,前期难以获得充足且完备的训练数据库,限制了对空中飞机目标的分类性能。现有基于微多普勒效应的空中飞机目标分类方法需要定期将新采集到的样本与原样本集合并为新训练样本集,重新训练RF模型,从而完成模型的更新。但该方法需要频繁的人工干预,并且无法在新样本到来时,及时完成对模型的更新。一种更可行的思路是使用具有在线学习能力的分类器模型。当新样本到来时,自动更新现有模型,提升其对空中飞机目标的分类正确率。
李玮璐学者在发表的“基于JEM效应的飞机目标分类方法研究”中介绍了基于微多普勒效应的飞机目标分类方法。该方法的具体步骤是:第一步,获取充足且完备的雷达回波目标微动信号作为训练样本集;第二步,对各训练样本进行特征提取;第三步,利用训练样本集的特征矩阵训练RF模型;第四步,获取雷达回波目标微动信号作为测试样本集;第五步,对各测试样本进行特征提取;第六步,将测试样本集的特征矩阵输入训练好的RF模型得到分类结果。
该方法一方面直接利用新增训练样本集训练RF模型,可以在采集到新增训练样本集时,将该样本集的特征矩阵输入到RF模型进行训练,快速更新现有模型,提高学习效率。另一方面,将初始训练样本集和新增训练样本集合并为新训练集,将新训练集的特征矩阵输入到RF模型进行训练,由于该训练集具有飞机目标样本在特征空间中相对完备的分布信息,因此学得的RF模型具有良好的分类性能。但是该方法存在两方面的不足:一是由于新增训练样本集中包含的样本较少,不能反映飞机目标在特征空间中的真实分布情况,若直接利用新增训练样本集训练RF模型,所得RF模型的分类性能较差,不能提升现有模型的分类性能;二是当采集到足够的新样本时,需要工作人员定期合并新旧样本集,再重新训练分类模型,将导致学习效率低下且浪费人力物力资源。
发明内容
本发明的目的在于针对上述现有技术的不足,提出一种基于蒙德里安森林的空中微动目标分类在线建库方法,以避免频繁的人工干预,节省时间空间资源,迅速更新现有模型,提升其分类性能。
实现本发明目的技术方案包括如下:
建立包含微动目标雷达回波信号的初始训练样本集,并对其进行特征提取,得到初始训练样本集的特征矩阵F
建立包含微动目标雷达回波信号的新增训练样本集,并对其进行特征提取,得到新增训练样本集的特征矩阵F
建立包含微动目标雷达回波信号的测试样本集,并对其进行特征提取,得到测试样本集的特征矩阵F
在蒙德里安森林MF模型中设置A棵蒙德里安树,10≤A≤50,将初始训练样本集的特征矩阵F
利用新增训练样本集的特征矩阵F
将测试样本集的特征矩阵F
本发明与现有技术相比,由于使用了蒙德里安森林算法,因而具有如下优点:
第一,能够通过扩展蒙德里安森林中每棵树的结构来学习和存储有关新样本的知识,克服了现有技术不能直接利用新增样本集训练模型以提升分类性能的问题,使得本发明能够通过更新模型提升对空中飞机目标的分类正确率。
第二,可直接利用新增样本集对现有模型中每棵蒙德里安树进行更新扩展,使得本发明能够自动、实时地更新模型库,减少了人力资源的消耗,并获得接近离线学习方法对空中飞机目标的分类正确率。
附图说明
图1是本发明的实现流程图;
图2是本发明的仿真实验结果图。
具体实施方式
下面结合附图对本发明的实施例和效果做进一步详细的描述。
参照图1,本实例具体实现步骤包括如下:
步骤1,生成初始训练样本集、新增训练样本集、测试样本集。
1.1)获取D个类别的P个微动目标雷达回波信号作为初始训练样本集,其中,D≥3,P≥150;
1.2)获取D个类别的P'个微动目标雷达回波信号作为新增训练样本集,其中,D≥3,P'≥90;
1.3)获取D个类别的Q个微动目标雷达回波信号作为测试样本集,其中,D≥3,Q≥1500。
步骤2,对初始训练样本集进行特征提取,得到P×5维的初始训练样本集的特征矩阵F
2.1)对初始训练样本集中P个回波信号分别进行快速傅里叶变换,得到P个初始训练样本的多普勒域信号,U
2.2)按照下式,根据初始训练样本的多普勒域信号计算幅值归一化后初始训练样本的多普勒域信号:
其中,X
2.3)按照下式,根据幅值归一化后初始训练样本的多普勒域信号计算初始训练样本的频域波形熵特征:
其中,E
2.4)按照下式,根据幅值归一化后初始训练样本的多普勒域信号计算初始训练样本的频域p阶中心矩特征:
其中,Mp
2.5)根据第n个初始训练样本的频域波形熵特征E
F
2.6)分别为初始训练样本集内各个样本设置类别标签值L
L
步骤3,根据初始训练样本集的类别标签集L
蒙德里安森林MF是现有的一种新型随机森林,具有在线更新的能力,其由若干棵蒙德里安树构成。具体训练过程如下:
3.1)在蒙德里安森林MF模型中设置A棵蒙德里安树,10≤A≤50,将初始训练样本集的特征矩阵F
3.2)通过蒙德里安树生成算法依次对每棵蒙德里安树T
3.2.1)初始化树T
3.2.2)设置树T
3.2.3)计算迭代节点j上样本集的特征矩阵F
3.2.4)计算超空间B
3.2.5)判断τ
若是,则设置τ
否则,设置τ
3.2.6)根据超空间B
3.2.7)根据迭代节点j的超空间B
3.2.8)创建迭代节点j的左子节点left(j)和右子节点right(j),创建空的特征向量集F
若是,则将该样本的特征向量和类别标签分别输入到左子节点的特征向量集F
否则,将该样本的特征向量和类别标签分别输入到右子节点的特征向量集F
3.2.9)将F
3.2.10)将循环节点j更新为左子节点left(j),返回3.2.3);
3.2.11)将循环节点j更新为右子节点right(j),返回3.2.3);
3.3)执行完3.2)后,得到训练好的A棵蒙德里安树,将训练好的A棵蒙德里安树集成,获得预训练MF模型。
步骤4,对新增训练样本集进行特征提取,得到P'×5维的新增训练样本集的特征矩阵F
4.1)对新增训练样本集中P'个回波信号分别进行快速傅里叶变换,得到P'个新增训练样本的多普勒域信号,U
4.2)根据新增训练样本的多普勒域信号计算幅值归一化后新增训练样本的多普勒域信号:
其中,X
4.3)根据幅值归一化后新增训练样本的多普勒域信号计算新增训练样本的频域波形熵特征:
其中,E
4.4)按照下式,根据幅值归一化后新增训练样本的多普勒域信号计算新增训练样本的频域p阶中心矩特征:
其中,Mp
4.5)根据第n'个新增训练样本的频域波形熵特征E
F
4.6)分别为新增训练样本集内各个样本设置类别标签值L
L
步骤5,利用新增训练样本集的类别标签集L
5.1)将新增训练样本集的类别标签集L
5.2)通过蒙德里安树更新算法依次对每棵蒙德里安树T
5.2.1)依次取新增训练样本集的特征矩阵F
5.2.2)设置树T
5.2.3)计算新样本特征向量x在各维度上与迭代节点j的超空间B
e
5.2.4)计算e
5.2.5)判断τ
5.2.6)根据e
5.2.7)判断新样本特征向量x在维度δ上的特征值x
5.2.8)创建一个新节点j',令δ
5.2.9)创建一个新叶子节点j”,将新样本特征向量x和对应的样本类别标签y输入到该叶子节点j”中;
5.2.10)判断新样本特征向量x在维度δ
5.2.11)根据新样本特征向量x,更新迭代节点j的超空间上边界u
l
5.2.12)判断迭代节点j是否为叶子节点,若是,则结束程序,否则,执行5.2.13);
5.2.13)判断新样本特征向量x维度δ
若是,则将新样本特征向量x和对应的样本类别标签y输入到迭代节点j的左子节点left(j)中,将迭代节点j更新为左子节点left(j),返回5.2.3);
否则,将新样本特征向量x和对应的样本类别标签y输入到迭代节点j的右子节点right(j)中,将迭代节点j更新为右子节点right(j),返回5.2.3);
5.3)执行完3.2)后,得到更新后的A棵蒙德里安树,将更新后的A棵蒙德里安树集成,获得新的MF模型。
步骤6,对测试样本集进行特征提取,得到Q×5维的测试样本集的特征矩阵F
6.1)对测试样本集中Q个回波信号分别进行快速傅里叶变换,得到Q个测试样本集的多普勒域信号,U
6.2)按照下式,根据测试样本的多普勒域信号计算幅值归一化后测试样本的多普勒域信号:
其中,X
6.3)根据幅值归一化后测试样本的多普勒域信号计算测试样本的频域波形熵特征:
其中,E
6.4)按照下式,根据幅值归一化后测试样本的多普勒域信号计算测试样本的频域p阶中心矩特征:
其中,Mp
6.5)根据第m个测试样本的频域波形熵特征E
F
6.6)分别为测试样本集内的各个样本设置类别标签值L
L
步骤7,将测试样本集的类别标签集L
7.1)依次将测试样本集的特征矩阵F
利用A棵蒙德里安树的分类结果
7.2)获得测试样本集的特征矩阵F
7.3)根据测试样本集的预测标签集和类别标签集L
下面结合仿真实验对本发明做进一步的描述。
1.仿真条件:
本发明的仿真实验的硬件平台为:处理器为Intel(R)Core(TM)i7-10750H,主频为2.60GHz,内存16GB。
本发明的仿真实验的软件平台为:Windows 10操作系统和python 3.6。
本发明的仿真实验中所用数据集为仿真数据,使用的直升机、螺旋桨飞机、喷气式飞机旋翼物理参数如下表:
表中包含直升机、螺旋桨飞机、喷气式飞机三类飞机,每类飞机包含5种机型,共15种机型,L
仿真雷达的参数为:载频f
初始训练样本集中包含15种机型各10个样本,共150个。
新增训练样本集包含15种机型各90个样本,共1350个。
测试样本集包含15种机型各100个样本,共1500个。
2.仿真内容与结果分析:
本发明仿真实验是采用本发明和传统的飞机目标分类方法,分别进行仿真实验。仿真实验结果为20组数据的实验平均结果。
传统的飞机目标分类方法是:李玮璐学者在发表的“基于JEM效应的飞机目标分类方法研究”中介绍的基于微多普勒效应的飞机目标分类方法。
创建15个空的新增样本子集,按机型顺序依次从新增训练样本集中取三类飞机各30个样本,共90个样本放入到不同子集。
利用本发明方法进行在线学习,首先使用初始训练样本集训练MF模型,得到预训练MF模型,随后分15次输入不同的新增训练样本子集,得到预训练MF模型和15组在线学习所得分类器模型在测试样本集上的分类正确率。
利用传统方法进行离线学习,首先使用初始训练样本集训练RF模型,得到预训练RF模型,随后分15次将不同的新增训练样本子集输入初始训练样本集,并使用扩充后的训练样本集重新训练RF模型,得到预训练RF模型和15组离线学习所得RF模型在测试样本集上的分类正确率。
利用传统方法进行遗忘学习,首先使用初始训练样本集训练RF模型,得到预训练RF模型,随后分15次使用不同的新增训练样本子集训练新的RF模型,得到预训练RF模型和15组遗忘学习所得RF模型在测试样本集上的分类正确率。
将本发明方法在线学习所得模型与传统方法离线学习、传统方法遗忘学习所得模型的分类性能实验结果进行比较,即将这三种方法均通过15次学习所得模型在测试样本集下的分类正确率结果绘制成曲线,如图2所示。图2中横坐标表示学习次数,纵坐标表示模型在测试样本集上的分类正确率。图2中以圆圈标示的实线表示采用本发明方法得到模型在测试样本集上的分类正确率随学习次数增加的变化曲线,以星号标示的实线表示采用离线学习方法得到模型在测试样本集上的分类正确率随学习次数增加的变化曲线,以加号标示的实线表示直接使用每次新增训练样本集训练所得模型在测试样本集上的分类正确率随学习次数增加的变化曲线。
由图2可见,本发明方法在线学习所得模型相比传统方法遗忘学习所得模型的分类性能更好,且随着新样本不断输入,本发明的分类性能不断增强,最终得到模型的分类性能相比初始模型提升了4.00%;本发明方法在线学习所得模型相比传统方法离线学习所得模型的分类性能相当。
综上所述,本发明不仅能迅速、自动地更新原模型,不断提升模型对空中飞机目标的分类性能,而且在线学习时仅利用新增训练样本集更新模型,其内存消耗更少,具有良好的实用性。
机译: 使用相同的森林火灾检测系统和森林火灾检测方法以及用于森林火灾检测的空中机器人
机译: 基于典范相关分析和水下目标分类装置的主动声纳水下目标分类方法
机译: 基于身体微动的心律连贯性确定在线社交关系的HRC方法和系统