技术领域
本发明属于信号处理技术领域,特别涉及一种雷达信号识别方法,可用于电子情报侦察、电子支援和威胁告警系统。
背景技术
随着电子信息领域的发展,电子对抗在电子情报侦察、电子支援和威胁告警系统中发挥着重要作用,雷达辐射源信号识别是电子对抗中的重要环节。
然而,当前这种越来越复杂的电磁环境和越来越多样的新型雷达样式,使得电子对抗领域不断面临着新的挑战。如何有效利用截获到的信号去进行识别,确认到个体雷达,进而对辐射源进行定位和追踪;如何提取到更有效的个体特征,这些问题不仅对雷达辐射源个体识别技术的研究提出了新的要求,而且对于后续的精确识别有着非常重要的作用。
吴高洁等人在其2016年发表《一种基于随机森林的雷达辐射源个体识别方法》,该方法通过把构建的脉冲多维细微特征特征向量降维后送入随机森林分类器,获得识别结果。刘歌等人在期刊《电信科学》2016年第5期上发表的《基于随机森林的雷达信号脉内调制识别》中,通过对雷达信号时频图的形状和纹理特征进行融合,并送入随机森林分类器进行信号识别。此外,作为最典型最常用的组合分类器算法,随机森林分类器也被应用于其他各个领域,如刘剑的《一种基于随机森林的太阳能辐射预测模型》,刘倩的《基于随机森林的的温室网纹甜瓜果实品质模拟预测研究》这些文献均在分类过程直接采用了随机森林分类器。然而在现在的大数据环境中,这种直接采用随机森林算法会导致识别速度较慢、训练耗费时间过长的问题。
发明内容
本发明的目的在于针对大数据环境下传统的随机森林分类RFC算法的不足,提出一种基于改进随机森林的雷达辐射源识别方法,以提高识别速度和准确率。
本发明的技术思路是:通过消除分类精度低的决策树和原始RFC中易于重复表决的决策树,构建出具有更快诊断速度和更高分类精度的改进的随机森林IRFC,并将改进的随机森林IRFC应用于雷达辐射源信号识别,提高识别准确率。
根据上述思路,本发明的实现方案包括如下:
1)用MATLAB软件仿真生成雷达信号的数据集,该数据集包括含有9类不同相位噪声、脉宽、带宽及载频的LFM信号,其中每类信号从0-20dB每隔4dB信噪比分别产生1000个信号作为数据集进行实验;
2)将1)产生的数据集信号以序列的形式输出,并提取数据集信号的如下特征:
对信号序列进行Morlet小波变换,得到信号序列的包络分量,提取包络的上升沿时间、脉宽、顶降三个输出特征;
对信号序列利用围线积分提取相位噪声双谱特征,根据双谱特征计算信号序列的波形熵E
对信号序列进行VDM分解,获取信号序列带宽,中心频率和拉格朗日乘数三个输出特征;
3)将以上输出特征合成九维特征向量矩阵,把每个信号序列的特征向量矩阵及其所属的信号类别作为一条数据,合成新的数据集,从数据集中每类信号的每种信噪比下随机抽取800个样本作为训练集,剩下200个样本作为测试集;
4)对随机森林分类器RFC进行改进:
4a)利用训练集训练原始的RFC模型,将测试集输入到训练好的RFC中,设定精度阈值q,评估每个决策树的分类精度,并消除分类精度低于设定精度阈值q的决策树,获得包含w个决策树的子森林;
4b)遍历子森林的w个决策树,获得子森林的所有路径信息;
4c)通过路径信息计算子森林中决策树两两之间的相似度S
4d)设定相似度阈值c,将相似度矩阵M中每一行相似度S与相似度阈值c进行比较,对相似度矩阵M中的决策树进行分类,得到决策树的m个类别;
4e)从每个类别中选择分类精度最高的决策树合并,得到改进的随机森林IRFC模型;
5)通过bootstrap采样方法对训练集进行采样获得训练子集,将训练子集输入改进的随机森林IRFC模型进行模型训练;每一轮训练后利用训练集里未被采样的数据对该轮获得的模型进行分类准确率评估,当分类准确率达到期望值时,停止训练,获得训练好的IRFC;
6)将测试集数据输入到训练好的IRFC中,输出每个测试数据的预测的LFM信号类别C
本发明具有如下优点:
1)本发明由于改进了随机森林分类方法,通过消除易于表决重复的决策树,解决了大数据环境下传统随机森林算法中决策树表决重复的问题,有效提高了雷达辐射源信号识别速度;
2)本发明通过消除分类精度低的决策树,解决了大数据环境下传统随机森林识别准确率低的问题,有效提高了雷达辐射源信号识别准确率。
附图说明
图1是本发明的整体实现流程图。
图2是本发明识别准确率的仿真结果图。
具体实施方式
以下结合附图,对本发明的实施例和效果进行详细描述。
参照图1,本实施例的实现包括如下步骤:
步骤1:生成雷达信号数据集。
该数据集包括含有9种不同相位噪声、脉宽、带宽及载频的LFM脉冲信号,仿真步骤如下:
1.1)设置辐射源理想发射信号的脉宽为10us,带宽为10MHz,载频为10GHz,采样频率为100MHz;
1.2)给理想发射信号加入三种不同的相位噪声S1、S2、S3,其相位系数设置如表1所示,得到携带不同相位噪声的LFM信号。
表1三种相位噪声调相系数设置
1.3)分别将第一种含相位噪声S1的LFM信号通过第一个巴特沃斯滤波器F1,将第二种含相位噪声S2的LFM信号通过第二个巴特沃斯滤波器F2,将第三种含相位噪声S3的LFM信号通过第三个巴特沃斯滤波器F3进行滤波,得到通过巴特沃斯滤波器的三种含相位噪声的LFM信号,记为E1,E2,E3;
其中,三种不同的巴特沃斯滤波器的参数设置如表2所示:
表2巴特沃斯滤波器参数设置
1.4)在通过巴特沃斯滤波器的三种含相位噪声的LFM信号E1,E2,E3中,均加入信噪比为0dB、4dB、8dB、12dB、16dB、20dB的噪声,使得每一种通过巴特沃斯滤波器的含相位噪声的LFM信号在每个信噪比点分别产生1000个样本,共记18000个;
1.5)改变脉冲宽度为7us,带宽为5MHz,载频为8GHz,重复上述1.2)~1.4)过程,得到三种新的不同的信号E4,E5,E6的不同信噪比下的样本共计18000个;
1.6)改变脉冲宽度为15us,带宽为20MHz,载频为12GHz,重复上述1.2)~1.4)过程,又得到三种新的不同的信号E7,E8,E9的不同信噪比下的样本共计18000个;
1.7)将1.4),1.5),1.6)种获得的样本组合到一起作为数据集,得到9种不同类型信号在6种不同信噪比下的模拟信号样本,共计54000个。
步骤2:提取上述数据集信号的特征。
2.1)将上述产生的数据集信号以序列的形式输出,并对信号序列进行Morlet小波变换,得到信号序列的包络分量:
其中,a是尺度因子,b是平移因子,t表示时间,s(t)表示输入信号序列,ψ
2.2)提取包络分量的上升沿时间、脉宽、顶降三个输出特征:
2.2.1)设置包络分量上升沿达到包络分量最大幅值10%对应的时间,作为上升沿开始时间t
2.2.2)设置包络分量上升沿达到包络分量最大幅值的50%对应的时间,作为脉宽的测量起始时间t
2.2.3)将包络分量第一次到达包络分量最大幅值的90%对应的时间记为t
2.3)对信号序列利用围线积分提取相位噪声双谱特征,根据双谱特征计算信号序列的波形熵E
其中,
β
2.4)对信号序列进行VDM分解,得到V个本征模态函数分量;
2.5)获取信号序列带宽
2.5.1)初始化时域带宽
2.5.2)对频域带宽
其中
2.5.3)更新频域拉格朗日乘数
其中,
2.5.4)计算每一个本征模态函数分量迭代第n+1次的频域带宽
比较Y与精度ε:
若Y>ε且n 若Y≤ε,则完成迭代,获取频域带宽 步骤3:获取训练集和测试集。 将2.2)、2.3)、2.5)中输出的特征合成九维特征向量矩阵,把每个信号序列的特征向量矩阵及其所属的信号类别作为一条数据,合成新的数据集; 从数据集中每类信号的每种信噪比下随机抽取800个样本作为训练集,剩下200个样本作为测试集。 步骤4:对随机森林分类器RFC进行改进。 4.1)在训练集中进行r次bootstrap采样获得r个训练子集,对每个训练子集通过随机选择特征构成特征子集; 4.2)根据训练子集和特征子集,从根节点开始,在每个节点上递归执行以下操作生成决策树构成随机森林: 4.2.1)根据当前节点O的训练子集D对应特征子集中每个特征A的每个切点a 计算每个特征A具有的所有切点a
其中, 4.2.2)从所有的特征A和它们的可能取值切点a 4.2.3)在得到的两个子节点上均重复步骤4.2.1)和4.2.2),对子节点进行划分; 4.2.4)重复4.2.1)至4.2.3),直到所有节点都为叶节点,完成决策树的构建; 4.2.5)对r个训练子集均进行4.2.1)至4.2.4)的操作,得到r棵决策树,再将这r棵决策树组合起来构成随机森林RFC模型; 4.3)对获取的随机森林RFC模型进行训练: 4.3.1)通过bootstrap采样方法对训练集进行采样获取新的训练子集b 4.3.2)将新的训练子集b 4.3.3)利用训练集里未被采样的数据对训练后的随机森林RFC模型进行分类准确率评估: 当分类准确率没有达到期望值时,返回步骤4.3.1); 当分类准确率达到期望值时,停止训练,获得训练好的随机森林RFC模型。 4.4)将测试集输入到训练好的RFC模型,设定精度阈值q,评估每个决策树的分类精度,并消除分类精度低于设定精度阈值q的决策树,获得包含w个决策树的子森林; 4.5)遍历子森林的w个决策树,获得子森林的所有路径信息; 4.6)通过路径信息根据两两决策树之间的根节点是否相同计算子森林中决策树两两之间的相似度S 如果决策树DT 如果决策树DT
其中,S 4.7)通过相似度构造相似度矩阵M如下:
4.8)设定相似度阈值c,将相似度矩阵M中每一行相似度与相似度阈值c进行比较,对相似度矩阵M中的决策树进行分类: 先将相似度矩阵M中第一行相似度超过阈值c的决策树归为一类,再确定第i行的决策树DT 完成相似度矩阵M中共w行的相似度对比之后,将决策树分为m个类别; 4.9)从每个类别中选择分类精度最高的决策树合并,作为改进的随机森林IRFC模型。 步骤5:获得新的训练子集对改进的随机森林IRFC模型进行训练。 5.1)通过bootstrap采样方法对训练集进行采样获取最终的训练子集e 5.2)将最终的训练子集e 5.3)利用训练集里未被采样的数据对训练后的改进随机森林IRFC模型进行分类准确率评估: 当分类准确率没有达到期望值时,返回步骤5.1); 当分类准确率达到期望值时,停止训练,获得训练好的改进随机森林IRFC。 步骤6:将测试集数据输入到训练好的改进随机森林IRFC中,输出每个测试数据x的预测的LFM辐射源信号类别C 则对于每个测试数据x,其输出结果由每个决策树共同决定,表达式如下:
其中,C 本发明的效果可以通过以下仿真进一步阐述。 1.仿真条件: 硬件工具为:商用计算机、芯片为Intel Core i5-6500处理器、主频3.20GHz、内存8GB、硬盘为1TB;操作系统:Windows 7;开发工具:Matlab 2014a,spyder 3.3.6。 2.仿真内容: 将步骤3中的九维特征向量矩阵分别输入到本发明改进的随机森林IRFC分类器和现有的KNN分类器、支持向量机SVM分类器、决策树DT分类器、随机森林RFC分类器,得到这些分类器对步骤1中的辐射源信号类型在不同信噪比下的信号类型识别准确率,如附图2所示。 从图2可以看到,本发明的辐射源信号识别的正确率明显高于其他分类器,并且随着信噪比的升高,本发明的识别正确率也在升高,可以达到很好的识别效果。 以上描述仅是本发明的一个具体实例,并未构成对本发明的任何限制,显然对于本领域的专业人员来说,在了解本发明的内容和原理后,都可能在不背离发明原理、结构的情况下,进行形式和细节上的修改和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。
机译: 基于附加有源辐射源的雷达反雷达导弹防护方法
机译: 基于无源辐射源的雷达反雷达导弹防护方法
机译: 调频连续波雷达装置的目标识别方法,涉及基于将反射波强度转换为雷达反射截面而生成的判断数据来识别车辆