首页> 中国专利> 一种基于双路卷积长短期神经网络的自动识别方法及系统

一种基于双路卷积长短期神经网络的自动识别方法及系统

摘要

本发明公开一种基于双路卷积长短期神经网络的自动识别方法及系统,利用将无线电信号的同向分量和正交分量转换成幅度分量和相位分量;构造双路神经网络,将简单的同向正交分量送入到卷积神经网络,同时,将转换的幅度相位分量送入到长短期神经网络进行识别;然后,将两路神经网络提取的时空特征进行信息融合,连接成一个新的特征矩阵;训练神经网络,使用softmax分类器完成信号识别分类。本发明基于双路卷积长短期神经网络,可以同时提取信号的时间和空间特征,并且为不同的特征选择适合的神经网络,充分利用神经网络提取特征的能力,学习更好的性能,提高分类的准确率。

著录项

  • 公开/公告号CN112241724A

    专利类型发明专利

  • 公开/公告日2021-01-19

    原文格式PDF

  • 申请/专利权人 南京信息工程大学滨江学院;

    申请/专利号CN202011186593.7

  • 发明设计人 郭业才;胡国乐;王庆伟;李晨;

    申请日2020-10-30

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32204 南京苏高专利商标事务所(普通合伙);

  • 代理人柏尚春

  • 地址 214105 江苏省无锡市锡山区锡山大道333号

  • 入库时间 2023-06-19 09:36:59

说明书

技术领域

本发明属于深度学习领域,具体涉及一种基于双路卷积长短期神经网络的自动调制识别方法及系统,用于射频信号调制方式识别分类。

背景技术

自动调制识别方法主要有基于似然和基于特征两类。基于似然的识别方法通过接收信号的似然函数,把似然比和对应阈值进行比较,做出判决。基于特征的识别方法关键特征可分为时域特征:瞬时振幅、相位、频率;变换域特征:小波变换、傅里叶变换;高阶统计特征等。传统的方法准确率较低,运算量大,识别困难。深度学习以其杰出的特征提取能力广泛应用于自动调制识别方面。不同的模型结构对于不同的特征有不同的敏感度,因此,用双路神经网络结构提取不同的特征,使识别效果更加准确。

发明内容

发明目的:本发明提供一种基于双路卷积长短期神经网络的自动识别方法及系统,解决的是单个神经网络只能提取单一特征,导致特征提取不完全,从而达到更好的识别效果。

技术方案:本发明所述的一种基于双路卷积长短期神经网络的自动识别方法,具体包括以下步骤:

(1)将无线电信号的同相分量和正交分量转换成幅度分量和相位分量;

(2)构造双路神经网络,将简单的同向正交分量送入到卷积神经网络,同时,将转换的幅度相位分量送入到长短期神经网络进行识别;

(3)将两路神经网络提取的时空特征进行信息融合,连接成一个新的特征矩阵;

(4)训练双路神经网络,使用softmax分类器完成信号识别分类。

进一步地,所述步骤(1)通过以下公式实现:

其中,X

进一步地,步骤(2)所述的双路神经网络分别为卷积神经网络和长短期神经网路;所述卷积神经网络由一层卷积网络层构成,卷积网络层由卷积滤波和非线性激活函数ReLU构成,卷积网络层的滤波器大小为1*3,个数为256个;所述长短期神经网路由两层神经网络层构成,每层有256个神经单元。

进一步地,步骤(3)所述的两路神经网络提取的特征进行融合,采用特征相连的方式,表达式如下:

其中,concat表示融合后的信息,f

进一步地,步骤(4)所述的训练双路神经网络采用反向传播算法,多分类激活函数softmax作为最后一层的激活函数,目标函数为交叉熵损失函数,表达式如下:

其中,Loss表示交叉熵损失函数,N为样本个数,y

本发明还提供一种基于双路卷积长短期神经网络的自动识别系统,包括输入层、卷积神经网络层、长短期神经网路层、融合层以及输出层;所述卷积神经网络层和长短期神经网路层采用并联的方式同时提取信号的不同特征;所述输入层对输入信息进行收集,将采集到的调制信号作为2*128大小的矩阵进行处理,其中信号采样的同相和正交部分分开;所述卷积神经网络层提取信号的空间特征,采用一个卷积层,卷积核大小为1*3,卷积层节点数为256个,后面连接一个dropout层,激活函数使用ReLU函数;所述长短期神经网路层提取信号的时间特征,采用两层LSTM,每层有256个神经单元逐层从调制信号中提取有用信息,并且使用了L2正则化防止模型过度拟合;所述融合层将卷积神经网络提取的空间特征和长短期神经网路提取的时间特征进行融合,两路特征通过特征相连串接成新的特征矩阵。

有益效果:与现有技术相比,本发明的有益效果:本发明基于双路卷积长短期神经网络,可以同时提取信号的时间和空间特征,并且为不同的特征选择适合的神经网络,充分利用神经网络提取特征的能力,学习更好的性能,提高分类的准确率。

附图说明

图1是基于卷积长短期神经网络的自动识别系统结构图;

图2是两路神经网络得到的特征矩阵到融合矩阵的示意图;

图3是LSTM网络对不同输入信号的识别率;

图4是CNN网络对不同输入信号的识别率;

图5是不同LSTM层数对识别性能的影响;

图6是不同CNN层数对识别性能的影响;

图7是不同算法的识别率。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明。

本发明提供一种基于卷积长短期神经网络的自动识别系统,如图1所示,基于卷积长短期神经网络的自动识别网络结构包括输入层、卷积神经网络(CNN)层和长短期神经网路(LSTM)层、融合层以及输出层;其中CNN层和LSTM层采用并联的方式同时提取信号的不同特征。

输入层主要完成输入信息的收集,将采集到的调制信号作为2*128大小的矩阵进行处理,其中信号采样的同相和正交部分分开。CNN层主要提取信号的空间特征,采用一个卷积层,卷积核大小为1*3,卷积层节点数为256个,后面是一个dropout层,防止模型过度拟合,dropout率设置为0.4,其中激活函数使用ReLU函数,ReLU函数定义为ReLU(x)=max(0,x)。LSTM层主要提取信号的时间特征,采用两层LSTM层,每层有256个神经单元逐层从调制信号中提取有用信息,并且使用了L2正则化防止模型过度拟合。融合层主要将CNN网络提取的空间特征和LSTM提取的时间特征进行融合,两路特征通过特征相连的方式串接成新的特征矩阵。输出层主要完成各个调制方式的预测概率向量,采用全连接层和softmax函数,全连接层将融合特征映射到稀疏空间,softmax函数将全连接输出映射到(0,1)区间内,选取概率最大的节点作为预测目标,最后判定何种调制方式:

其中,

本发明还提供一种基于卷积长短期神经网络的自动识别方法,具体包括以下步骤:

步骤1:利用RadioML2016.10a数据集,将无线电信号的同相分量和正交分量转换成幅度分量和相位分量。

将无线电信号的同相分量和正交分量转换成幅度和相位分量,利用下式进行计算:

式中,X

步骤2:构造双路神经网络,将简单的同向正交分量送入到卷积神经网络,同时,将转换的幅度相位分量送入到长短期神经网络进行识别。

双路神经网络分别为卷积神经网络(CNN)和长短期神经网路(LSTM)。CNN由一层卷积网络层构成,卷积网络层由卷积滤波和非线性激活函数ReLU构成,卷积网络层的滤波器大小为1*3,个数为256个。LSTM由两层神经网络层构成,每层由256个神经单元。

步骤3:将双路神经网络提取的时空特征进行信息融合,连接成一个新的特征矩阵。

同相正交分量更适合CNN网络提取空间特征,幅度相位分量更适合LSTM网络提取时间特征,将两种特征采用特征相连(“concatenate”)的方式,表达式如下:

其中,concat表示融合后的信息,f

步骤4:训练双路神经网络,使用softmax分类器完成信号识别分类。

训练神经网络过程采用反向传播算法,多分类激活函数softmax作为最后一层的激活函数,目标函数为交叉熵损失函数,表达式如下:

其中,Loss表示交叉熵损失函数,N为样本个数,y

数据集是开源软件无线平台生成的RadioML2016.10a数据集,70%的数据集被随机选择用于训练,30%用于测试。为了避免局部优化,采用最小批数为1024个向量的随机梯度下降法。优化器使用Adam,学习率设置为0.01。模型在GPU上训练100个周期,同时加入了early-stopping机制,耐心值设置为5。实施平台是使用带有Tensorflow的Keras作为后端,配备3.40GHz CPU,16GB RAM和单个NVIDA GeForce GTX 1080GPU的系统。

图3和图4是不同模型输入不同类型的信号训练的模型的性能。从图中得知幅度相位(Amplitude/Phase,A/P)分量更适合于LSTM结构提取时序特征进行序列分类,同相正交(In-phase/Quadrature,I/Q)分量更适合于CNN结构提取空间特征进行信号分类。如果只向LSTM网络提供I/Q分量,结果会很糟,因为LSTM不能提取任何有意义的表示,该模型甚至不能减少训练损失,在数据集上只能给出27%的准确率。同样,CNN网络中的A/P分量也无法产生比I/Q分量更好的效果。

图5是LSTM层数对识别性能的影响。第一层LSTM提取的初步时序特征为输入后,多层LSTM网络进一步提取时序特征。图5表明,LSTM层数过少可能导致特征提取不完全,从而识别效果较差;过多则会达到饱和状态,继续增加层数只会造成网络臃肿,性能难以提升。

图6是CNN层数对识别性能的影响,当采用一层卷积层时,网络有最高的识别精度;当增加卷积层后,网络性能下降,说明网络采取一层卷积层提取的特征就很好的反映调制样式信息,再增加卷积层只会提取冗余特征,只会增加网络复杂度,泛化能力下降。

图7是不同算法的性能比较,图中将本发明(DCL)、CNN2(两个卷积层和两个密集层,滤波器的数量分别是256和80个,大小分别为1*3和2*3,两层密集层的神经单元数量为128和11个)、CNN4(在CNN2基础上增加两层卷积层)、ResNet(三个残差块和三个完全连接的层位于三个残差堆栈后面)、CLDNN(CNN+LSTM+DNN)和AMCNet(四个卷积层,dropout层和高斯噪声层)进行对比,图7表明,五种方法的识别性能均随着信噪比的增加而提高。单个CNN模型只提取空间特征,导致大量有价值的信息丢失,因此识别准确率仅为73%。ResNet模型的核心是在前层和后层之间创建捷径(跳过连接),这些特性使得ResNet能够取得比CNN更好的性能,但是,随着网络的深入,ResNet网络的分类精度会大大降低。CLDNN是CNN、LSTM和DNN的组合,采用的串联的方式,模型结构复杂,识别精度高于除我们提出的网络模型。双路卷积长短期模型能够同时提取时间和空间特征,采用双路融合的方式,识别率最高。显然,本发明的优势十分明显。

以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号