首页> 中国专利> 一种网络化协同系统中多维数据安全性检测的方法

一种网络化协同系统中多维数据安全性检测的方法

摘要

一种网络化协同系统中多维数据安全性检测的方法,其属于物联网信息安全技术领域。该方法基于异常的数据进行安全性检测,利用LSTM算法进行数据预测和时序特征提取,基于智能节点的状态建立知识图谱,在逻辑上建立数据间的联系。同时,将各状态的权重矩阵写入知识图谱中作为一种属性,以使神经网络能够快速地动态更新权重,提高判断精度和速度;通过对比预测值与实际值之间的差异,结合多元高斯分布模型,从数学角度建立数据间的联系,综合判断数据点的异常状态。该方法对节点数据的描述更加细致;较传统方法更能适应物联网的复杂网络环境。并且对物联网架构、传输协议等无依赖,具有较强的泛化能力,网络化协同系统均可使用。

著录项

  • 公开/公告号CN112822191A

    专利类型发明专利

  • 公开/公告日2021-05-18

    原文格式PDF

  • 申请/专利权人 大连理工大学;

    申请/专利号CN202110010432.0

  • 发明设计人 丁男;成斌;葛宏伟;吴迪;

    申请日2021-01-06

  • 分类号H04L29/06(20060101);H04L29/08(20060101);G06N3/04(20060101);G06F17/16(20060101);

  • 代理机构21208 大连星海专利事务所有限公司;

  • 代理人杨翠翠

  • 地址 116024 辽宁省大连市高新园区凌工路2号

  • 入库时间 2023-06-19 11:02:01

说明书

技术领域

本发明属于物联网信息安全技术领域,涉及到一种在网络化协同系统中针对协同数据进行安全性和有效性检测的方法,特别涉及基于知识图谱的多维数据的检测。

背景技术

物联网以智能设备为节点,节点间彼此通信以构成网络。到2020年底,估计将有500亿台设备。随着物联网的兴起,网络化的协同系统在各行各业得到广泛应用。在物联网的特殊背景下,数据流可以通过物理设备直接对现实产生作用,因此网络化协同系统中数据的安全性尤为重要。网络化协同系统中节点的异构性以及系统本身跨领域性质,为网络安全带来了新的安全挑战。传统网络的安全措施(例如加密、身份验证、访问控制等)在物联网的大背景下,很难发挥应有的作用。网络化协同系统中,一旦一个节点被攻破,攻击者很容易以单节点为基础,向网络发送虚假数据,辐射影响整个网络,造成难以承受的影响,甚至危及系统使用者的人身及财产安全。

当前,通常的入侵检测机制主要是基于标签,根据已有的网络攻击类型的特征,进行识别和防范,即,将网络中节点发送数据的行为与攻击模型对比,通过数据包的源地址、目的地址、发送频率等内容,确定是否收到攻击以及攻击的类型。但是这样的做法并不能在新的攻击出现时进行识别。由于物联网自身结构和网络节点复杂多样,智能设备往往自身就会存在许多安全漏洞。这就导致了针对物联网的攻击和变体数不胜数,新的攻击类型层出不穷。上述的基于标签的入侵检测系统在协同化网络系统中应用效果并不理想。

针对上述情况,物联网的安全机制逐渐从基于攻击特征和标签进行分类,转向基于数据内容和正常行为约束的异常检测,在这方面目前已经出现了相关的研究和技术。纽约州立大学的Summerville等人[Summerville,D.H.,Zach,K.M.,Chen,Y.,2015.Ultra-lightweight deep packet anomaly detection for Internet of Things devices.In:2015IEEE Proceedings of the 34th International Performance Computing andCommunications Conference(IPCCC),IEEE,pp.1–8.]提出,在物联网的大背景下,基于异常的入侵检测方法相对效果会更好。但同时,他们也提出,在资源受限的系统中运行此类方法会需要更高的计算要求,这一点逐渐得到了业界的认可。而佛罗里达大学的ArmanSargolzaei等人[A.Sargolzaei,K.Yazdani,A.Abbaspour,C.D.Crane III andW.E.Dixon.Detection and Mitigation of False Data Injection Attacks inNetworked Control Systems[J].IEEE Transactions on Industrial Informatics,vol.16,no.6,June 2020,pp.4281-4292.]提出了一种卡尔曼滤波器结合神经网络架构的方法来检测和缓解智能电网中的虚假数据。这种方法兼顾了计算复杂性和良好的适应性,但是忽略了网络节点自身的不同状态对于数据模式的影响,同时,他们将重点放在了缓解虚假数据的影响上,没有测试检测算法的性能。

发明内容

本发明的目的是利用各智能体发出的数据流进行数据分析,在智能体协同的过程中,提供一种数据安全性检测的方法,如图1所示。该方法主要是在智能体进行信息交互时,将与协同策略有关的数据进行处理,利用长短期记忆神经网络(LSTM网络)、知识图谱技术及多元高斯分布模型,分析数据在时序特性及数据相关性上是否正常。一旦发现数据异常,向系统发布节点异常信息,对异常智能体进行处理。该方法主要运行在网络化协同系统中的各个智能节点上,只要其能接收到其他智能体发送的信息和一定的计算能力即可。

本发明的技术方案是:对网络化协同系统运行过程中,各智能节点传输的数据是否安全有效进行分析,该方法运行在协同系统中的智能节点上,只要其能接收到其他智能体发送的信息和具有一定的计算能力即可。首先,对网络化协同系统中流动的与协同策略相关的数据建立时序分析模型与数据关联分析模型;其次,将智能节点发来的数据进行处理后,输入模型,获得数据分析结果;最后,对数据输入各模型后得到的输出结果进行综合判断,判断发送数据的智能体是否处于正常状态。对智能体数据流建立模型,以及进行数据安全性检测的步骤如下:

步骤1.数据预处理,即接收到智能节点发来的协同策略有关系的数据后,对数据进行筛选、特征提取、形状重组,并将重组后的数据传递给下一模块;

所述形状重组按LSTM网络按时间展开的特性将数据处理为特定格式,形状为[样本量,时间步,特征数];样本量代表一次训练的样本的数量;时间步代表LSTM网络按时间展开的层数;特征数代表输入网络中的数据的维数,即网络输入层的节点数量;

步骤2.建立LSTM网络模型,即接收经过预处理后的数据集,设定参数及超参数,训练LSTM网络预测模型;

LSTM网络按时间展开,设计一层隐藏层;使用数据集训练LSTM网络模型,损失函数使用预测值与真实值的误差的均方根值;损失函数完成收敛,即模型训练完成;

步骤3.建立知识图谱,即接收LSTM预测误差及原始数据,依据协同策略建立基于机器人状态的知识图谱,返回权重更新矩阵修正误差数据;

构建知识图谱的方式如下:

(1)依据网络化协同系统中的协同策略,将知识图谱中的实体定义为智能节点的状态;(2)将属性定义为与各个状态有关的各项数据,包括各传感器给出的实时测试数据,通过协同策略、控制策略获得的阈值数据以及通过数据处理手段获得的数据;(3)根据协同策略中各个状态之间的共有属性,确定知识图谱中各实体的连接;(4)为每个状态训练各自的LSTM网络模型,并将权重矩阵写入知识图谱的实体属性中;

在知识图谱构建时,加入各状态分别训练的LSTM网络的权重矩阵作为一个属性;权重更新时,LSTM模块将原始数据与该模块的预测误差输入知识图谱,经过图搜索,确定智能节点对应的状态,进而将该状态的权重矩阵导入LSTM模块,重新预测误差;

步骤4.建立多元高斯分布模型:即接收LSTM模块传递的误差数据,计算均值向量和协方差矩阵,建立多元高斯分布模型,并设定概率密度阈值;

多元高斯分布模型的构建是模型中重要参数的计算,即各列数据的均值μ,各列数据间的协方差矩阵∑,以及计算各点的概率密度P;

假设n维数据集,m个数据点{x

在此基础上由公式(2)构建协方差矩阵∑:

计算出上述两项参数之后,再计算协方差矩阵的逆∑

其中:μ,σ

通过公式(4)计算误报率,其中FP代表被误判为异常的数据的数量,TN代表实际为正常且判断为正常的数据的数量;依据误报率最小化原则,减小α的值,直至误报率无明显变化;

修改数据集,人为加入非法数据,判断数据中的异常点,通过公式(5)计算召回率,其中TP代表实际为异常且判断为异常的数据的数量,FN代表实际为异常但判断为正常的数据的数量;依据召回率最大化原则,增大α的值;直至召回率达到100%;

步骤5.数据安全性检测,即将即时数据经过数据预处理后,输入上述步骤建立的模型中,根据多元高斯分布模型计算的概率密度,比较函数概率密度与概率密度阈值α,判断数据点是否安全有效;

若P(x;μ,σ

步骤6.节点安全性评估,即根据某智能节点一段时间内的数据安全性检测,判断该智能节点是否在安全状态下正常工作;

某智能节点某一刻的数据是否存在风险,结合物联网系统自身的不稳定性,节点风险评估方式为:若一段时间内,60%时间的数据被视为风险数据点,则将该节点视为风险节点。

2、根据权利要求1所述的多智能体协同系统中基于知识图谱的多维数据安全性联合检测方法,其特征在于:所述步骤2中知识图谱为智能仓储系统中搬运机器人的知识图谱,利用IMU惯性单元测得的角速度、加速度,距离传感器测得的位置信息,里程计数据处理得到的速度信息以及由控制策略获知的数据上下限波动范围构建知识图谱:

每条路径上只允许一台机器人通过,在每个路口附近,机器人通过传递数据决定通过的先后顺序,并调节自身的速度或停车等待,使整个系统有序运行;机器人的状态为五种:正常直行、路口转弯、路口抢占、停车等待、减速让行,分别对应图谱中S_1~S_5;θ_0表示角速度值在0附近上下波动,θ_1表示角速度存在且在由机器人控制系统给定一确定值附近上下波动;a_0表示加速度在0附近上下波动,amin_3、amin_5分别表示在S_3和S_5下合法加速度的下限,amax_3、amax_5表示加速度的上限;v_0表示速度在0附近上下波动,vmin_1、vmin_3、vmin_5分别为各状态下合法速度的下限,vmax_1、vmax_3、vmax_5表示速度的上限;x_0表示机器人在路口处,x_1表示与路口的距离的值;W_1~W_5为针对不同状态建立的LSTM网络权重矩阵;

上述数据中角速度θ和加速度a由IMU惯性测量单元采集,速度v通过里程计采集位移值计算得出,速度和加速度的上下限由控制策略得到,与路口的距离x通过距离传感器测得,权重矩阵W针对不同状态的数据训练得到。

本发明的效果和益处是:该方法基于异常的数据进行安全性检测,利用LSTM算法进行数据预测和时序特征提取,依据知识图谱的有关思想和网络化协同系统的具体协同策略,基于智能节点的状态建立知识图谱,在逻辑上建立数据间的联系。同时,将各状态的权重矩阵写入知识图谱中作为一种属性,以使神经网络能够快速地动态更新权重,提高判断精度和速度;然后,通过对比预测值与实际值之间的差异,结合多元高斯分布模型,从数学角度建立数据间的联系,综合判断数据点的异常状态。本方法使用基于异常而非基于标签的安全性检测方法,较传统方法更能适应物联网的复杂网络环境;并且与其他基于异常的数据安全性检测方法相比,知识图谱的引入可以将智能节点的状态对数据的影响纳入检测方法的范畴,对节点数据的描述更加细致。该方法中知识图谱的引入使LSTM模型的权重矩阵可以依节点状态变换而更新,避免了神经网络动态更新所需要的高额计算代价,兼顾了准确性和即时性。本方法面向数据结合协同策略,对物联网架构、传输协议等无依赖,故具有较强的泛化能力,网络化协同系统均可使用。

附图说明

图1是数据安全性检测的流程图。

图2是知识图谱示意图。

图3是图2所示知识图谱的场景支撑。

具体实施方式

以下结合技术方案和附图详细叙述本发明的具体实施方式。

一种网络化协同系统中多维数据安全性检测的方法,包括以下步骤:

1、数据形状重组

由于LSTM网络激活函数的特性,其对(0,1)区间内的数据更为敏感,首先对数据进行标准化处理。求各列数据与本列数据最大值的比值,代替其在数据中的位置,即可将数据映射到(0,1)区间。又由于LSTM网络按时间展开的特性,需要将数据处理为特定格式,形状为[样本量,时间步,特征数]。样本量代表一次训练的样本的数量。时间步代表LSTM网络按时间展开的层数。特征数代表输入网络中的数据的维数,即网络输入层的节点数量。

2、搭建LSTM网络隐藏层

LSTM网络按时间展开,同时考虑到应用环境在算力方面的限制,故只设计一层隐藏层。经测试,当时间步展开设定为协同策略决定智能体下一步行为所需最大时钟周期+1时可以达到较好的效果和较短的计算时间。激活函数与节点单元个数,视数据模式而定,也可以由实验确定。使用数据集训练LSTM网络模型,损失函数使用预测值与真实值的误差的均方根值。当损失函数完成收敛,即模型训练完成。

3、建立知识图谱

依据网络化协同系统中的协同策略,将知识图谱中的实体定义为智能节点的状态,属性即为与各个状态有关的各项数据,根据协同策略中各个状态之间的转换方式,确定知识图谱中各实体的连接。最后使用步骤2中的方式,以相同参数为每个状态训练LSTM网络的权重矩阵,加入知识图谱中,作为属性的一部分。

图2为在智能仓储系统中,为搬运机器人设计的知识图谱。场景如图3所示,A~F表示机器人,每条路径上只允许一台机器人通过,在每个路口附近,机器人通过传递数据决定通过的先后顺序,并调节自身的速度或停车等待,使整个系统有序运行。机器人的状态可以归结为五种:正常直行、路口转弯、路口抢占、停车等待、减速让行,分别对应图谱中S_1~S_5。图2中θ_0表示角速度值在0附近上下波动,θ_1表示角速度存在且在一确定值(由机器人控制系统给定)附近上下波动;a_0表示加速度在0附近上下波动,amin_3、amin_5分别表示在S_3和S_5下,合法加速度的下限,amax_3、amax_5表示加速度的上限;v_0表示速度在0附近上下波动,vmin_1、vmin_3、vmin_5分别为各状态下合法速度的下限,vmax_1、vmax_3、vmax_5表示速度的上限;x_0表示机器人在路口处,x_1表示与路口的距离的值。W_1~W_5为针对不同状态建立的LSTM网络权重矩阵,其形状与步骤2中搭建的LSTM网络权重矩阵相同。

上述数据中角速度θ和加速度a由IMU惯性测量单元采集,速度v通过里程计采集位移值计算得出,速度和加速度的上下限由控制策略得到,与路口的距离x通过距离传感器测得,权重矩阵W由与步骤2相同的方式,针对不同状态的数据分别训练得到。

4、权重更新

LSTM模块是基于机器人运行一段时间内所有状态的数据进行训练,逻辑上是状态的“平均”。故其可以在一定程度上描述各状态(因此预测误差可以作为知识图谱的属性)。在步骤3中,知识图谱构建时,加入了针对各状态分别训练的神经网络的权重矩阵W作为一个属性。权重更新时,LSTM模块将原始数据与该模块提取的特征输入知识图谱,经过图搜索,确定智能节点对应的状态,进而将该状态的权重矩阵W导入LSTM模块,重新预测误差。

5、建立多元高斯分布模型

多元高斯分布模型的构建主要是模型中重要参数的计算,即各列数据的均值μ,各列数据间的协方差矩阵∑,以及计算各点的概率密度P。假设n维数据集,m个数据点{x

计算出上述两项参数之后,再计算协方差矩阵的逆∑

然后随机设定概率密度阈值α,判断数据中的异常点。通过公式(4)计算误报率,其中FP代表被误判为异常的数据的数量,TN代表实际为正常且判断为正常的数据的数量。依据误报率最小化原则,减小α的值,直至误报率无明显变化。

修改数据集,人为加入非法数据,判断数据中的异常点,通过公式(5)计算召回率,其中TP代表实际为异常且判断为异常的数据的数量,FN代表实际为异常但判断为正常的数据的数量。依据召回率最大化原则,增大α的值。直至召回率达到100%。

6、数据安全性检测步骤

将即时数据按步骤1到步骤5经处理方式处理,然后经过LSTM网络、知识图谱更新权重矩阵、预测误差计算,得到误差向量x

7、节点风险评估

根据步骤6可得到某智能节点某一刻的数据是否存在风险,考虑到物联网系统自身的不稳定性,节点风险评估方式为:若一段时间内,60%时间的数据被视为风险数据点,则将该节点视为风险节点,并进行后续处理。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号