首页> 中国专利> 一种恶意环境下的多智能体系统安全趋同控制方法

一种恶意环境下的多智能体系统安全趋同控制方法

摘要

本发明针对恶意环境下的多智能体系统,提出一种具有抵御敌对攻击和通信时延能力的安全趋同控制方法,属于多智能体系统分布式协调控制领域。该方法的实现过程包括:(1)通过个体自身状态信息以及周围邻居节点的时延信息,构造一个自适应删减参数rt(k),每一轮自适应地删减接收的信息个数,并将留存的信息用作自身状态更新,最终实现所有正常智能体的状态一致;(2)应用图论知识分析了多智能体系统在遭受恶意攻击下实现趋同控制的条件。本发明方法与传统方法相比,突破了传统方法只适用于固定网络拓扑且不考虑通信时延的多智能体系统等方面的局限,在工业领域和军事中具有很强的实用前景。

著录项

  • 公开/公告号CN105467839A

    专利类型发明专利

  • 公开/公告日2016-04-06

    原文格式PDF

  • 申请/专利权人 浙江工业大学;

    申请/专利号CN201510788018.7

  • 申请日2015-11-16

  • 分类号G05B13/04(20060101);

  • 代理机构33201 杭州天正专利事务所有限公司;

  • 代理人王兵;黄美娟

  • 地址 310014 浙江省杭州市下城区潮王路18号

  • 入库时间 2023-12-18 15:20:38

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-12-17

    专利权的转移 IPC(主分类):G05B13/04 登记生效日:20191127 变更前: 变更后: 申请日:20151116

    专利申请权、专利权的转移

  • 2018-01-12

    授权

    授权

  • 2016-05-04

    实质审查的生效 IPC(主分类):G05B13/04 申请日:20151116

    实质审查的生效

  • 2016-04-06

    公开

    公开

说明书

技术领域

本发明涉及多智能体系统协调控制技术领域,特别是涉及一种具有抵御恶意攻击能力的多智能体系统安全趋同控制方法。

背景技术

多智能体系统(multi-agentsystems)是一群具备一定的感知、通信、计算和执行能力的智能体通过通讯等方式关联成的一个网络系统。所谓趋同(consensus)控制问题,是指通过设计合适的控制协议,使得多智能体系统中所有个体的状态值渐进地或者有限时间内趋于一致。趋同控制在军事、航天、工业等各个领域具有十分广阔的应用背景,如多机器人编队、多卫星系统、自动化公路调度、无线传感器网络的协调控制等都是其典型的应用实例。而安全趋同控制,则在趋同控制的基础上,提出了更高的控制要求。安全趋同控制的基本思想是通过对网络中的正常智能体施加控制,使得其在执行趋同协议中,能够抵御恶意智能体的攻击行为,确保自身状态始终处于一个容许范围(安全域)内变化,并最终趋于一致。近些年来,随着计算机技术的发展和网络系统的日益普及,多智能体系统趋同控制的安全性问题越来越受到国内外专家的关注。

传统的安全趋同控制方法主要存在以下两方面的不足:一方面,这些控制方法均假定系统个体之间的通信是理想的状况,即各智能体能实时地交互信息。然而对于实际的通信网络,时延是普遍存在且不可避免的。更有甚至,存在一类恶意智能体,能通过特殊的攻击手段使得通信链路产生特定的时延;另一方面,目前大部分协议是针对静态的网络拓扑,即按照固定的通信线路来设计协议,而这往往无法应对一些灵活可移动的恶意攻击节点,具有一定的应用局限性。

发明内容

本发明要克服上述控制方法的不足,提出一种在恶意环境下,具有适应时变网络和通信时延能力的多智能体系统安全趋同控制方法。本发明所设计控制方法较以往控制方法,对节点灵活的攻击方式具有强的鲁棒性,而且适用于具有通信时延的网络环境,这就是本发明的形成动机。

本发明的目的在于对具有恶意攻击和通信时延双重影响下的多智能体系统网络,提出一种具有抗恶意攻击和时延能力的安全趋同控制方法,从而拓宽多智能体系统趋同控制的研究应用范畴。

本发明解决其技术问题所采用的技术方案是:

恶意环境下的多智能体系统安全趋同控制方法,包括以下步骤:

步骤1.建立数学模型。考虑由n个节点组成的多智能体系统网络,网络中一个节点代表一个智能体。假定网络中包含有ns个正常节点和na个恶意节点,满足ns+na=n。第i个正常节点的动态模型为:

xi(k+1)=xi(k)+ui(k),i∈Vs(1)

其中xi(k)和ui(k)分别为节点i在k时刻的状态值和控制输入,Vs表示所有正常节点的集合。另外假定系统中所有恶意节点的动态方程是未知的,它们不按照所设计的控制协议更新自身状态值,具有任意改变自身状态值的能力,并能制造虚假信息发送给周围正常节点,致使正常节点在更新状态时因采用这些虚假信息而发生错误,从而达到破坏整个网络趋同进程的目的。

步骤2.控制方法设计。根据上述建立的数学模型,以及恶意节点的攻击特点,接下去我们给出详细的控制器设计方法。本发明考虑网络中所有正常节点未知其他节点的识别序号,在仅知道周围邻居中至多拥有不超过f个邻居为恶意节点的前提下,即|Ni∩Va|≤f,f∈Z+,其中Va表示所有恶意节点的集合,Z+表示正整数,根据自身状态和邻居的时延状态信息设计控制器。具体步骤如下:

步骤21:初始化系统

令k=0,初始化系统,所有正常节点赋予初始状态值;

步骤22:计算删减自适应参数

在第k轮时刻,正常节点i将该时刻收获的所有的信息值xj(k-di,j(k)),j∈Ni进行整理后,按数值的大小作降序排列,其中j表示此时给节点i传送信息的节点,di,j(k)为i和j之间的通信时延,Ni为节点i的邻居集,即所有能够发送信息给节点i的的节点集。记ni(k)为k时刻节点i的邻居总个数,ri(k)为控制器删减自适应参数,ri(k)的值按照如下规则给定:

>ri(k)=ni(k)-f-1,ni(k)<2f+1f,ni(k)2f+1;---(2)>

步骤23:创建删减规则

基于步骤22求得的删减自适应参数ri(k),我们接下来创建节点删减规则:如果节点i整理的序列中有不少于ri(k)个值严格大于自身状态值xi(k),那么将序列中前ri(k)个值移除,如不足ri(k)个,则将这些大于xi(k)的值全部移除;同样地,如果序列中有不少ri(k)个值严格小于自身状态值xi(k),那么将序列中后ri(k)个值移除,如不足ri(k)个,则将这些小于xi(k)的值全部移除;

步骤24:设计控制协议

根据步骤23中删减完后保留的信息值,给节点i设计如下趋同控制协议:

>ui(k)=1Σj=1nai,jδi,j(k)×(Σj=1nai,jδi,j(k)(xj(k-di,j(k))-xi(k)))---(3)>

结合之前个体的动态方程,控制系统闭环方程为:

>xi(k+1)=xi(k)+1Σj=1nai,jδi,j(k)×(Σj=1nai,jδi,j(k)(xj(k-di,j(k))-xi(k)))---(4)>

式子中各数学符号含义如下:

di,j(k)为节点j到节点i的通信时延,满足常数为通信时延上界,满足>d=supk0max{di,j(k),jNi,iVs}.>考虑各节点获取自身状态时不存在时延,即di,i(k)=0,ai,j≥0为节点i和j之间的通信权重,且令函数当节点i在步骤2中保留节点j的信息时,δi,j(k)=1,否则δi,j(k)=0;

步骤5:循环设置

令k=k+1,转到步骤22。

步骤3.趋同条件分析。首先依据代数图论知识,在这里提出r‐健壮网络的概念:对于一个有向通信网络,如果节点集V中任意一对子集,记作S1,S2,至少存在一个节点i∈Sk,k=1,2,满足|NiSk|≥r,r∈Z+,则称该网络是r‐健壮网络。通过对r‐健壮网络概念的引入,进而我们可以得到如下趋同条件:

对于一个恶意攻击环境下的多智能体系统网络,如果正常节点周围邻居中至多拥有不超过f个邻居为恶意节点,且满足2f+1‐健壮网络属性,那么每个正常节点在本发明控制方法作用下,它们的状态值能够保持在一个安全区域内发生变化且能够最终实现一致,而且与网络的通信时延无关。

本发明与现有技术相比其显著优点在于:

1、本发明方法针对动态的网络拓扑提出,相较于传统固定拓扑的趋同控制方法,可应对一类灵活可移动的攻击节点,适用性更加广泛;

2、适用于存在通信时延的网络。实际环境中通信时延是普遍存在且不可避免的,因此是设计控制器的时候考虑时延问题是十分有必要的;

3、本发明的控制器仅用周围邻居节点的时延信息作为控制输入,无需其他额外的信息量,最大程度地节省了网络通信和计算成本。

附图说明

图1为本发明中针对恶意节点和通信时延环境下的多智能体系统控制器设计结构图;

图2为本发明实施例建立的具有4个正常节点和3个恶意节点组成的多智能体系统有向拓扑结构图;

图3为在满足2-健壮网络结构下的各小车各时刻速度的表现图;

图4为在不满足2-健壮网络结构下的各小车各时刻速度的表现图。

具体实施方式

参见图1,并结合实施例对本发明做进一步的详细说明。

1)建立数学模型。考虑由n个节点组成的多智能体系统网络,网络中一个节点代表一个智能体。假定网络中包含有ns个正常节点和na个恶意节点,满足ns+na=n。第i个正常节点的动态模型为:

xi(k+1)=xi(k)+ui(k),i∈Vs(1)

其中xi(k)和ui(k)分别为节点i在k时刻的状态值和控制输入,Vs表示所有正常节点的集合。另外假定系统中所有恶意节点的动态方程是未知的,它们不按照所设计的控制协议更新自身状态值,具有任意改变自身状态值的能力,并能制造虚假信息发送给周围正常节点,致使正常节点在更新状态时因采用这些虚假信息而发生错误,从而达到破坏整个网络趋同进程的目的。

2)控制方法设计。根据上述建立的数学模型,以及恶意节点的攻击特点,接下去我们给出详细的控制器设计方法。本发明考虑网络中所有正常节点未知其他节点的识别序号,在仅知道周围邻居中至多拥有不超过f个邻居为恶意节点的前提下,即|Ni∩Va|≤f,f∈Z+,其中Va表示所有恶意节点的集合,Z+表示正整数,根据自身状态和邻居的时延状态信息设计控制器。具体步骤如下:

步骤1:初始化系统

令k=0,初始化系统,所有正常节点赋予初始状态值;

步骤2:计算删减自适应参数

在第k轮时刻,正常节点i将该时刻收获的所有的信息值xj(k-di,j(k)),j∈Ni进行整理后,按数值的大小作降序排列,其中j表示此时给节点i传送信息的节点,di,j(k)为i和j之间的通信时延,Ni为节点i的邻居集,即所有能够发送信息给节点i的的节点集。记ni(k)为k时刻节点i的邻居总个数,ri(k)为控制器删减自适应参数,ri(k)的值按照如下规则给定:

>ri(k)=ni(k)-f-1,ni(k)<2f+1f,ni(k)2f+1;---(2)>

步骤3:创建删减规则

基于步骤2求得的删减自适应参数ri(k),我们接下来创建节点删减规则:如果节点i整理的序列中有不少于ri(k)个值严格大于自身状态值xi(k),那么将序列中前ri(k)个值移除,如不足ri(k)个,则将这些大于xi(k)的值全部移除;同样地,如果序列中有不少ri(k)个值严格小于自身状态值xi(k),那么将序列中后ri(k)个值移除,如不足ri(k)个,则将这些小于xi(k)的值全部移除;

步骤4:设计控制协议

根据步骤3中删减完后保留的信息值,给节点i设计如下趋同控制协议:

>ui(k)=1Σj=1nai,jδi,j(k)×(Σj=1nai,jδi,j(k)(xj(k-di,j(k))-xi(k)))---(3)>

结合之前个体的动态方程,控制系统闭环方程为:

>xi(k+1)=xi(k)+1Σj=1nai,jδi,j(k)×(Σj=1nai,jδi,j(k)(xj(k-di,j(k))-xi(k)))---(4)>

式子中各数学符号含义如下:

di,j(k)为节点j到节点i的通信时延,满足常数为通信时延上界,满足>d=supk0max{di,j(k),jNi,iVs}.>考虑各节点获取自身状态时不存在时延,即di,i(k)=0,ai,j≥0为节点i和j之间的通信权重,且令函数当节点i在步骤2中保留节点j的信息时,δi,j(k)=1,否则δi,j(k)=0;

步骤5:循环设置

令k=k+1,转到步骤2。

为验证本发明所设计控制方法的有效性,采用以下实施例来进行验证。

考虑一个由7个节点组成的多智能体系统,通信拓扑参见图2。其中节点1,2,4,6为正常节点3,5,7为敌对节点,图中单点划线箭头表示在时间序列k为奇数时连通信道,双点划线箭头表示k为偶数时连通信道,实线箭头表示恒定连通信道,其初始值x(0)=[1,2,3,4,5,6,7],通信步长设为0.1s,时延上界取1s。系统的安全域,即为正常节点的初始值范围为[1,6],系统的通信权重矩阵A=[ai,j]的取值如下:

>A=0.20.20000.30.30.30.20.30.200000000000.20.20.10.10.30.1000000000.1000.20.20.20.30000000>

图2的通信拓扑中,节点1,2,4,6间满足2‐健壮网络的性质,恶意节点3,5,7分别给予以下动态方程:

x3(k+1)=0.8x3(k)+0.2ua(k),

x5(k+1)=1.5sin(0.2πk)+4,

x7(k+1)=0.3x7(k)+0.7ua(k),

令ua=8,即节点3和节点7的相互合作,恶意引导周围正常节点的状态值趋于8。上述通信拓扑保证了各正常节点在任意时刻的恶意邻居数上限为1。在上述给出的趋同分析下,可知一个满足2‐健壮网络的系统,在本发明控制器作用下,可以保证让系统中各正常节点的状态值处于安全区域,并且最终实现趋同。

系统的状态轨迹参见图3,图中我们可以看到,尽管遭受3个恶意节点的攻击,但是各正常节点在本发明控制方法下,其状态值始终保持在安全域内变化,并且最终趋于相同。从数值仿真结果中可以看出,在满足2‐健壮网络性质的多智能体系统中,本发明所设计的控制方法的有效性得到了很好的验证。

接下去我们特意将节点1和节点2之间的通信路线切断,致使正常节点间通信拓扑不再满足2‐健壮网络性质,该情况下各节点状态轨迹参见图4,此时恶意节点成功将所有正常节点的状态值带入到8。虽然系统最终仍可以达到趋同状态,但却已偏离出安全域[1,6]。说明本发明所设计的控制方法在该不满足2‐健壮网络性质的网络中不再发挥作用。

本发明的具体实施方式中凡未涉到的说明属于本领域的公知技术,可参考公知技术加以实施。

以上具体实施方式是对本发明提出的一种恶意环境下多智能体系统安全趋同控制方法技术思想的具体支持,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在本发明技术方案基础上所做的任何等同变化或等效的改动,均仍属于本发明技术方案保护的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号