法律状态公告日
法律状态信息
法律状态
2020-02-14
授权
授权
2018-01-12
实质审查的生效 IPC(主分类):G05D1/10 申请日:20170708
实质审查的生效
2017-12-19
公开
公开
技术领域
本发明涉及无人机领域,尤其是一种规避判断方法。
背景技术
在面对突发状况时,有人机操作员与无人机交互,保证无人机完成预定的任务。监督控制是指有人机间歇地与无人机进行交互,接收反馈并且给出指令以对处于任务环境中的无人机进行过程控制。
然而,在无人机系统威胁规避的实际应用中,传统的方法一般采用操作员手动操作进行威胁规避、或是通过计算代价函数(一般以航程和威胁为主要因素)采用路径规划、规则或自动机的方式进行威胁规避。这样会出现两个问题:①由复杂多变的环境赋予操作员过多的任务造成的“超负荷”现象;②由于无人系统拥有过高的权限,使操作员丧失对整体态势的感知能力造成的“人不在回路”(Out-of-the-Loop,OOTL)现象。两个问题说明,有人机对无人机威胁规避的监督控制需按照实际情况动态调节。
因此,非常有必要研究一种既能够充分发挥有人机操作员高层次认知决策能力和无人机高效执行任务能力,同时保持有人机操作员对作业环境的态势认知和适当的工作负荷的无人机威胁规避监督控制方法。
发明内容
为了克服现有技术在平衡态势认知和工作负载方面的缺陷,本发明提出一种威胁规避监督控制方法,既可以有效提高有人机-无人机系统在复杂多变的环境下执行任务的性能,又可以减轻操作员的工作负担,同时能够保证操作员对整体态势的感知能力,避免“人不在回路”的出现,而且充分发挥无人机自主能力,实现威胁规避的目的。
本发明提出的威胁规避监督控制方法,是一种依据环境变化,有人机调整不同监督控制模式,无人机完成对应的威胁规避动作,以实现威胁规避目的的方法。
本发明解决其技术问题所采用的技术方案包括如下步骤:
Step1:定义监督控制模式、环境因素和威胁规避动作
无人机遇到突发威胁时有6种威胁规避动作,包括作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6;
其中,作业决策A1和规避A2为高等级的动作;减速等待指令A3和盘旋等待指令A4为中等级的动作;应激规避A5和返回A6为低等级的动作;
监督控制模式为3个模式,无人机的自主能力由高到低分别为例外管理模式L3、同意管理模式L2、和指令控制模式L1,无人机初始模式为例外管理模式L3;
定义无人机监督控制模式如表1所示:
表1
动作执行方式是指无人机在有人机监督控制下,完成对应的威胁规避动作的方式,如表2所示;
表2
1)环境因素包括威胁源的价值、威胁距离、威胁源是否为已知和通信情况,定义如下:
①威胁源的价值V7包括高价值威胁源和低价值威胁源,其中威胁价值如表3所定义;
表3
②威胁距离包括威胁距离远V4、威胁距离中等V2和威胁距离近V1;
相对于无人机,威胁源的位置表示为
式(1)中,P(t)为t时刻威胁源i的位置,t为时间,P(0)为威胁源i的初始位置,vi为威胁源i的速度,vu(τ)为无人机u的速度,其中:
式(2)中
③威胁源分为已知威胁V6和未知威胁V3,已知威胁指已知作业区域的威胁源的图像信息,位置信息以及雷达波段信息;未知威胁是指作业区域的威胁源的图像信息,位置信息以及雷达波段信息至少缺少一个;
④通信情况指通信中断V5,指到达无人机接收机的信号强度小于有人机接收机的灵敏度,有人机与无人机间无法正常通信的情况;
2)环境因素和威胁规避动作的取值的值域为{-1,0,1},其物理意义如表4所示:
表4
①对于威胁源的价值V7,高价值表示为1,即V7=1;低价值表示为0,即V7=0;价值未知表示为-1,即V7=-1;
②对于威胁距离,威胁距离远表示为V4=1且V2=0且V1=0,威胁距离中等表示为V4=0且V2=1且V1=0,威胁距离近表示为V4=0且V2=0且V1=1;
③对于威胁源是否已知,分为已知威胁表示为1,即V6=1且V3=0;未知威胁表示为1,即V3=1且V6=0;
对于未知威胁V3=1的情况,威胁源的价值一定为未知,即V7=-1,可表示如下:
if(V3=1),then(V7=-1) (4)
④对于通信情况,通信正常则V5=0,通信中断即V5=1;
⑤对于作业决策A1表示为A1=1且A2=A3=A4=A5=A6=0;
⑥对于规避A2表示为A2=1且A1=A3=A4=A5=A6=0;
⑦对于减速等待指令A3表示为A3=1且A1=A2=A4=A5=A6=0;
⑧对于盘旋等待指令A4表示为A4=1且A1=A2=A3=A5=A6=0;
⑨对于应激规避A5表示为A5=1且A1=A2=A3=A4=A6=0;
⑩对于返回A6表示为A6=1且A1=A2=A3=A4=A5=0;
Step2:可选威胁规避动作的推理判断
1)由Step1写出状态向量
状态向量用C(k)表示,其中k表示次数,C(0)表示初始状态向量,状态向量包括威胁规避动作和环境因素,格式为:
其中,没有规避动作时,默认无人机A1~A6值全为0,即
V1~V7为Step1得到的值,在Step2中始终为定值;
2)利用状态向量C(k)进行推理,推理过程如下:
①用状态向量C(k)乘邻接权值矩阵W得到中间向量X(k)
X(k)=C(k)W (7)
其中,节点之间的邻接权值矩阵W如下:
②对中间向量X(k)用状态转移函数f(x)处理中间向量X(k)的每个分量x,状态转移函数f(x)为二值阶跃函数:
其中,x为中间向量X(k)的分量,向量X(k)维度为6,分量x的值域为{0,1};
③用中间向量X(k)更新状态向量C(k),即
④不断重复步骤①、步骤②和步骤③,即不断更新状态向量用C(k),直至状态向量C(k+n+1)=C(k+n),其中,n表示次数,即第(k+n+1)次状态向量的值与第(k+n)次状态向量的值相同;
C(k+n+1)=C(k+n)=[a1,a2,a3,a4,a5,a6|V1,V2,V3,V4,V5,V6,V7],其中a1、a2、a3、a4、a5和a6分别表示威胁规避动作A1、A2、A3、A4、A5和A6对应的取值,取值为0或者1,a1、a2、a3、a4、a5、a6中取值为1的项,对应威胁规避动为可选威胁规避动作;
⑤无人机提供可选威胁规避动作结果给有人机;
Step3:最终威胁规避动作判断
判断如下:
1)满足如下判断条件a)、b)、c)的其中一条,则无人机需要与有人机交互:
a)环境因素中包含高价值V7项值为“1”,即V=(*,*,*,*,*,*,1),其中,*表示无关项,无关项表示取值为“0”或“1”;
b)环境因素中包含未知威胁V3项值为“1”,即V=(*,*,1,*,*,0,-1),其中,*表示无关项,无关项表示取值为“0”或“1”;
c)可选威胁规避动作不符合无人机当前监督控制模式对应的动作等级;
在当前监督控制模式中动作执行方式如下:
①当无人机的监督控制模式为例外管理模式L3,无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,则无人机降低监督控制模式到同意管理模式L2;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,操作员在15s内不否定即执行无人机提供的威胁规避动作推理结果,反之,操作员在15s内否定则不执行,并降低监督控制模式到同意管理模式L2;
②当无人机的监督控制模式为同意管理模式L2,则无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,无人机降低监督控制模式到操作员决策模式L1;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,等待操作员的认可,15s内没有得到操作员的认可则不执行无人机提供的威胁规避动作推理结果,并降低监督控制模式到操作员决策模式L1;
③当无人机的监督控制模式为指令控制模式L1,则无人机需要交互时,无人机向有人机提供威胁源的图像信息,位置信息以及雷达波段信息,并提供状态向量C(k)和威胁规避动作推理结果,有人机采用接管方式并结合如下规则执行:
通过命令给出无人机威胁规避动作,无人机15s内等待操作员的决策,按照决策结果执行,超时无决策,则返回基地;
2)当可选威胁规避动作符合无人机当前监督控制模式对应动作等级,且环境因素不符合step3的步骤1)中判断条件a)和b)的其中一条,则无人机不需与有人机交互,可选威胁规避动作按照如下优先级执行:
A1>A2>A3>A4>A5>A6 (11)
对应监督控制模式中动作执行方式如下:
①无人机不需要交互时,当在例外管理模式L3下,则允许执行的动作为作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
②无人机不需要交互时,当在同意管理模式L2下,允许执行的动作为减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
③无人机不需要交互时,在指令控制模式L1下,允许执行的动作为应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
Step4:每30s更新一次Step1的环境因素和威胁规避动作的数值,当无人机监督控制模式降低,则更新无人机监督控制模式为降低后的模式,按照Step1~Step3循环往复,无人机执行最终得到的威胁规避动作,完成威胁规避,当无人机成功规避威胁后,无人机监督控制模式恢复为例外管理模式L3模式。
本发明的有益效果在于对于已知威胁,无人机可以充分发挥其自主能力,独立完成威胁规避,或者在有人机的指导下完成作业;对于未知威胁,无人机必须在有人机的指导下完成规避,可变自主监督控制方法可以充分发挥无人机的自主执行和有人机操作员的分析判断能力;对于通信中断等极端情况,无人机可以通过对监督控制模式的调节,在等待通信恢复的同时保证自身的安全;可变自主监督控制模式可以结合无人机和有人机的特点,对不同的威胁类型和环境状况有较好的应变能力。
附图说明
图1是本发明无人机威胁规避推理模型框架。
图2是本发明实施例1规避过程图。
图3是本发明实施例2规避过程图。
图4是本发明实施例3规避过程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。图1是本发明无人机威胁规避推理模型框架。
Step1:定义监督控制模式、环境因素和威胁规避动作
无人机遇到突发威胁时有6种威胁规避动作,包括作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6;
其中,作业决策A1和规避A2为高等级的动作;减速等待指令A3和盘旋等待指令A4为中等级的动作;应激规避A5和返回A6为低等级的动作;
监督控制模式为3个模式,无人机的自主能力由高到低分别为例外管理模式L3、同意管理模式L2、和指令控制模式L1,无人机初始模式为例外管理模式L3;
定义无人机监督控制模式如表1所示:
表1
动作执行方式是指无人机在有人机监督控制下,完成对应的威胁规避动作的方式,如表2所示;
表2
1)环境因素包括威胁源的价值、威胁距离、威胁源是否为已知和通信情况,定义如下:
①威胁源的价值V7包括高价值威胁源和低价值威胁源,其中威胁价值如表3所定义;
表3
②威胁距离包括威胁距离远V4、威胁距离中等V2和威胁距离近V1;
相对于无人机,威胁源的位置表示为
式(1)中,P(t)为t时刻威胁源i的位置,t为时间,P(0)为威胁源i的初始位置,vi为威胁源i的速度,vu(τ)为无人机u的速度,其中:
式(2)中
③威胁源分为已知威胁V6和未知威胁V3,已知威胁指已知作业区域的威胁源的图像信息,位置信息以及雷达波段信息;未知威胁是指作业区域的威胁源的图像信息,位置信息以及雷达波段信息至少缺少一个;
④通信情况指通信中断V5,指到达无人机接收机的信号强度小于有人机接收机的灵敏度,有人机与无人机间无法正常通信的情况;
2)环境因素和威胁规避动作的取值的值域为{-1,0,1},其物理意义如表4所示:
表4
①对于威胁源的价值V7,高价值表示为1,即V7=1;低价值表示为0,即V7=0;价值未知表示为-1,即V7=-1;
②对于威胁距离,威胁距离远表示为V4=1且V2=0且V1=0,威胁距离中等表示为V4=0且V2=1且V1=0,威胁距离近表示为V4=0且V2=0且V1=1;
③对于威胁源是否已知,分为已知威胁表示为1,即V6=1且V3=0;未知威胁表示为1,即V3=1且V6=0;
对于未知威胁V3=1的情况,威胁源的价值一定为未知,即V7=-1,可表示如下:
if(V3=1),then(V7=-1) (4)
④对于通信情况,通信正常则V5=0,通信中断即V5=1;
⑤对于作业决策A1表示为A1=1且A2=A3=A4=A5=A6=0;
⑥对于规避A2表示为A2=1且A1=A3=A4=A5=A6=0;
⑦对于减速等待指令A3表示为A3=1且A1=A2=A4=A5=A6=0;
⑧对于盘旋等待指令A4表示为A4=1且A1=A2=A3=A5=A6=0;
⑨对于应激规避A5表示为A5=1且A1=A2=A3=A4=A6=0;
⑩对于返回A6表示为A6=1且A1=A2=A3=A4=A5=0;
Step2:可选威胁规避动作的推理判断
1)由Step1写出状态向量
状态向量用C(k)表示,其中k表示次数,C(0)表示初始状态向量,状态向量包括威胁规避动作和环境因素,格式为:
其中,没有规避动作时,默认无人机A1~A6值全为0,即
V1~V7为Step1得到的值,在Step2中始终为定值;
2)利用状态向量C(k)进行推理,推理过程如下:
①用状态向量C(k)乘邻接权值矩阵W得到中间向量X(k)
X(k)=C(k)W (7)
其中,节点之间的邻接权值矩阵W如下:
②对中间向量X(k)用状态转移函数f(x)处理中间向量X(k)的每个分量x,状态转移函数f(x)为二值阶跃函数:
其中,x为中间向量X(k)的分量,向量X(k)维度为6,分量x的值域为{0,1};
③用中间向量X(k)更新状态向量C(k),即
④不断重复步骤①、步骤②和步骤③,即不断更新状态向量用C(k),直至状态向量C(k+n+1)=C(k+n),其中,n表示次数,即第(k+n+1)次状态向量的值与第(k+n)次状态向量的值相同;
C(k+n+1)=C(k+n)=[a1,a2,a3,a4,a5,a6|V1,V2,V3,V4,V5,V6,V7],其中a1、a2、a3、a4、a5和a6分别表示威胁规避动作A1、A2、A3、A4、A5和A6对应的取值,取值为0或者1,a1、a2、a3、a4、a5、a6中取值为1的项,对应威胁规避动为可选威胁规避动作;
⑤无人机提供可选威胁规避动作结果给有人机;
Step3:最终威胁规避动作判断
判断如下:
1)满足如下判断条件a)、b)、c)的其中一条,则无人机需要与有人机交互:
a)环境因素中包含高价值V7项值为“1”,即V=(*,*,*,*,*,*,1),其中,*表示无关项,无关项表示取值为“0”或“1”;
b)环境因素中包含未知威胁V3项值为“1”,即V=(*,*,1,*,*,0,-1),其中,*表示无关项,无关项表示取值为“0”或“1”;
c)可选威胁规避动作不符合无人机当前监督控制模式对应的动作等级;
在当前监督控制模式中动作执行方式如下:
①当无人机的监督控制模式为例外管理模式L3,无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,则无人机降低监督控制模式到同意管理模式L2;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,操作员在15s内不否定即执行无人机提供的威胁规避动作推理结果,反之,操作员在15s内否定则不执行,并降低监督控制模式到同意管理模式L2;
②当无人机的监督控制模式为同意管理模式L2,无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,无人机降低监督控制模式到操作员决策模式L1;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,等待操作员的认可,15s内没有得到操作员的认可则不执行无人机提供的威胁规避动作推理结果,并降低监督控制模式到操作员决策模式L1;
③当无人机的监督控制模式为指令控制模式L1,则无人机需要交互时,无人机向有人机提供威胁源的图像信息,位置信息以及雷达波段信息,并提供状态向量C(k)和威胁规避动作推理结果,有人机采用接管方式并结合如下规则执行:
通过命令给出无人机威胁规避动作,无人机15s内等待操作员的决策,按照决策结果执行,超时无决策,则返回基地;
2)当可选威胁规避动作符合无人机当前监督控制模式对应动作等级,且环境因素不符合step3的步骤1)中判断条件a)和b)的其中一条,则无人机不需与有人机交互,可选威胁规避动作按照如下优先级执行:
A1>A2>A3>A4>A5>A6 (11)
对应监督控制模式中动作执行方式如下:
④无人机不需要交互时,当在例外管理模式L3下,则允许执行的动作为作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
⑤无人机不需要交互时,当在同意管理模式L2下,允许执行的动作为减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
⑥无人机不需要交互时,在指令控制模式L1下,允许执行的动作为应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
Step4:每30s更新一次Step1的环境因素和威胁规避动作的数值,当无人机监督控制模式降低,则更新无人机监督控制模式为降低后的模式,按照Step1~Step3循环往复,无人机执行最终得到的威胁规避动作,完成威胁规避,当无人机成功规避威胁后,无人机监督控制模式恢复为例外管理模式L3模式。
无人机在威胁规避时的案例可以按通信正常和通信中断分为两大类,同时,通信正常时又可以分为面对已知威胁和未知威胁两种情况,下面分别对上述三种情况的过程进行仿真,如表5所示:
表5无人机威胁规避任务
实施例1:
Step1:定义监督控制模式、环境因素和威胁规避动作
由表5可知,威胁类型为已知威胁,则V6=1且V3=0;威胁价值高,则V7=1;威胁距离中等,则V4=0且V2=1且V1=0;通信正常,则V5=0。此外,A1~A6初始为0,初始监督控制模式为例外管理模式L3;
Step2:可选威胁规避动作的推理判断
状态向量为:
将其迭代,输出的状态向量为:
输出结果表明无人机在实施例1的可选择动作为规避A2和盘旋等待A4。
无人机提供可选威胁规避动作结果规避A2和盘旋等待A4给有人机。
Step3:最终威胁规避动作判断
由表1,可选威胁规避动作规避A2和盘旋等待A4,符合无人机当前例外管理模式L3对应动作等级;无人机需要与有人机交互的情况判断条件a)成立,即环境因素中包含高价值V7项值为“1”,对应监督控制模式动作执行方式为:当无人机的监督控制模式为例外管理模式L3时,无人机需要交互时,无人机向有人机提供威胁规避动作推理结果:规避A2和盘旋等待A4,无人机采用智能结合方式主动反馈,操作员在15s内不否定即执行。反之,操作员在15s内否定则不执行,并降低监督控制模式到同意管理模式L2。
无人机提供Step2得到的威胁规避A2的动作策略等待有人机操作员判断,根据公式(10)的规则:
if(威胁已知并且高价值),then(选择作业决策)
有人机操作员否定可选威胁规避动作,命令无人机选择作业决策A1,无人机执行命令,并降低监督控制模式到同意管理模式L2。直至30s后威胁信息数据更新Step1,无人机再次重复步骤Step2、Step3,过程如图2所示。
实施例2:
Step1:定义监督控制模式、环境因素和威胁规避动作
由表5可知,威胁类型为未知威胁,则V3=1且V6=0;威胁价值未知,则V7=-1;威胁距离近,则V4=0且V2=0且V1=1;通信正常,有V5=0。此外,A1~A6初始为0,初始监督控制模式为例外管理模式L3。
Step2:可选威胁规避动作的推理判断
状态向量为:
考虑威胁价值未知(V7=-1),信息不全,无人机无法做出判断,需要与有人机进行交互。
Step3:最终威胁规避动作判断
无人机需要与有人机交互的情况判断条件b)成立,即环境因素中包含未知威胁V3项值为“1”,此时由于无人机无法做出判断,不能及时向有人机提供威胁规避动作推理结果,15s内无人机无法提供的威胁规避动作推理结果,无人机降低监督控制模式到同意管理模式L2。同样,下一个15s内无人机仍然无法提供的威胁规避动作推理结果,无人机降低监督控制模式到操作员决策模式L1。
无人机的监督控制模式为指令控制模式L1,无人机不能自主完成威胁规避决策,需要与有人机进行交互,同时传回威胁源的图像信息,位置信息,以及雷达波段信息,有人机操作员根据威胁源的信息判断出威胁价值低(V7=0),更新威胁数据;
30s后,更新Step1的监督控制模式、环境因素和威胁规避动作。
有人机操作员更新了威胁数据:威胁类型为已知威胁,有V6=1且V3=0;威胁价值低,有V7=0;由于无人机没有得到规避动作,A1~A6仍为初始值0;由于无人机监督控制模式降低,无人机监督控制模式更新为操作员决策模式L1。
更新Step2的可选威胁规避动作的推理判断
状态向量为:
将其迭代,输出的状态向量为:
输出结果表明无人机在实施例2中可选择的动作为应激规避A5。
更新Step3的最终威胁规避动作判断
由判断:当可选威胁规避动作符合无人机当前监督控制模式对应动作等级,且环境因素不符合step2的步骤1)中判断条件a)和b)的其中一条,则无人机不需与有人机交互。
在指令控制模式L1下,允许执行的动作为应激规避A5和返回A6,故无人机执行应激规避A5。直至30s后威胁信息数据更新Step1,无人机继续步骤Step2、Step3,过程如图3所示。
实施例3:
Step1:定义监督控制模式、环境因素和威胁规避动作
由表5可知,威胁类型为未知威胁,则V3=1且V6=0;威胁价值未知,则V7=-1(-1表示威胁价值未知);威胁距离远,则V4=1且V2=0且V1=0;通信正常,有V5=0。此外,A1~A6初始为0,初始监督控制模式为例外管理模式L3。
Step2:可选威胁规避动作的推理判断
状态向量为:
考虑威胁价值未知(V7=-1),信息不全,无人机无法做出判断,需要与有人机进行交互。
Step3:最终威胁规避动作判断
无人机不能自主完成威胁规避决策,同时由于通信中断,又无法与有人机交互,此时无人机降低监督控制模式,15s后降低监督控制模式到同意管理模式L2,此后15s仍然通信中断,无法交互,无人机降低监督控制模式到指令控制模式L1,此后15s仍然通信中断,无法交互,无人机根据指令控制模式L1,选择自保行为,返回基地,即规避动作A6,过程如图4所示。
机译: 无人机系统,无人机,可移动体,无人机系统控制方法,以及无人机系统控制程序
机译: 无人机系统,无人机,可移动体,无人机系统控制方法,以及无人机系统控制程序
机译: 无人机系统,无人机,移动,运动决策装置,无人机系统控制方法和无人机系统控制程序