公开/公告号CN103077425A
专利类型发明专利
公开/公告日2013-05-01
原文格式PDF
申请/专利权人 中国科学院沈阳自动化研究所;
申请/专利号CN201210487442.4
申请日2012-11-23
分类号G06N3/12(20060101);
代理机构21002 沈阳科苑专利商标代理有限公司;
代理人周秀梅;许宗富
地址 110016 辽宁省沈阳市东陵区南塔街114号
入库时间 2024-02-19 18:43:12
法律状态公告日
法律状态信息
法律状态
2016-01-20
授权
授权
2013-06-05
实质审查的生效 IPC(主分类):G06N3/12 申请日:20121123
实质审查的生效
2013-05-01
公开
公开
技术领域
本发明涉及自主水下机器人(AUV,Autonomous Underwater Vehicle)的实 时路径规划方法,更具体地说,是AUV实时避碰过程中根据在线地图进行在线、 实时局部路径规划的方法。
背景技术
自主水下机器人是一种自身携带能源,依靠自主导航系统,通过智能的规 划决策,自主航行到作业区域,自主完成作业使命的潜水器。自主性要求自主 水下机器人能在无外界控制条件下自主地适应多变、复杂的外界环境,特别是 要应对事先未知的障碍。这就需要自主水下机器人在具备实时避碰功能的同时, 还应具备在线、实时局部路径规划的能力。
实时路径规划定义为:在AUV航行过程中根据传感器信息生成的在线地图 按照一定评价标准寻找一条从起点到目标点的优选路径的过程。常用的实时路 径规划算法有人工势场法、A*或D*算法、遗传算法等。人工势场法具有良好的 实时性,但存在陷阱区域和在相近障碍物之间不能发现路径等缺点。A*或D* 等优化搜索算法更适用于解决单目标优化问题。遗传算法是一种基于自然选择 和自然遗传的全局优化算法,采用群体方法对目标函数空间进行多线索的并行 搜索,更适用于AUV实时路径规划这类多目标优化问题。但传统遗传算法存在 早熟和收敛速度慢两个难题,并不适用于AUV实时路径规划要求。
发明内容
本发明要解决的技术问题是提供一种具有较好收敛速度和收敛性的AUV实 时路径规划方法,当AUV实时避碰策略陷入死循环时,该方法能引导AUV避 开障碍、跳出死循环,并且继续执行使命任务。
本发明为实现上述目的所采用的技术方案是:一种用于AUV实时路径规划 的免疫遗传算法,包括以下步骤,
1)根据AUV路径点数目设定小种群个数,初始化小种群的规模、最多进 化代数和随机生成小种群的个体;
2)对每个小种群进行免疫选择后,每个小种群得到两个子群;将其中一个 子群进行遗传操作,另一个进行细胞克隆;将得到的两个子群进行接种疫苗和 抗体聚类,形成下一代小种群;
3)判断下一代小种群是否满足最多进化代数或Pareto最优解条件;如果满 足,则根据亲和度的值选出这些小种群的最优个体;如果不满足,则返回步骤2);
4)从每个小种群最优个体组成的集合中,根据每个最优个体的亲和度选择 亲和度值最大的一个作为最优个体,该最优个体即为规划的路径。
所述免疫选择具体为:选择亲和度高的个体,且个体个数满足设定值; 亲和度的值通过公式
其中,适应值
ps、pe分别表示路径的起点和终点,pk,0=ps,pk,m+1=pe;d(px,py)为距 离函数,表示两点之间的空间距离;Ψkl表示线段pk,l-1pk,l与线段pk,lpk,l+1延长线 的夹角,Ψkl∈[0,π];Pmk为群体Pm(t)中的抗体,Bmi为群体Pm(t)中的抗原;
b(pk,lpk,l+1,Ωg)表示线段pk,lpk,l+1与障碍Ωg相对方位的系数;dmin表示AUV与 障碍的最小安全距离,Od表示线段与障碍相交的惩罚系数,d(pk,lpk,l+1,Ωg)表示 线段pk,lpk,l+1与障碍Ωg的最近距离;b(pk,lpk,l+1,Ωg)计算公式为:
g(pk,lpk,l+1,TAUV)表示路径pk,lpk,l+1是否与AUV航行轨迹TAUV相交,如果路径与AUV 航行轨迹相交,则对相应的染色体进行惩罚,惩罚值为较大的正数Og:
所述遗传操作包括以下步骤:
从当前群体Pm(t)中根据选择概率选择一定数量的个体,生 成交配池,其中T>0是退火温度,Jmk=J(Pmk),Nm为群体Pm(t)的规模;
从交配池中选择两个染色体进行交叉操作,具体为:两个染色体均随机的 从相同位置分开,一个染色体的前半部分和另一个染色体的后半部分结合,另 一个染色体的前半部分和前一个染色体的后半部分结合,从而形成两个全新的 个体进入新的子群;
再对交配池中的个体进行变异操作,在进化初期,采用统一繁殖方式,也 称无性交叉:选择一个染色体,随机改变某一位或多位染色体的基因;收敛到 一定程度后,改用非统一繁殖,也称启发式交叉:选择距离障碍较近的基因位 置,沿垂直理想路径方向按长度分辨率产生突变,得到的个体进入新的子群。
所述细胞克隆具体为:根据抗体Xi与抗原Yj的超突变公式Xi←Xi+β(Yj-Xi) 进行抗体繁殖;其中β∈[0,α],
所述抗体聚类包括以下步骤:将给定群体划分为q个子群 Qk:
相似度
根据|F(Pki)-F(Pkj)|≤δ0,Pki,Pkj∈Qk处罚激励度低的个体Pkj,将未被处罚的 个体存入Q中;
其中,激励度其中β为调节因子,β≥1;
本发明具有以下优点:
1.本发明利用抗体群聚类机理维持群体的多样性,既避免了算法过早收敛 问题,又有利于达到全局优化。所建立的免疫遗传算法采用自我调节机制对生 成的子代进行聚类分析,保证了群体的多样性。
2.本发明建立的细胞克隆操作加强了遗传算法的局部搜索能力。亲和突变 和均匀突变策略更强调对当前子空间的局部搜索,在保证遗传算法全局搜索能 力的同时也加强了局部搜索能力。
3.本发明利用免疫记忆机制,保留计算过程中出现的高效可行抗体作为疫 苗,并适时为种群接种疫苗从而加快算法的收敛速度。
附图说明
图1为本发明建立的双层AUV实时避碰系统结构图;
图2为本发明建立的免疫遗传算法流程图;
图3为实施例一中免疫遗传算法与令两种方法规划路径和收敛速度的对比;
图4为实施例二中有无实时路径规划情况下的AUV航行轨迹;
图5为实施例二中两次实时路径规划的结果。
具体实施方式
下面结合附图及实施例对本发明做进一步的详细说明。
如图1所示,本发明在原有自主水下机器人实时避碰系统框架中增加实时 路径规划模块,建立了双层的实时避碰系统框架。实时路径规划模块由监控规 划模块触发,根据数据处理模块生成的在线地图和AUV当前状态规划出新的期 望路径。
本发明建立的实时路径规划模块采用基于免疫遗传算法的实时路径规划技 术方案,如图2所示,核心部分由免疫选择、遗传操作、细胞克隆和抗体聚类4 个模块组成,主要流程为:首先从待进化种群Pm(t)中确定性地选择应答能力强 的抗体组成子群进行免疫应答,剩余个体组成对中的个体进行 细胞克隆操作,对中的个体进行遗传操作,两项操作的结果组成进行 抗体聚类,清除相同或相似的抗体。最后从中选择最优的个体形成下一代 群体Pm(t+1)。待进化种群表示多条路径,个体表示路径,根据AUV路径点数目 设定小种群个数。
(1)免疫选择
免疫选择的目的是按选择概率po从Pm(t)中选择亲和力较高的个体组成待进 化群体Pm1(t),其中个体个数满足设定值(本实施例设定值为100);。所谓亲和 力是指抗体与抗原的匹配程度,代表着待选个体与当前最优个体的匹配程度。 本发明建立的亲和度是用适应值差异来衡量亲和度的大小,首先找到适应值最 小的抗原,个体Pmk的适应值与该抗原的适应值做差值,个体Pmk的亲和度和该差 值成反比。个体Pmk表示抗体,Bmi表示抗原(可设定为几十个),当亲和度最大 时,Pmk和Bmi最匹配。亲和度的计算公式为:
式(1)中J(Pmk)为个体Pmk的适应性函数,该函数表示路径长度、安全性和平 滑度,更能反应AUV实时路径规划的需求。
计算公式为:
式(2)中
ps、pe分别表示路径的起点和终点,并且定义pk,0=ps,pk,m+1=pe。d(px,py) 为距离函数,表示两点之间的空间距离。Ψkl表示线段pk,l-1pk,l与线段pk,lpk,l+1延 长线的夹角,Ψkl[0,π]。
b(pk,lpk,l+1,Ωg)表示线段pk,lpk,l+1与障碍Ωg相对方位的系数。设dmin表示AUV 与障碍的最小安全距离,Od表示线段与障碍相交的惩罚系数(通常设定为较大 的正整数),d(pk,lpk,l+1,Ωg)表示线段pk,lpk,l+1与障碍Ωg的最近距离。则 b(pk,lpk,l+1,Ωg)计算公式为:
g(pk,lpk,l+1,TAUV)表示路径pk,lpk,l+1是否与AUV航行轨迹TAUV相交,如果路径与 AUV航行轨迹相交,则对相应的染色体进行惩罚,惩罚值为较大的正数Og:
确定性地选择应答抗原能力强的抗体进行免疫应答,参与细胞克隆和亲和 突变。亲和突变能微调靠近障碍的路径点位置,和细胞克隆操作共同作用,增 强障碍区域附近的局部搜索能力。
免疫选择一方面给亲和力高的抗体提供更多选择机会,而且也给亲和力及 浓度皆低的抗体提供生存机会,使得存活的抗体群具有多样性。
(2)遗传操作
本发明建立的遗传操作模块由三个遗传算子组成:选择算子、特异交叉算 子和变异算子。
选择算子是从当前群体Pm(t)中选择一定数量的个体,生成交配池。设T>0是 退火温度,选择概率为:
其中,Jmk=J(Pmk),Nm为群体Pm(t)的规模。
交叉算子是从交配池中选择两个染色体,均随机的从相同位置分开,一个 染色体的前半部分和另一个染色体的后半部分结合,另一个染色体的前半部分 和前一个染色体的后半部分结合,从而形成两个全新的个体。
变异算子分成两种,在进化初期,采用统一繁殖方式,也称无性交叉:选 择一个染色体,随机改变某一位或多位染色体的基因。收敛到一定程度后,改 用非统一繁殖,也称启发式交叉:选择距离障碍较近的基因位置,沿垂直理想 路径方向按长度分辨率产生突变。
(3)细胞克隆
细胞克隆是指在给定的繁殖数下,抗体群中所有抗体繁殖克隆的映射。设 定X,Y分别为给定的抗体群和抗原群,抗体抗原本发明建立 的抗体Xi的繁殖数计算公式为:
其中λ为随机数,表示抗体Xi的繁殖率;1.0<θ<1.5,为设定参数。
本发明建立的细胞克隆过程是抗体群Pm1(t)中每个抗体按照上述繁殖数公式 繁殖克隆,然后所繁殖的Nbm个克隆与抗原群Bm(t)中的抗原进行超突变。对其余 的克隆,随机选择Bm(t)中的一个抗原,进行均匀随机突变。
本发明建立的抗体Xi与抗原Yj的超突变公式:
Xi←Xi+β(Yj-Xi),β∈[0,α],
其中β为[0,α]上的随机数。
抗体Xi与抗原Yj的均匀随机突变是指抗体Xi以突变率α0作为概率对其各基 因位置上的基因在0到9的整数之间随机突变,λ位常数,其中α0由下式确定。
(4)抗体聚类
本发明引入聚类算法处理抗体群中过剩的个体。给定群体将P划分为q个子群Qk
根据
|F(Pki)-F(Pkj)|≤δ0,Pki,Pkj∈Qk (9)
处罚Pki,Pkj中激励度低的个体,将未被处罚的个体存入Q中。
其中激励度是指抗体群中抗体应答抗原和被其他抗体激活的综合能力,本 发明将其定义为函数F:计算公式为:
式(10)中β为调节因子,β≥1,为Pmk所属的抗体群。抗体浓度C(Pmk) 的计算公式为:
式中M(Pmk1,Pmk2)为相似度,其值越大,相似度越小;计算公式为:
聚类算法促使抗体群中相同或相似的抗体被确定性地清除,其作用不仅在 于保持种群多样性,而且为免疫选择算子选择存活抗体减轻选择压力。
如图2所示,本发明以遗传算法为主、引入抗体识别抗原的免疫机制,形 成一种新的用于AUV实时路径规划的免疫遗传算法,其基本流程为:
步骤1,如果路径起始点和目标点的连线满足公式(2),则将起始点和目标 点作为抗体转到第9步;否则,根据路径点数目要求设定小种群个数M, 通常2≤M≤100;设疫苗的集合为记忆细胞群,另起始点和目标点的连线作为记 忆细胞群的初值M1(t),令m=2;
步骤2,设定小种群Pm(t)的规模Npm、最多进化代数Tm,令t=1;
步骤3,以记忆细胞群为基础,随机生成Npm个个体组成小种群Pm(t);
步骤4按照公式(2)计算Pm(t)中每一个个体的适应值;
步骤5,从抗体群Pm(t)中选择适应值较大的个体组成备选抗原群,与原有抗 原群Bm(t)一起进行抗原聚类,从而更新抗原群Bm(t),抗原群规模为Nbm;
步骤6,从最新抗原中选择可行的最优路径作为疫苗,加入原记忆细胞群 Mm-1(t)形成新的记忆细胞群Mm(t);
步骤7,计算Pm(t)中抗体的亲和力;并以此为度量按选择概率po从Pm(t)中选 择Npm1个最佳个体组成待进化群体Pm1(t),其余个体组成群体Pm2(t);
步骤8,将Pm1(t)进行细胞克隆操作,形成一个子代Pm11(t);
步骤9,对Pm2(t)中个体进行交叉和变异等遗传操作,生成Pm(t)的子代Pm21(t);
步骤10,令Pm3(t)=[Pm11(t)Pm21(t)],计算Pm3(t)中每一个个体的适应值,如果 最优个体所对应的路径是不可行的,则随机选择部分个体和基因位进行疫苗接 种。
步骤11,对抗体群Pm3(t)进行聚类分析,选择每个聚类中适应能力较强的个 体组成子代代表Pm4(t);
步骤12,当|Pm4(t)|≥Npm时,从Pm4(t)中选择最优的Npm个抗体形成下一代群 体Pm(t+1);当|Pm4(t)|<Npm时,随机生成部分新个体和Pm4(t)一起形成下一代群体 Pm(t+1);
步骤13计算Pm(t+1)中每一个个体的适应值;
步骤14,t=t+1;如果t>Tm或满足Pareto最优解条件,输出当前群体中的 最优个体转到第15步;如果t≤Tm并且不满足Pareto最优解条件,转到第5 步;
步骤15,m=m+1;如果m>M或满足终止循环条件,转到第16步;如果m≤M 并且不满足终止循环条件,返回第2步;
步骤16,从每一个小种群最优个体组成的集合中,选择一个根 据公式(1)得到的亲和度最大值的最优个体,生成优选路径。保存疫苗信息 Mm(t)。
图3为实施例一,设AUV当前点为(24,10),目标点为(24,50)。设m=2, 分别采用免疫遗传算法(IGA)、免疫算法(IA)和遗传算法(GA)进行路径规 划,三种算法均用相同的适应性函数。取第100代的最优个体作为规划结果, 则图3a为三种算法规划的路径结果。显然,免疫遗传算法规划的路径更短、更 优。取每一代最优个体的适应值表示收敛速度,如图3b所示,三种算法在100 代时均处于收敛状态,但是收敛值却各不相同。免疫遗传算法第100代最优个 体的适应值是0.36967,遗传算法第100代最优个体的适应值是1.02796,免疫 算法第100代最优个体的适应值是0.41559。
图4和图5为实施例二,AUV的期望路径为AB,图4a为未采用实时路径 规划策略时AUV的航行轨迹,显然AUV无法通过半封闭的障碍区域,图4b 为加入本发明建立的免疫遗传算法进行实时路径规划后AUV的航行轨迹,由此 可见,本发明建立的免疫遗传实时路径规划方法为AUV提供了逃脱半封闭等陷 阱区域的手段。
实施例二中在第643.5秒、1234.5秒、724秒和1347秒共进行了4次实时 路径规划,图5a为第643.5秒时实时路径规划的结果,图5b为第1347秒时实 时路径规划的结果。
机译: 运动控制器,用于实时连续曲率路径规划
机译: 用于实时连续曲率路径规划的运动控制器
机译: 用于内窥镜图像引导程序中的用户引导实时路径规划的方法和系统;和计算机程序产品