首页> 中国专利> 一种基于概率输出模型的智能车辆换道决策方法

一种基于概率输出模型的智能车辆换道决策方法

摘要

本发明公开一种基于概率输出模型的智能车辆换道决策方法,获取行车环境参数并计算原始车道行驶预判车距和换道预判车距;建立换道概率输出模型,判断汽车执行操作后是否存在潜在碰撞,设计自由换道模糊控制器的输入和输出;由各输入的隶属度可以分别得到基于安全性分析和基于经济性分析输出的换道概率;根据模糊控制器输入的原始车道后车转向灯开启情况、原始车道后车对自车的影响程度,建立换道消极系数;结合二元选择Probit模型建立自由换道概率输出模型,输出自由换道概率;最终得到自车换道概率。本发明在满足换道安全的前提下能够使得自车行驶在驾驶空间优越,潜在碰撞风险小,燃油经济性好的驾驶环境中,有效地缓解交通拥挤、排放超标等问题。

著录项

  • 公开/公告号CN112365710A

    专利类型发明专利

  • 公开/公告日2021-02-12

    原文格式PDF

  • 申请/专利权人 南京航空航天大学;

    申请/专利号CN202011116778.0

  • 发明设计人 王海涛;周小川;赵万忠;

    申请日2020-10-19

  • 分类号G08G1/01(20060101);G08G1/052(20060101);G08G1/16(20060101);G05B13/04(20060101);G06N5/04(20060101);G06N20/00(20190101);

  • 代理机构32204 南京苏高专利商标事务所(普通合伙);

  • 代理人柏尚春

  • 地址 210016 江苏省南京市秦淮区御道街29号

  • 入库时间 2023-06-19 09:52:39

说明书

技术领域

本发明属于智能车领域,具体涉及一种基于概率输出模型的智能车辆换道决策方法。

背景技术

随着我国经济社会的不断发展,智能车研究成为汽车领域发展的前沿方向,未来随着路上车辆的数目不断增加,交通拥挤问题、排放超标问题甚至交通事故会更为凸显,而交通拥挤问题较多情况下是由错误换道造成的,并且换道后自车车速很大可能并没有行驶在经济性行驶的车速区间,由此造成了油耗的增加,长此以往,燃烧燃油数量的增加会造成碳排放量的进一步升高,因此,对于未来智能车而言,选择合理的换道策略,对保证汽车安全行驶、提高汽车燃油经济性进而减少碳排放具有重要研究价值。

然而,目前国内外的模糊换道模型多是选用多个单一的参数(例如相对间距、相对速度、最迟换道距离、驾驶员性格等)作为模糊推理系统的输入量选用的特征参数缺乏讨论,而且考虑周边车辆驾驶行为具有明显局限性,大多是追求驾驶空间的优越性,造成车辆换道后汽车驾驶性能并不能真正改善,也无法真实改善当前交通流中拥挤、排放高、交通事故频发的问题。

针对上述问题,中国发明申请号CN109948001A公开了一种基于驾驶员心理的换道概率输出模型,在满足换道后安全的前提下,应用模糊数学的思想将换道后自车与换道目标车道前车速度差作为诱惑程度指标,将换道后自车与换道目标车道后车作为影响程度指标,进行离散化划分,综合二者作为换道执行的判断条件。这种换道概率模型的建立一定程度上保证了换道后的车辆具备一定的驾驶空间优越性和经济性。但是这种换道概率输出模型具有明显的局限性:这种换道概率模型在满足行车安全的前提下,仅考虑目标车道行驶车辆的状态作为换道判断条件,缺乏在满足行车安全的前提下对原始车道行驶和换道之间的博弈,由于只考虑了换道目标车道前车车速对于自车车速提升的诱惑程度和自车对换道目标车道后车车速的影响情况,缺乏对换道后跟车距离过小导致的潜在碰撞风险的考虑;且只考虑速度提升而忽略了是否使得汽车行驶在经济车速,因此在缓解排放问题和降低交通事故发生率的作用上具有很大局限性;对于模型的建立缺乏对环境变化的动态适应性能。

发明内容

发明目的:本发明提供一种基于概率输出模型的智能车辆换道决策方法,在满足换道安全的前提下能够很大程度上使得自车行驶在驾驶空间优越,潜在碰撞风险小,燃油经济性好的驾驶环境中,有效地缓解交通拥挤、排放超标等问题。

技术方案:本发明所述的一种基于概率输出模型的智能车辆换道决策方法,包括以下步骤:

(1)通过自车车载传感器获取当前时刻行车环境参数;

(2)定义并计算原始车道行驶预判车距和换道预判车距;

(3)根据原始车道行驶预判车距和换道预判车距在满足不同条件时会具备不同的换道概率,建立换道概率输出模型;

(4)判断汽车执行操作后是否存在潜在碰撞,根据判断结论,当汽车执行操作后不存在潜在碰撞时,有一定概率自由换道,进入步骤(5),当汽车执行操作后存在潜在碰撞时,直接输出非自由换道概率0或1进入步骤(9);

(5)当自车在原始车道行驶和换道行驶都能保证安全的条件下,基于安全性和经济性分析,车辆倾向于越小潜在危险程度,越高燃油经济性和越小影响后车行驶的驾驶行为,以获得更优的驾驶空间;再结合路况信息、车况信息及驾驶员的驾驶风格分析,设计自由换道模糊控制器的输入和输出;

(6)针对步骤(5)设计的模糊控制器的输入,建立各个输入的隶属度函数得到各输入对应的隶属度,由各输入的隶属度可以分别得到基于安全性分析和基于经济性分析输出的换道概率;

(7)根据模糊控制器输入的原始车道后车转向灯开启情况、原始车道后车对自车的影响程度,建立换道消极系数;

(8)根据步骤(6)得到的基于安全性分析和基于经济性分析的换道概率和步骤(7)到的换道消极系数,结合二元选择Probit模型建立兼顾安全性和经济性的自由换道概率输出模型,输出自由换道概率;

(9)结合步骤(4)输出的非自由换道概率和步骤(8)输出的自由换道概率得到自车换道概率;

(10)当换道概率大于预先设定的换道阈值时,予以换道操作,当非自由换道概率或自由换道概率小于换道阈值时,不予换道操作。

进一步地,步骤(1)所述的行车环境参数包括自车和原始车道前车之间的车间距、自车和换道目标车道前车之间的车间距、自车和换道目标车道后车之间的车间距、自车和原始车道后车之间的车间距、当前时刻自车的速度、原始车道前车的速度、换道目标车道前车的速度、换道目标车道后车的速度及当前时刻原始车道后车转向灯使用情况。

进一步地,步骤(2)所述的原始车道行驶预判车距和换道预判车距包括:自车执行原始车道行驶后自车与原始车道前车之间的预判车间距、自车执行换道行驶后自车与换道目标车道前车之间的预判车间距及自车执行换道行驶后自车与换道目标车道后车之间的预判车间距。

进一步地,步骤(5)所述的模糊控制器的输入包括:自车执行原始车道行驶的潜在危险程度、自车执行原始车道行驶对保证汽车行驶时燃油经济性的诱惑程度、自车换道后与换道目标车道前车的潜在危险程度、自车换道后与换道目标车道后车的潜在危险程度、自车换道后对换道目标车道后车的干扰程度、自车换道后对保证汽车行驶时燃油经济性的诱惑程度、原始车道后车转向灯开启情况、原始车道后车对自车的影响程度;所述模糊控制器的输出为自由换道概率。

进一步地,步骤(6)所述的模糊控制器输入的隶属度函数包括:原始车道行驶的潜在危险程度隶属度函数、原始车道行驶对保证汽车行驶时燃油经济性的诱惑程度隶属度函数、换道后与换道目标车道前车的潜在危险程度隶属度函数、换道后与换道目标车道后车潜在危险程度隶属度函数、换道后自车对换道目标车道后车的干扰程度隶属度函数、换道后对保证汽车行驶时燃油经济性的诱惑程度隶属度函数。

进一步地,步骤(6)所述的基于安全性分析和基于经济性分析的换道概率是通过强化Q-Learning的方法,根据线性概率模型LPM建立安全性和经济性评价指标,生成对应于策略的奖励,代入到bellman方程中求解获得的。

进一步地,步骤(8)所述的二元选择Probit模型中的参数通过最大似然解的方法进行修正。

有益效果:与现有技术相比,本发明的有益效果:

1、综合考虑原始车道前后车和换道目标车道前后车的运动状态信息,环境信息采集更为全面;

2、在满足安全行驶的前提下,从安全性和经济性两方面对原始车道行驶和换道行驶进行博弈,将潜在碰撞风险大小和和是否接近经济行驶车速作为博弈的关键,能够有效的规避潜在危险,保证汽车最大限度地行驶在经济车速附近,减少油耗,使得汽车具有良好的综合驾驶性能;

3、应用强化Q-learning理论处理基于安全性分析和基于经济性分析的换道概率涉及的策略参数修正;应用最大似然解方法处理二元选择Probit模型中的策略参数修正;能够使得策略参数不断进行在线和离线学习修正,使得自由换道概率模型能够更加适应不断变化的行车环境,提高决策动态适应性能和准确性;

4、针对自由换道模糊控制控制器输入的隶属度函数应用不同的连续隶属度函数模型,使得计算得到的隶属度更加精确,ECU计算决策时间缩短,很大程度上避免了由于环境突变造成的误换道现象;

5、为未来智能车发展提供了一种具有理论意义和实际应用价值的换道概率模型,能够大大缓解交通拥挤,排放污染甚至交通事故等交通问题。

附图说明

图1为本发明的流程图;

图2为本发明的场景设置示意图;

图3为本发明应用强化Q-Learning理论确定基于安全性分析的概率输出模型参数的方法示意图。

具体实施方式

下面结合附图对本发明做进一步详细说明。

如图1所示,本发明提出一种基于概率输出模型的智能车辆换道决策方法,图2为本实施方式的场景设置示意图,自车为i,原始车道前车A,换道目标车道前车为B,换道目标车道后车为C,原始车道后车为D,d

步骤1:通过自车i车载传感器获取当前时刻t时的行车环境参数。

行车环境参数包括:自车和原始车道前车之间的车间距,自车和换道目标车道前车之间的车间距,自车和换道目标车道后车之间的车间距以及自车和原始车道后车之间的车间距;获取当前时刻自车的速度,原始车道前车的速度,换道目标车道前车的速度,换道目标车道后车的速度;获取当前时刻原始车道后车转向灯使用情况。

如图2所示,本实施方式行车环境参数包括:自车i和车A之间的车间距d

步骤2:定义并计算原始车道行驶预判车距和换道预判车距。

原始车道行驶预判车距和换道预判车距包括:自车i执行原始车道行驶后自车i与原始车道前车A之间的预判车间距

步骤3:根据原始车道行驶预判车距和换道预判车距在满足不同条件时会具备不同的换道概率,由此建立换道概率输出模型P

其中,α为执行操作后不存在潜在碰撞的自由换道概率。

依据换道概率输出模型P

1)

2)

3)

步骤4:判断汽车执行操作后是否存在潜在碰撞,根据判断结论,当汽车执行操作后不会存在潜在碰撞时,有一定概率α自由换道,进入步骤5,当汽车执行操作后存在潜在碰撞时,直接输出非自由换道概率P

步骤5:当自车i执行操作后在原始车道行驶和换道行驶都能保证安全的条件下,基于安全性和经济性分析,自车i倾向于越小潜在危险程度,越高燃油经济性和越小影响后车行驶的驾驶行为,以获得更优的驾驶空间;再结合路况信息、车况信息及驾驶员的驾驶风格分析,设计自由换道模糊控制器的输入和输出。

模糊控制器的输入包括:自车执行原始车道行驶的潜在危险程度、自车执行原始车道行驶对保证汽车行驶时燃油经济性的诱惑程度、自车换道后与换道目标车道前车的潜在危险程度、自车换道后与换道目标车道后车的潜在危险程度、自车换道后对换道目标车道后车的干扰程度、自车换道后对保证汽车行驶时燃油经济性的诱惑程度、原始车道后车转向灯开启情况、原始车道后车对自车的影响程度;模糊控制器的输出包括:自由换道概率。

自由换道模糊控制器的输入和输出如式(2)所示:

其中,模糊控制器的输入为X

步骤6:针对步骤5设计的模糊控制器的输入,建立各个输入的隶属度函数得到各输入对应的隶属度,由各输入的隶属度可以分别得到基于安全性分析和基于经济性分析输出的换道概率P

自车i执行原始车道行驶的潜在危险程度隶属度函数P

模糊控制器输入的隶属度函数中,P

由于安全跟车距离为D

其中,P

X

其中,P

换道后与换道目标车道前车B的潜在危险程度隶属度函数、换道后与换道目标车道后车C潜在危险程度隶属度函数共同决定换道后潜在危险程度,因此换道后潜在危险程度的隶属度函数为三维曲面;定义换道后潜在危险程度隶属度函数P

其中,P

由于自车i经济行驶的车速为

其中,P

由于自车i经济行驶的车速为

其中,P

基于安全性分析的自由换道概率由原始车道行驶的潜在危险程度隶属度函数、换道后与换道目标车道前车的潜在危险程度隶属度函数、换道后与换道目标车道后车潜在危险程度隶属度函数、换道后自车对换道目标车道后车的干扰程度隶属度函数计算得到;基于经济性分析的自由换道概率由原始车道行驶对保证汽车行驶时燃油经济性的诱惑程度隶属度函数、换道后对保证汽车行驶时燃油经济性的诱惑程度隶属度函数属于高斯型隶属度函数计算得到。

计算基于安全性分析和基于经济性分析的换道概率策略通过强化Q-Learning的方法,根据线性概率模型LPM建立安全性和经济性评价指标,生成对应于策略的奖励,代入到bellman方程中进行求解。

基于安全性分析输出的自由换道概率P

P

其中,β

基于安全性分析的换道概率分配系数β

强化Q-Learning算法对基于安全性分析的换道概率分配系数β

设自车i当前时刻行驶环境状态为s,自车i当前时刻的操作为动作a,P

1)为对s转换到下一个状态s’形成奖励R,应用线性概率模型LPM对执行操作后的自车i行驶状况建立安全性评价指标Q

其中,K

对于Q

2)定义状态值函数V

V

最优累计期望V

寻找最优换道策略[β

3)定义状态动作值函数Q(s,a),其bellman方程计算公式如式(14)所示;

Q

其中,γ为学习率,Gt是t时刻开始的总折扣奖励,γ可以根据不同交通场景换道决策的需要进行取值选择,可见,当γ越接近于1时,说明状态动作值函数Q(s,a)越有远见,会着重考虑后续状态的价值;当γ越接近于0时,状态动作值函数Q(s,a)会变得近视只考虑当前的利益影响;所以当对状态动作值函数Q(s,a)计算精确性要求不高时,可以将γ取得小些,ECU运算负担会减小,而当状态动作值函数Q(s,a)计算精确性要求高时,可以γ取得大些。

4)定义最优价值动作函数Q

Q

其中,动作A对应最优价值动作函数Q

5)我们对Q(s,a)值进行计算,形成Q-table,通过应用时间差分法建立更新公式不断学习对Q-table进行更新,如式(16)所示;

Q(s,a)←Q(s,a)+α[r+γmax

其中,α为学习率γ的奖励性衰变系数,更新公式的意义在于通过过往Q-table中的Q(s,a)来估计当前Q值,并通过选取下一状态最大的Q(s’,a’)乘以学习率γ加上真实回报值作为Q现实,由此可以计算出新的Q(s,a)。

6)在Q-table中,解算出最优控制策略max[β

基于经济性分析输出的自由换道概率P

P

其中,Ψ

基于经济性分析的换道概率分配系数Ψ

应用强化Q-Learning方法找到最优控制策略(换道概率分配系数)的方法如图3所示,智能车通过车联网与云端换道数据库联接,当智能车行车环境换道数据采集模块采集到与前后车车距和前后车车速等环境信息后,此环境信息通过链路进入智能车ECU的决策模块,也通过车联网进入到云端换道数据库,同时决策模块从Q-table模块调取预先形成的Q表进行匹配后找到最优策略输出到执行模块,控制智能车进行行驶操作,与此同时,学习模块同时读取行车环境换道数据采集模块的环境信息、决策模块的决策结果、云端换道数据库换道数据,进行线上和线下两种模式的学习,从而不断更新Q-table模块的Q表,使得决策结果更接近最优策略。

步骤7:根据模糊控制器输入的原始车道后车转向灯开启情况、原始车道后车对自车的影响程度,建立换道消极系数。

X

可见,存在换道消极系数λ定义下的绝对窗口距离(-∞,-D

步骤8:换道概率P

二元选择Probit模型中的参数可以通过最大似然解的方法进行修正。

自由换道概率模型α的输出函数如式(19)、式(20)所示;

其中,α*为潜变量,不能观测,可以观测的为自由换道概率α;ε

对应安全性和经济性的分配系数ε

确定ε

其中,F为ε

列似然函数如式(23):

L=Π

应用聚类分析法,将同一类型的汽车流分类,将自由换道概率高的数据带入式(23),应用最大似然解方法,求解出ε

则在满足执行操作后不发生潜在碰撞的前提下,能够得到自由换道概率模型模糊控制器的输出α为P

步骤9:结合步骤4输出的非自由换道概率P

步骤10:当自车i换道概率P

在满足换道安全的前提下,综合分析安全性和经济性两大指标,建立二元选择Probit概率输出模型,并结合强化Q-Learning理论和最大似然解方法不断针对环境和换道数据变化对模型进行修正,在满足换道安全的前提下能够很大程度上使得自车行驶在驾驶空间优越,潜在碰撞风险小,燃油经济性好的驾驶环境中,有效地缓解交通拥挤、排放超标等问题。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号