首页> 中文会议>第九届中国智能机器人学术研讨会 >基于AMDP-Q的自主车辆行驶策略求解

基于AMDP-Q的自主车辆行驶策略求解

页面导航

摘要
著录项
相似文献
相关主题

摘要

结合增广马尔可夫决策过程(AMDP)，蒙特卡罗一部分可观察马尔可夫决策过程(MC—POMDP)以及Q学习，提出了AMDP—Q学习(AMDP—Q)算法。算法的主要思想是：首先用一个低维充分统计量表示原信念状态空间，通常使用最大似然状态和信念状态的信息熵作为充分统计量。其组成的空间称为增广状态空间；然后应用参考状态集离散化该空间，并利用Q学习和Shepard插值得到连续状态的转移函数和回报函数；最后使用具有知识探索性质的e-贪婪策略进行策略选择。实验结果表明：AMDP—Q比MC-POMDP收敛速度更快。

著录项

来源
《第九届中国智能机器人学术研讨会》|2011年|370-373|共4页
会议地点深圳
作者
夏林锋; 钱徽; 陈沈轶; 金卓军;
展开▼
作者单位

中国人工智能学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类机器人;
关键词
自主车辆; 行驶策略; 马尔可夫决策过程算法; Q学习算法; 连续状态空间;

相似文献

中文文献
外文文献
专利

1. 基于模糊控制的智能车辆自主行驶方法研究 [J] . 熊波 ,曲仕茹 . 交通运输系统工程与信息 . 2010,第002期
2. 基于改进PID串级控制的地下无人车辆行驶控制策略 [J] . 龙智卓 ,郭鑫 ,姜勇 . 有色金属（矿山部分） . 2018,第006期
3. 基于行驶工况分类的混合动力车辆速度预测方法与能量管理策略 [J] . 丁峰 ,王伟达 ,项昌乐 . 汽车工程 . 2017,第011期
4. 自主行驶车辆的避障控制算法研究 [J] . 高俊钗 ,宁江坤 . 计算机与数字工程 . 2016,第002期
5. 自主行驶履带车辆转向制动操纵技术研究 [J] . 李国强 ,王兴野 . 拖拉机与农用运输车 . 2014,第4期
6. 自主队列行驶车辆纵向建模及仿真 [C] . Yang Liangyi ,杨良义 ,Sun Dihua . 第十一届中国智能交通年会 . 2016
7. 基于图像处理的车辆行驶过程中自主辅助控速技术的研究 [A] . 杨先勇 . 2012

基于AMDP-Q的自主车辆行驶策略求解

摘要

著录项

相似文献

相关主题

期刊订阅