一种最大集合期望损失的多目标Sarsa（λ）算法

刘全; 李瑾; 傅启明; 崔志明; 伏玉琛

首页> 中文期刊>电子学报 >一种最大集合期望损失的多目标Sarsa（λ）算法

一种最大集合期望损失的多目标Sarsa（λ）算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对RoboCup这一典型的多目标强化学习问题，提出一种基于最大集合期望损失的多目标强化学习算法LRGM-Sarsa （λ）算法。该算法预估各个目标的最大集合期望损失，在平衡各个目标的前提下选择最佳联合动作以产生最优联合策略。在单个目标训练的过程中，采用基于改进MSBR误差函数的Sarsa （λ）算法，并对动作选择概率函数和步长参数进行优化，解决了强化学习在使用非线性函数泛化时，算法不稳定、不收敛的问题。将该算法应用到RoboCup射门局部策略训练中，取得了较好的效果，表明该学习算法的有效性。%For solving the multiple-goal problem in RoboCup ,a novel multiple-goal Reinforcement Learning algorithm , named LRGM-Sarsa (λ) ,is proposed .The algorithm estimates the lost reward of the greatest mass of every sub goal and trades off the long term reward of the sub goals to get a composite policy .In the single learning module ,B error function ,which is based on MSBR error function is proposed .B error function has guaranteed the convergence of the value prediction with the non-linear func-tion approximation .The probability funciton of selecting actions and the parameter αare also improved with respect to B error func-tion .This algorithm is applied to the training of shooting in Robocup 2D .The experimental results show that the proposed algorithm is more stable and converges faster .

著录项

来源
《电子学报》|2013年第8期|1469-1473|共5页
作者
刘全; 李瑾; 傅启明; 崔志明; 伏玉琛;
展开▼
作者单位

苏州大学计算机与科学学院;

江苏苏州215000;

符号计算与知识工程教育部重点实验室吉林大学;

吉林长春130012;

苏州大学计算机与科学学院;

江苏苏州215000;

苏州大学计算机与科学学院;

江苏苏州215000;

苏州大学计算机与科学学院;

江苏苏州215000;

苏州大学计算机与科学学院;

江苏苏州215000;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
多目标; 自适应Sarsa(λ); 最大集合期望损失; 强化学习; 机器人足球;
入库时间 2023-07-24 21:25:52

相似文献

中文文献
外文文献
专利

1. 一种基于期望最大化的多目标轨迹拟合算法 [J] . 刘禹 ,李培 ,盛骥松 . 舰船电子对抗 . 2020,第006期
2. 基于期望最大化算法的捷变频联合正交频分复用雷达高速多目标参数估计 [J] . 全英汇 ,高霞 ,沙明辉 . 电子与信息学报 . 2020,第007期
3. 一种基于期望最大化去偏转换量测滤波的目标跟踪算法 [J] . 张连仲 ,王宝宝 ,王超尘 . 中国惯性技术学报 . 2020,第006期
4. 一种基于期望最大化条件的电容层析成像图像重建算法 [J] . 张云龙 ,陈德运 ,王莉莉 . 哈尔滨理工大学学报 . 2016,第002期
5. 一种基于期望最大化的OFDM半盲信道估计算法 [J] . 兰海燕 ,赵旦峰 . 信息技术 . 2006,第004期
6. 多目标演化算法中一种快速求解群体非劣集合算法 [C] . 曾三友 ,株洲工学院计算机系 ,李晖 . 2004年全国理论计算机科学学术年会 . 2004
7. 基于潜变量混合模型的4PL期望三重最大化算法与贝叶斯期望三重最大化算法 [A] . 章慈 . 2019

一种最大集合期望损失的多目标Sarsa（λ）算法

摘要

著录项

相似文献

相关主题

期刊订阅