首页> 中文会议>2007年中国机器博弈学术研讨会 >时序差分学习在非完备信息机器博弈中的应用与优化

时序差分学习在非完备信息机器博弈中的应用与优化

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文研究了TD(λ)-时序差分学习技术在非完备信息机器博弈中的应用，将时序差分学习技术和蒙特卡罗抽样技术相结合，实现了一个自学习的非完备信息博弈系统。传统的静态线形估值技术无法根据学习到的知识动态地调整智能体的行为，棋力弱而且提高缓慢。本系统可以根据博弈过程的结果来动态地调整描述棋局的各个权重，从而加快了学习过程，显著提高了棋力。实验结果表明，该系统能够有效地模拟人类智能做出合理的走步。

著录项

来源
《2007年中国机器博弈学术研讨会》|2007年|55-58|共4页
会议地点重庆
作者
王轩; 许朝阳; 马骁;
展开▼
作者单位

中国人工智能学会;

东北大学;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类
关键词
时序差分学习; 非完备信息博弈; 蒙特卡罗抽样; 历史启发搜索算法;

相似文献

中文文献
外文文献
专利

1. UCT-RAVE算法在多人非完备信息博弈中的应用 [J] . 芮雄星 ,王一莉 . 计算机工程与设计 . 2012,第003期
2. 非差分GPS在移动机器人位点导航中的应用 [J] . 田学军 . 制造业自动化 . 2009,第006期
3. 优化非等时距加权灰色-时序组合模型在地铁监测中的应用 [J] . 黄浩 ,苏小文 ,凌青 . 测绘与空间地理信息 . 2021,第009期
4. 差分进化理论在MIMO-OFDM系统机器编码参数优化中的应用 [J] . 杨妮 . 科技通报 . 2016,第2期
5. 基于非合作博弈的布谷鸟搜索算法在微电网多目标优化中的应用 [J] . 曹瑛 ,刘建锋 ,范梦琪 . 上海电力学院学报 . 2018,第006期
6. 即时差分学习在六子棋机器博弈中的应用 [C] . Xin-he XU ,徐心和 ,Chang-ming XU . 中国人工智能学会第十三届学术年会 . 2009
7. 时序差分学习在非完备信息机器博弈中的应用 [A] . 许朝阳 . 2007

时序差分学习在非完备信息机器博弈中的应用与优化

摘要

著录项

相似文献

相关主题

期刊订阅