基于RL算法的自学习博弈程序设计及实现

付强; 陈焕文

首页> 中文期刊> 《长沙理工大学学报：自然科学版》 >基于RL算法的自学习博弈程序设计及实现

基于RL算法的自学习博弈程序设计及实现

AI论文写作 >>

AI期刊论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

针对目前在中国象棋计算机博弈中广泛采用人工设置的评估函数,提出了基于激励学习与神经网络相结合的评估函数自学习方法,基于此模型实现了一个能自学习的中国象棋博弈程序.该方法避免了人工设置评估函数,解决了传统程序深层搜索博弈树消耗的时间和运行空间均很大的问题,也适用于其他的计算机博弈程序设计.实验结果表明,该方法是一种有效的自适应学习方法.

著录项

来源
《长沙理工大学学报：自然科学版》 |2007年第4期|73-78|共6页
作者
付强; 陈焕文;
展开▼
作者单位

长沙理工大学计算机与通信工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
中国象棋; 激励学习; 神经网络; 博弈;

相似文献

中文文献
外文文献
专利

1. 基于Kalman滤波的多传感器分布式数据融合算法及其并行实现(英文) [J] . 郭强 ,郁松年 . 先进制造进展：英文版 . 2006,第2期
2. 基于转向的Logit网络分配算法实现与比较测试(英文) [J] . 顾程 ,任刚 . 东南大学学报：英文版 . 2011,第3期
3. 计算网格中基于博弈论的改进算法机制 [J] . 林雯 ,郁松年 ,肖齐 . 上海大学学报（英文版） . 2007,第1期
4. 基于流水线结构的可重构AES算法IP核的硬件实现(英文) [J] . 李冰 ,夏克维 ,梁文丽 . 东南大学学报：英文版 . 2010,第1期
5. 移动边缘云计算中基于演进博弈的联合资源分配算法（英文） [J] . 张静 ,夏玮玮 ,黄博南 . 东南大学学报：英文版 . 2018,第4期
6. 基于链表的单域单向水平倾角最小化圈绕凸壳新算法的计算机实现——数据结构与程序设计"学用结合"教学模式创新探索 [C] . 周启海 ,黄涛 ,杨祥茂 . 全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会 . 2006
7. 鹰鸽博弈与网络博弈视角下阶层固化的演化探析与基于RL的模拟分析 [A] . 周璇 . 2023

基于RL算法的自学习博弈程序设计及实现

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅