首页> 中文会议>2011年中国自动化大会暨钱学森诞辰一百周年及中国自动化学会五十周年会庆 >部分观测马尔科夫决策过程的时空联想记忆网络模型

部分观测马尔科夫决策过程的时空联想记忆网络模型

页面导航

摘要
著录项
相似文献
相关主题

摘要

状态空间和策略空间上的计算复杂性使得求解部分观测马尔科夫决策过程（POMDP）的最优策略问题具有NP难度。为此，本文借鉴生物神经元的特性提出一种时空联想记忆网络（STAMN）模型作为POMDP的计算模型。首先，STAMN利用活性衰减、突触势能以及节点间的同步激活机制来实现k步短期记忆，进而实现状态定位。其次，利用状态节点与行动节点之间的权值来表示状态-行动值函数，并利用其同步更新简化了系统的决策空间。然后利用权值的衰减来模拟长期记忆的衰退过程，适应动态环境的建模。最后利用STAMN实现了环境的空间认知，实验结果验证了该网络可以有效解决循环环境的同时定位与标图（SLAM）问题。

著录项

来源
《2011年中国自动化大会暨钱学森诞辰一百周年及中国自动化学会五十周年会庆》|2011年|1-15|共15页
会议地点北京
作者
王作为; 武继刚; 张汝波;
展开▼
作者单位

中国自动化学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类人工智能理论;
关键词
部分观测马尔科夫决策过程; 时空联想记忆网络; 神经元特性; 智能体; 行为决策;

相似文献

中文文献
外文文献
专利

1. 基于认知无线电的部分可观测马尔科夫决策过程衰落信道的接入 [J] . 方媛 ,车启凤 . 兰州文理学院学报：自然科学版 . 2017,第002期
2. 基于认知无线电的部分可观测马尔科夫决策过程衰落信道的接入 [J] . 方媛 ,车启凤 . 甘肃联合大学学报（自然科学版） . 2017,第002期
3. 部分可观察马尔科夫决策过程优化不稳定型心绞痛中西医结合临床治疗方案的建模方法与验证研究 [J] . 冯妍 ,冯奇 ,王以新 . 中国全科医学 . 2020,第017期
4. 基于部分可测马尔科夫决策过程业务感知的微基站休眠时长确定策略 [J] . 陈前斌 ,何小强 ,吴攀 . 电子与信息学报 . 2018,第001期
5. 基于部分可观察马尔科夫决策过程(POMDP)的贪婪算法次优频谱接入 [J] . 张娟 . 科学技术与工程 . 2014,第015期
6. 基于部分可观测马尔可夫决策过程的水声传感器网络介质访问控制协议 [C] . XU Ming ,徐明 ,LIU Guangzhong . 2015年全国开放式分布与并行计算学术年会 . 2015
7. 基于部分可观测马尔科夫决策过程的干扰决策研究 [A] . 张思齐 . 2019

部分观测马尔科夫决策过程的时空联想记忆网络模型

摘要

著录项

相似文献

相关主题

期刊订阅