退出
我的积分:
中文文献批量获取
外文文献批量获取
程玉虎; 易建强; 王雪松; 赵冬斌;
中国矿业大学,信息与电气工程学院,江苏,徐州,221008;
中国科学院自动化研究所,复杂系统与智能科学实验室,北京,100080;
连续状态空间; 连续动作空间; 加权Q学习; 神经气算法; 径向基网络;
机译:通过使用选择性脱敏神经网络在具有噪声和冗余输入的连续状态-动作空间中进行Q学习
机译:使用神经网络和CMAC进行Q学习的连续状态和动作空间的表达
机译:使用选择性脱敏神经网络在连续状态动作空间中进行Q学习
机译:通过使用选择性脱敏神经网络在具有冗余维的连续状态-动作空间中进行Q学习
机译:来自分析功能空间的加权组成算子进入一类加权型Banach空间
机译:通过任务-动作熵最小化对连续状态和动作空间进行主动感知
机译:连续状态和动作空间中的Q学习
机译:一类因果动态投入产出系统的状态空间一致性和可微性条件
机译:具有交叉熵指导策略的连续动作的Q学习装置及其方法
机译:进行动作的情况下,再次打开处于动作截止状态的气缸,由此使动作气缸处于动作截止状态。
机译:Q学习中调整状态空间边界的方法和装置
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。