Q-learning; Exploration region expansion; Exploration-exploitation; Metropolis criterion;
机译:一种基于建筑形态的可持续设计策略,采用优化算法改善中国寒冷地区大学校园小气门
机译:基于加权Q学习算法的自适应作业商店调度策略
机译:无线传感器网络中基于改进支持向量机的任务学习Q学习算法
机译:一种改进的基于勘探区域扩展策略的Q学习算法
机译:通过基于本能的交配策略改善遗传算法中的搜索。
机译:基于改进的基于快速区域的卷积神经网络算法的肉鸡震惊状态检测
机译:一种基于Q学习和自适应探索策略的新型路径规划算法