profit model; reinforcement learning; risk avoiding; risk model;
机译:基于分散强化学习的能源成本最小化与无线充电电车网络稳定运行的反馈
机译:基于等效消耗最小化策略的加固学习,以实现混合动力电动汽车的最优控制
机译:电动车辆能耗的实时元数据驱动路由优化使用深加固学习和马尔可夫链模型最小化
机译:将规避风险的强化学习的预期损失降至最低
机译:一种强化学习方法,用于了解大鼠的追逐行为。
机译:实时任务分配方法利用强化学习和演化策略使雾计算中的长期延迟最小化
机译:利用约束推理最小化期望损失主动学习等价关系