机译:基于双延迟深度确定性政策梯度算法的自适应神经模糊PID控制器
Kings Coll London Dept Engn London WC2R 2LS England;
Kings Coll London Dept Engn London WC2R 2LS England;
Kings Coll London Dept Engn London WC2R 2LS England;
Kings Coll London Dept Engn London WC2R 2LS England;
Twin delayed deep deterministic policy gradient algorithm; Reinforcement learning; Fuzzy PID controller; Cart-pole system;
机译:使用双胞胎延迟的非理性行为的混合动力车辆智能能量管理策略深度确定性政策梯度
机译:基于代理的电力市场建模使用深度确定性政策梯度算法
机译:基于联盟区块链的深度确定性策略梯度算法,实现家庭间最佳电力交易
机译:基于深度确定性策略梯度算法的新型汽车排跟随控制器
机译:被动非线性系统的自适应神经模糊控制器。
机译:控制动态双足行走的深度确定性策略梯度的实现
机译:基于自动驾驶卷积块注意力的深度确定性政策梯度算法