首页> 中国专利> 用于改进随机控制问题的策略的方法和系统

用于改进随机控制问题的策略的方法和系统

摘要

公开了一种用于改进随机控制问题的策略的方法和系统,随机控制问题由动作集合、状态集合、作为状态和动作的函数的奖励结构,以及多个决策时期表征,该方法包括使用采样装置获得表示玻尔兹曼机的样本配置的数据,获得随机控制问题的初始化数据和初始策略;将分别表示玻尔兹曼机的每个耦合器和每个节点的初始权重和偏置以及横向场强的数据分配给采样装置;进行以下操作直到满足停止标准:生成当前时期状态动作对,修改表示没有耦合器或至少一个耦合器和至少一个偏置的数据,执行对应于当前时期状态动作对的采样以获得第一采样经验均值,获得在当前时期状态动作处的Q函数的值的近似,获得未来时期状态动作对,其中,状态是通过随机状态处理获得的,并且进一步其中,获得动作包括对包括未来时期状态和任何可能动作的多个所有状态动作对执行随机优化测试,从而在未来时期提供动作并更新未来时期状态的策略;修改表示没有耦合器或至少一个耦合器和至少一个偏置的数据,执行对应于未来时期状态动作对的采样,获得未来时期状态动作处的Q函数的值的近似,更新每个权重和每个偏置,并当满足停止标准时提供策略。

著录项

  • 公开/公告号CN109154798B

    专利类型发明专利

  • 公开/公告日2022-02-25

    原文格式PDF

  • 申请/专利权人 1QB信息技术公司;

    申请/专利号CN201780028555.9

  • 申请日2017-05-09

  • 分类号G05B13/02(20060101);G05B21/02(20060101);G06N3/04(20060101);G06N3/08(20060101);G06N99/00(20190101);

  • 代理机构11240 北京康信知识产权代理有限责任公司;

  • 代理人梁丽超;田喜庆

  • 地址 加拿大不列颠哥伦比亚省

  • 入库时间 2022-08-23 13:10:23

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号