首页> 中国专利> 基于深度强化学习的无序抓取多目标优化方法及系统

基于深度强化学习的无序抓取多目标优化方法及系统

摘要

本发明属于机械臂无序抓取领域,具体涉及一种基于深度强化学习的无序抓取多目标优化方法及系统,其中,基于深度强化学习的无序抓取多目标优化方法通过两个并行独立的Q网络,并在同一时刻处理同一场景,机械臂对两个网络各自的抓取点执行抓取,并返回执行路径、抓取功耗等参数。在Q网络之间会区分两者关于执行路径、抓取功耗等抓取效果的优劣,并产生对应的奖励值。Q网络接受内部和外部双重的奖励函数反馈,解决了单Q网络的奖励值函数只能是离散数据的问题,将执行路径、抓取功耗等连续数据加入到奖励值函数中,从而进一步优化抓取点的选取。

著录项

  • 公开/公告号CN113344307B

    专利类型发明专利

  • 公开/公告日2021-11-26

    原文格式PDF

  • 申请/专利号CN202110905795.0

  • 申请日2021-08-09

  • 分类号G06Q10/04(20120101);G06Q10/06(20120101);G06K9/00(20060101);G06N3/08(20060101);G06N3/04(20060101);

  • 代理机构32225 常州市科谊专利代理事务所;

  • 代理人钮云涛

  • 地址 213000 江苏省常州市武进区常武中路18-18号1幢101-1101室

  • 入库时间 2022-08-23 12:51:29

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号