首页> 中国专利> 基于深度强化学习的无序抓取多目标优化方法及系统

基于深度强化学习的无序抓取多目标优化方法及系统

页面导航

摘要
著录项
相似文献

摘要

本发明属于机械臂无序抓取领域，具体涉及一种基于深度强化学习的无序抓取多目标优化方法及系统，其中，基于深度强化学习的无序抓取多目标优化方法通过两个并行独立的Q网络，并在同一时刻处理同一场景，机械臂对两个网络各自的抓取点执行抓取，并返回执行路径、抓取功耗等参数。在Q网络之间会区分两者关于执行路径、抓取功耗等抓取效果的优劣，并产生对应的奖励值。Q网络接受内部和外部双重的奖励函数反馈，解决了单Q网络的奖励值函数只能是离散数据的问题，将执行路径、抓取功耗等连续数据加入到奖励值函数中，从而进一步优化抓取点的选取。

著录项

公开/公告号CN113344307B

专利类型发明专利
公开/公告日2021-11-26

原文格式PDF
申请/专利权人常州唯实智能物联创新中心有限公司;
展开▼

申请/专利号CN202110905795.0
发明设计人肖利民;张华梁;何智涛;秦广军;韩萌;杨钰杰;王良;孙锦涛;
展开▼

申请日2021-08-09
分类号G06Q10/04(20120101);G06Q10/06(20120101);G06K9/00(20060101);G06N3/08(20060101);G06N3/04(20060101);
代理机构32225 常州市科谊专利代理事务所;
代理人钮云涛
地址 213000 江苏省常州市武进区常武中路18-18号1幢101-1101室
入库时间 2022-08-23 12:51:29

相似文献

专利
中文文献
外文文献

1. 基于深度强化学习的无序抓取多目标优化方法及系统 [P] . 中国专利： CN113344307B . 2021.11.26
2. 基于深度强化学习的无序抓取多目标优化方法及系统 [P] . 中国专利： CN113344307A . 2021-09-03
3. INDEX-LINKAGE-ANALYSIS-BASED MULTI-OBJECTIVE OPTIMIZATION METHOD FOR PEAK REGULATION SCHEDULING OF POWER SYSTEM [P] . WO2021142900A1 . 2021-07-22

机译：基于索引连锁分析的多目标优化方法，用于电力系统的峰值调节调度
4. Multi-objective optimization method for power system peak-shaving based on index linkage analysis [P] . US11188933B1 . 2021-11-30

机译：基于索引连杆分析的电力系统峰值多目标优化方法
5. Multi-objective optimization method for power system peak-shaving based on index linkage analysis [P] . US11188933B1 . 2021-11-30

机译：基于索引连杆分析的电力系统峰值多目标优化方法