首页> 中国专利> 一种基于持续学习的多类别多尺度目标拣选方法及装置

一种基于持续学习的多类别多尺度目标拣选方法及装置

摘要

本发明公开了一种基于持续学习的多类别多尺度目标拣选方法及装置,通过生成对抗网络实现新旧任务特征的隐藏空间表示,从而建立知识记忆存储仓库,使用自适应知识迁移调度模块实现多任务拣选的快速切换,加速新任务的训练过程,结合正则化技术量化模型参数的重要程度,防止关键参数在训练过程中被覆盖。将数据重放框架用于智能零件拣选系统,能够克服在多类型多尺度目标拣选模型持续学习过程中出现的功能灾难性遗忘问题,确保拣选模型功能的完整性,实现目标与场景可以动态变化的持续性学习,帮助系统协调高效地解决多任务拣选问题。

著录项

  • 公开/公告号CN113222004A

    专利类型发明专利

  • 公开/公告日2021-08-06

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学(深圳);

    申请/专利号CN202110499381.2

  • 发明设计人 张正;赵书光;卢光明;

    申请日2021-05-08

  • 分类号G06K9/62(20060101);G06N3/04(20060101);

  • 代理机构44451 深圳市添源知识产权代理事务所(普通合伙);

  • 代理人黎健任

  • 地址 518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区

  • 入库时间 2023-06-19 12:07:15

说明书

技术领域

本发明属于机器学习技术领域,具体涉及一种多类别多尺度目标拣选方法及装置。

背景技术

目标拣选模型是智能制造与柔性制造发展的核心技术,实现工业加工、检测和装配的无人化生产,在机械加工、汽车制造、仓储物流和3C等领域有广阔的应用前景。

目前智能视觉零件拣选系统在拣选多类别多尺度目标,尤其是连续动态训练新的拣选对象时,模型参数容易被新的学习过程大面积覆盖,拣选系统会出现对已有功能的灾难性遗忘问题,导致系统工作效率大幅降低,并且对系统原有功能造成破坏,同时新的系统任务又难以有效学习。

发明内容

本发明为了解决现有技术中的问题,提出了一种基于持续学习的多类别多尺度目标拣选方法及装置,采用先进的持续学习技术来解决现有智能拣选系统在应对多种类别、多种尺度的目标时,无法自适应地对已有拣选学习系统的有效调度和对新任务的高效学习问题。

为了达到上述目的,本发明的实施例提供了一种基于持续学习的多类别多尺度目标拣选方法,包括:

获取与新任务相似类型的知识先验;

根据生成模型获得所述新任务和所述知识先验的全局特征数据;

根据所述全局特征数据训练正则化拣选模型;

其中,在拣选模型训练的同时,采用进化算法和神经网络架构搜索实现模型训练过程中结构自适应扩张。

进一步地,所述新任务通过数据重现模块中的记忆协调器获取相似类型的知识先验。

进一步地,所述数据重新模块利用生成模型对输入数据的编码表示能力来构建高效的知识记忆存储功能,根据生成模型对全局数据的隐空间特征表不。

进一步地,所述数据重现模块的损失函数J

其中,θ

进一步地,正则化加权约束项J

其中,λ是一个超参数,θ

进一步地,模型容量损失函数J

J

其中,α

本发明实施例还提供了一种基于持续学习的多类别多尺度目标拣选装置,包括:

数据重新模块,用于获取与新任务相似类型的知识先验,以及

根据生成模型获得所述新任务和所述知识先验的全局特征数据;

正则化模块,用于根据所述全局特征数据训练正则化拣选模型;

动态模型容量扩充模块,在拣选模型训练的同时,采用进化算法和神经网络架构搜索实现模型训练过程中结构自适应扩张。

本发明实施例还提供了一种计算机程序产品,包括计算机程序指令,当所述指令由处理器执行时,用于实现前述的基于持续学习的多类别多尺度目标拣选方法。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被执行时,实现前述的基于持续学习的多类别多尺度目标拣选方法。

本发明的有益效果是:本发明提出基于弹性加权的数据重放持续学习方法,通过生成对抗网络实现新旧任务特征的隐藏空间表示,从而建立知识记忆存储仓库,使用自适应知识迁移调度模块实现多任务拣选的快速切换,加速新任务的训练过程,结合正则化技术量化模型参数的重要程度,防止关键参数在训练过程中被覆盖。将数据重放框架用于智能零件拣选系统,能够克服在多类型多尺度目标拣选模型持续学习过程中出现的功能灾难性遗忘问题,确保拣选模型功能的完整性,实现目标与场景可以动态变化的持续性学习,帮助系统协调高效地解决多任务拣选问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明的原理示意图;

图2为本发明的效果示意图;

图3为本发明的方法流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提出基于弹性加权的数据重放持续学习方法,该方法能够有效地解决拣选系统对多类别多尺度目标持续训练过程中出现的灾难性功能遗忘,并根据先验知识和新任务之间的相似性,加速模型在新任务上的训练速度。结合正则化和自适应模型扩张技术,在限制模型参数更新方向的同时保证拣选系统的任务容量,确保系统能够高效完成多类别多尺度的目标拣选任务。

一、基于弹性加权的数据重放持续学习技术

本发明提出的基于弹性加权的数据重放持续学习框架,如图1所示。该学习框架包括三个模块,即数据重现模块、正则化模块和动态模型容量扩充模块。

持续学习有助于系统实现动态拓展和记忆功能,帮助系统大幅提高其在视觉与智能控制应用中的工作效率,并解决新任务训练导致的灾难性遗忘问题,而解决灾难性遗忘问题的核心是对原任务重要参数的保存,在保证效率的前提下使参数训练过程尽可能的具有全局特征匹配的特性。除此之外,持续学习仍需要针对新任务训练造成的信息损失给予相应补偿,所以基于弹性加权的数据重放持续学习架构利用生成模型的特征表达能力,把旧有数据的重要特征表示作为新任务训练时的数据补充,从而有效避免任务间的灾难性遗忘问题。因此,本发明将采用数据重放技术和模型参数正则化方法来应对当前智能拣选控制系统无法自适应地处理多种任务以及所出现的功能遗忘问题,并以现实工业级应用为研究目标,搭建高效的智能视觉零件拣选系统,建立多任务目标拣选模型的持续学习机制来有效应对复杂多变环境下多类别、多尺寸零部件的智能拣选。

(1)数据重放模块

具体来讲,数据重现模块利用生成模型对输入数据的编码表示能力,构建高效的知识记忆存储功能,根据生成模型对全局数据的隐空间特征表示,实现对多类别多目标零件拣选任务的持续学习。生成模型能够再现全局数据的特征分布,帮助模型有效避免传统学习系统中的知识遗忘问题,有利于新任务训练过程的快速收敛,使学习系统能够识别不同任务特征的同时,又具有匹配全局分布的高质量特征表示能力。数据重放架构的目标是尽可能多地从以往多个任务的迁移知识中学习经验,使之对于新任务具有最好的泛化能力。进而通过系统对全局数据分布的记忆存储,帮助模型准确定位不同任务的特征空间,训练并得到原有功能和新任务的联合数据表示,从而有效避免任务间的灾难性遗忘问题。

数据重现模块的损失函数J

通过使用旧有模型参数θ

(2)正则化学习模块

本发明将从数据重放的生成对抗网络与控制系统模型的级联学习模式作为基础架构,这种架构在新任务训练的过程中结合参数正则化约束的方法,使生成模型更好地维持原有功能的关键参数,避免生成模型训练过程中对旧有任务的信息损失,杜绝重要参数及梯度在新任务训练过程中过量变化,同时更新冗余的参数以适应新任务的功能需求,确保系统训练前后模型功能的稳定性。正则化加权约束项J

(3)动态模型容量扩充模块

同之前模块不同,模型容量损失函数J

J

当新任务与已学习的功能相似时,生成模型知识选择的协调器将改变学习模式,使其输出的特征空间表示偏向于特定的功能知识先验,并将其作为新任务训练过程的数据补充。通过以上三个模块在训练过程中共同协作,实现对旧有功能的高效记忆存储,加速系统在新任务上的训练速度,保证模型中旧有功能的知识先验被有效利用,参数更新的泛化能力更强大,这些模块可以协调地在新任务训练过程中高质量工作,最终实现具有知识存储和功能可塑性的持续学习智能视觉零件拣选系统。

二、拣选系统的持续学习效果

目前主流的神经网络模型只能局限于特定任务的有效训练和学习,一旦训练新任务时模型会出现对旧有功能的灾难性遗忘,原系统中的重要参数将被大面积覆盖,因而现有零件拣选系统一般不具有在旧有功能基础上持续学习的能力。然而,实际应用中随着任务量的增加,会产生模型容量不足的问题,从而导致系统知识存储效率和工作能力大幅下降,且重复训练模型造成的资源消耗大幅限制着系统的工作能力,所以智能拣选系统的持续学习方法便成为本发明中需要重点研究的关键技术问题。

本发明将改进基于深度神经网络的持续学习方法,以实现智能视觉零件拣选系统对持续学习任务的快速适应机制,要求不仅能够有效利用过往已有学习模型来快速优化新任务的学习系统,而且能够实现对过往任务的知识记忆存储与表示。针对零件拣选控制系统任务的持续学习问题,探究基于正则化约束的数据重放算法,通过基于数据重放的持续学习架构增强生成对抗网络对全局数据分布的表征能力,进而实现智能拣选系统对多类别多尺寸目标下复杂任务的持续学习。

如图2所示,智能拣选模型随着任务量的增加,新任务i首先通过功能协调模块寻找模型已习得的功能中相似的类型,并将其作为新任务训练过程中重要的先验知识补充。旧有功能在训练过程中通过数据重现中的记忆存储模块得到隐藏空间的特征表示,结合新任务中的数据共同作为智能拣选模型的输入。为了保证模型训练高效进行,本发明采用基于弹性加权的正则化技术避免参数更新对旧有功能的破坏,保存维持旧有功能的关键参数,并结合动态模型容量扩张模块使模型容量和逐渐增长的任务量相匹配,避免模型容量不足所导致的系统功能损失,最终使得机械臂拣选系统能够快速适应新任务学习和对旧功能的存储与自动调度,实现整个系统对多种环境下多类别多尺度零部件的自适应高效智能拣选。

三、持续学习方法技术路线

本发明针对多类别多尺度目标拣选问题提出了基于弹性加权的数据重放持续学习方法,该学习的技术路线主要包括三个关键模块,即数据重现模块、正则化模块和动态模型扩张算法模块。

如图3所示,训练任务通过数据重现模块中的记忆协调器寻找相似类型的知识先验,训练数据重放模型从而快速得到全局数据特征的隐藏空间表示。然后,根据全局特征数据训练正则化拣选模型,通过Fisher信息矩阵为训练模型参数加权,限制梯度和层间通路的大幅变化;在拣选模型训练的同时,其模型容量需不断适应任务量的增加和任务难度的变化,针对这一问题,本系统通过进化算法和神经网络架构搜索实现模型训练过程中结构自适应扩张,帮助拣选模型更有效的工作,准确的实现多类别多尺度目标拣选系统的持续学习。

附图中的流程图和框图显示了根据本发明的多个实施例的方法、装置和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图和框图中的每个方框可以代表一个模块、程序段或代码的一部分,包含一个或多个用于实现逻辑功能的计算机可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。也要注意的是,框图和流程图中的每个方框或方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明,上述实施例仅是为说明所作的举例,而并非对实施方式的限定。对于本领域技术人员来说,在上述说明的基础上,还可以做出其它不同形式的变化或变动,而这些变化或变动将是显而易见的,处于本发明的保护范围之中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号