首页> 中国专利> 一种基于多目标群体智能算法的神经架构搜索方法及用途

一种基于多目标群体智能算法的神经架构搜索方法及用途

摘要

本发明属于自然语言处理领域,涉及一种基于多目标群体智能算法的神经架构搜索方法及用途,包括以下步骤:1)获得评估神经网络架构翻译质量的数据集;2)在搜索空间内,初始化一个种群;3)将若干不同尺寸,并改善计算交叉多头注意力方式的Transformer模型个体,加入步骤2)得到的初始化种群;4)在若干评估机器翻译质量的指标下,使用多目标群体智能算法,对神经网络架构进行搜索。实现了较少的时间确定最适用于特定数据特性的神经网络架构,用更少的参数数量获得了更优的翻译质量,可部署在移动设备等内存资源相对紧缺的应用场景上。本发明提供的方法可用于司法、旅游、电商、电游、社交、金融等技术领域。

著录项

  • 公开/公告号CN115130483A

    专利类型发明专利

  • 公开/公告日2022-09-30

    原文格式PDF

  • 申请/专利权人 湘潭大学;

    申请/专利号CN202210828231.6

  • 发明设计人 唐欢容;欧阳建权;王上;

    申请日2022-07-13

  • 分类号G06F40/58;G06N3/04;G06N3/08;

  • 代理机构北京卓恒知识产权代理事务所(特殊普通合伙);

  • 代理人徐楼;龙世和

  • 地址 410205 湖南省湘潭市湘潭大学

  • 入库时间 2023-06-19 17:01:21

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-30

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号