首页> 中国专利> 代表性图结构模型、视觉理解模型的建立方法及应用

代表性图结构模型、视觉理解模型的建立方法及应用

摘要

本发明公开了一种代表性图结构模型、视觉理解模型的建立方法及应用,属于视觉理解领域,包括:建立代表性图结构模型;代表性图结构模型包括:特征映射模块,用于从输入特征图像中提取值分支、键值分支和序列分支,并生成偏移矩阵;采样模块,用于根据偏移矩阵对值分支和键值分支中的节点(像素或图像栅格)采样,得到代表性特征;长距离依赖信息捕获模块,用于对键值分支的代表性特征与序列分支进行矩阵乘法后进行Softmax操作,得到关系矩阵,并对值分支的代表性特征与关系矩阵进行矩阵乘法,得到长距离依赖矩阵;以及特征反映射模块,用于将长距离依赖信息编码到输入特征图像中。本发明能够学习到更精炼的长距离依赖信息,提高视觉理解任务的准确度。

著录项

  • 公开/公告号CN111985542A

    专利类型发明专利

  • 公开/公告日2020-11-24

    原文格式PDF

  • 申请/专利权人 华中科技大学;

    申请/专利号CN202010778717.4

  • 发明设计人 吴东岳;余昌黔;高常鑫;桑农;

    申请日2020-08-05

  • 分类号G06K9/62(20060101);G06K9/46(20060101);G06N3/04(20060101);

  • 代理机构42201 华中科技大学专利中心;

  • 代理人李智

  • 地址 430074 湖北省武汉市洪山区珞喻路1037号

  • 入库时间 2023-06-19 08:04:59

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-12

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号