首页> 中国专利> 一种基于分工决策的视觉问答模型的视觉问答方法及系统

一种基于分工决策的视觉问答模型的视觉问答方法及系统

摘要

本发明属于图像问答领域,具体涉及一种基于分工决策的视觉问答模型的视觉问答方法及系统,该方法包括:获取视觉图像和待回答的问题,将视觉图像和待回答的问题输入到LRBNet模型中,得到问答结果;LRBNet模型包括视觉理解模块、文本理解模块以及交换模块;所述视觉理解模块用于得到视觉特征图,所述文本理解模块用于得到文本特征图,所述交换模块用于对视觉特征图和文本特征图进行数据交互,根据交互数据更新节点;视觉空间特征图和文本语义信息进行关联和更新,得到最终的问答结果;本发明将文本语义信息和视觉空间信息分离处理,只在最后将处理的结果融合,降低了其他VQA模型因跨模态融合而提高的推理难度。

著录项

  • 公开/公告号CN114283292A

    专利类型发明专利

  • 公开/公告日2022-04-05

    原文格式PDF

  • 申请/专利权人 重庆邮电大学;

    申请/专利号CN202111483361.2

  • 发明设计人 丰江帆;刘睿国;龙仁华;易成杰;

    申请日2021-12-07

  • 分类号G06V10/44(20220101);G06V10/74(20220101);G06V10/80(20220101);G06V10/774(20220101);G06K9/62(20220101);G06V30/148(20220101);G06F40/30(20200101);

  • 代理机构50215 重庆辉腾律师事务所;

  • 代理人卢胜斌

  • 地址 400065 重庆市南岸区南山街道崇文路2号

  • 入库时间 2023-06-19 14:45:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-05

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号