首页> 中国专利> 基于深度神经网络对图像语义进行理解和问答的方法

基于深度神经网络对图像语义进行理解和问答的方法

摘要

本发明提供了一种基于深度神经网络对图像语义进行理解和问答的方法包括:根据已有图像数据集,使用带动态参数层的卷积神经网络提取给定图像特征信息,然后在知识库中对图像进行信息检索获取给定图像的外部知识;对检索到的外部知识使用Doc2Vec进行编码转换成固定大小的向量形式;将需要提出的问题和图像检索信息联合,作为输入放到神经网络的门控循环单元GRU中进行训练;把训练得到的候选权重通过hashing转换映射到卷积神经网络的动态参数层;在全连接层后添加一个分类层得到各种问答的答案,并将分类精度作为评价准则;基于多种实验基准,再使用WUPS评价准则进行评估,得到最终的图像问答结果。

著录项

  • 公开/公告号CN109740012A

    专利类型发明专利

  • 公开/公告日2019-05-10

    原文格式PDF

  • 申请/专利权人 南京理工大学;

    申请/专利号CN201811535632.2

  • 发明设计人 唐金辉;胡俊;

    申请日2018-12-14

  • 分类号G06F16/583(20190101);G06K9/62(20060101);

  • 代理机构32203 南京理工大学专利中心;

  • 代理人朱宝庆

  • 地址 210094 江苏省南京市孝陵卫200号

  • 入库时间 2024-02-19 09:57:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-04

    实质审查的生效 IPC(主分类):G06F16/583 申请日:20181214

    实质审查的生效

  • 2019-05-10

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号