首页> 中国专利> 一种基于视觉注意模型的图像文字描述方法

一种基于视觉注意模型的图像文字描述方法

摘要

本发明中提出的一种基于视觉注意模型的图像文字描述方法,其主要内容包括:数据输入、预处理、自适应注意模型、图像字幕输出,其过程为,首先它采用描述人执行各种动作和在复杂场景的上下文中包含多个对象的图像数据集,每个图像配对5个人工标注的字幕;然后预处理缩短字幕长度,将数据集输入到编码器中提取空间图像特征;最后反馈给训练好的基于视觉哨兵门的自适应空间注意模型,让机器执行自动生成图像字幕的任务,得到图像对应的自然语言描述结果。本发明在图像识别方面,比起基于模板的方法,其表现性能最优;它还可以帮助视觉受损的用户,并使用户易于组织和导航大量典型非结构化的视觉数据。

著录项

  • 公开/公告号CN106778926A

    专利类型发明专利

  • 公开/公告日2017-05-31

    原文格式PDF

  • 申请/专利权人 深圳市唯特视科技有限公司;

    申请/专利号CN201611207945.6

  • 发明设计人 夏春秋;

    申请日2016-12-23

  • 分类号G06K9/66(20060101);G06N3/08(20060101);

  • 代理机构

  • 代理人

  • 地址 518057 广东省深圳市高新技术产业园区高新南一道009号中科研发园新产业孵化中心楼610室

  • 入库时间 2023-06-19 02:19:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-08-27

    发明专利申请公布后的撤回 IPC(主分类):G06K9/66 申请公布日:20170531 申请日:20161223

    发明专利申请公布后的撤回

  • 2017-06-23

    实质审查的生效 IPC(主分类):G06K9/66 申请日:20161223

    实质审查的生效

  • 2017-05-31

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号