首页> 中国专利> 一种基于视觉注意模型的图像文字描述方法

一种基于视觉注意模型的图像文字描述方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明中提出的一种基于视觉注意模型的图像文字描述方法，其主要内容包括：数据输入、预处理、自适应注意模型、图像字幕输出，其过程为，首先它采用描述人执行各种动作和在复杂场景的上下文中包含多个对象的图像数据集，每个图像配对5个人工标注的字幕；然后预处理缩短字幕长度，将数据集输入到编码器中提取空间图像特征；最后反馈给训练好的基于视觉哨兵门的自适应空间注意模型，让机器执行自动生成图像字幕的任务，得到图像对应的自然语言描述结果。本发明在图像识别方面，比起基于模板的方法，其表现性能最优；它还可以帮助视觉受损的用户，并使用户易于组织和导航大量典型非结构化的视觉数据。

著录项

公开/公告号CN106778926A

专利类型发明专利
公开/公告日2017-05-31

原文格式PDF
申请/专利权人深圳市唯特视科技有限公司;
展开▼

申请/专利号CN201611207945.6
发明设计人夏春秋;
展开▼

申请日2016-12-23
分类号G06K9/66(20060101);G06N3/08(20060101);
代理机构
代理人
地址 518057 广东省深圳市高新技术产业园区高新南一道009号中科研发园新产业孵化中心楼610室
入库时间 2023-06-19 02:19:08

法律信息

法律状态公告日

法律状态信息

法律状态
2019-08-27

发明专利申请公布后的撤回 IPC(主分类):G06K9/66 申请公布日:20170531 申请日:20161223

发明专利申请公布后的撤回
2017-06-23

实质审查的生效 IPC(主分类):G06K9/66 申请日:20161223

实质审查的生效
2017-05-31

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于视觉注意模型的图像文字描述方法 [P] . 中国专利： CN106778926A . 2017-05-31
2. 一种基于多尺度视觉词包模型的商品图像特征描述方法 [P] . 中国专利： CN112966715A . 2021-06-15
3. IMAGE CONTENT AUTOMATIC DESCRIPTION METHOD BASED ON CONSTRUCTION OF CHINESE VISUAL VOCABULARY LIST [P] . WO2021223323A1 . 2021-11-11

机译：基于汉语视觉词汇表的图像内容自动描述方法
4. APPARATUSES AND METHODS FOR MACHINE VISION SYSTEMS INCLUDING CREATION OF A POINT CLOUD MODEL AND/OR THREE DIMENSIONAL MODEL BASED ON MULTIPLE IMAGES FROM DIFFERENT PERSPECTIVES AND COMBINATION OF DEPTH CUES FROM CAMERA MOTION AND DEFOCUS WITH VARIOUS APPLICATIONS INCLUDING NAVIGATION SYSTEMS, AND PATTERN MATCHING SYSTEMS AS WELL AS ESTIMATING RELATIVE BLUR BETWEEN IMAGES FOR USE IN DEPTH FROM DEFOCUS OR AUTOFOCUSING APPLICATIONS [P] . 美国专利： US2019122378A1 . 2019-04-25

机译：机器视觉系统的装置和方法，包括建立点云模型和/或三维模型，该模型基于不同角度的多个图像并结合了来自摄像机运动和深度的深度信息以及包含导航系统的各种应用程序，包括导航系统估计深度模糊或自动对焦应用中使用的图像之间的相对模糊
5. AUTOMATIC CLASSIFICATION APPARATUS AND METHOD OF DOCUMENT TYPE BASED ON VISUAL ATTENTION MODEL IMPLEMENTED BY DEEP LEARNINIG AND CHARACTER RECOGNITION [P] . 韩国专利： KR102063036B1 . 2020-01-07

机译：基于深度学习和角色识别实现的视觉注意模型的文档类型自动分类装置和方法