首页> 中国专利> 一种基于非对齐多视图特征增强的图像描述方法

一种基于非对齐多视图特征增强的图像描述方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于非对齐多视图特征增强的图像描述方法。本发明包括以下步骤：1、对图像和以其自然语言描述的文本进行数据预处理，2、基于非对齐多视图特征增强的注意力编码模型，进行各视图中的目标视觉特征进行重构。3、基于MHA的深度描述解码器。4、模型训练，利用反向传播算法训练神经网络参数。本发明提出一种针对图像描述的深度神经网络，特别是提出一种对图像‑描述文本的数据进行统一建模，在图像中各非对齐视图目标特征上进行推理，对各目标的视觉特征进行重构从而更精确地对图像进行描述的方法，并且在图像描述领域中的获得较好效果。

著录项

公开/公告号CN110516530A

专利类型发明专利
公开/公告日2019-11-29

原文格式PDF
申请/专利权人杭州电子科技大学;
展开▼

申请/专利号CN201910615360.5
发明设计人俞俊;余宙;李敬;
展开▼

申请日2019-07-09
分类号
代理机构杭州君度专利代理事务所(特殊普通合伙);
代理人朱月芬
地址 310018 浙江省杭州市下沙高教园区2号大街
入库时间 2024-02-19 15:57:53

法律信息

法律状态公告日

法律状态信息

法律状态
2019-12-24

实质审查的生效 IPC(主分类):G06K9/00 申请日:20190709

实质审查的生效
2019-11-29

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于非对齐多视图特征增强的图像描述方法 [P] . 中国专利： CN110516530A . 2019-11-29
2. 一种基于Gabor综合特征的图像特征描述方法 [P] . 中国专利： CN104834909B . 2018.09.21
3. Extracting texture feature values of an image as texture descriptor in a texture description method and a texture-based retrieval method in frequency domain [P] . 美国专利： US6803919B1 . 2004-10-12

机译：在频域中的纹理描述方法和基于纹理的检索方法中提取图像的纹理特征值作为纹理描述符
4. System and Method for Interactive Image-based Modeling of Curved Surfaces Using Single-view and Multi-view Feature Curves [P] . 美国专利： US2013127847A1 . 2013-05-23

机译：基于单视图和多视图特征曲线的交互式基于图像的曲面建模系统和方法
5. System and method for interactive image-based modeling of curved surfaces using single-view and multi-view feature curves [P] . 美国专利： US8711143B2 . 2014-04-29

机译：使用单视图和多视图特征曲线的基于交互式图像的曲面建模的系统和方法