首页> 中国专利> 一种基于多模态注意力的图像标题自动生成方法

一种基于多模态注意力的图像标题自动生成方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明属于计算机视觉与自然语言处理的交叉技术领域，提出了一种基于多模态注意力的图像标题自动生成方法，用以解决传统的基于神经网络的方法在预测单词过程中视觉特征和语言特征的对齐问题以及忽略句子特征的问题，提高了模型的收敛速度与图像标题的质量。本方法首先利用卷积神经网络自动地对图像区域进行特征提取；然后利用带视觉注意力的LSTM实现了句子特征的提取；最后设计了一种带多模态注意力(视觉注意力和隐变量注意力)的LSTM产生最终的图像标题。实验证明所提方法在MS COCO等基准数据集上取得了很好的结果。

著录项

公开/公告号CN108829677A

专利类型发明专利
公开/公告日2018-11-16

原文格式PDF
申请/专利权人大连理工大学;
展开▼

申请/专利号CN201810602775.4
发明设计人葛宏伟;闫泽杭;
展开▼

申请日2018-06-05
分类号G06F17/27(20060101);G06N3/04(20060101);
代理机构21200 大连理工大学专利中心;
代理人温福雪;侯明远
地址 116024 辽宁省大连市甘井子区凌工路2号
入库时间 2023-06-19 07:15:35

法律信息

法律状态公告日

法律状态信息

法律状态
2018-12-11

实质审查的生效 IPC(主分类):G06F17/27 申请日:20180605

实质审查的生效
2018-11-16

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于多模态注意力的图像标题自动生成方法 [P] . 中国专利： CN108829677B . 2021.05.07
2. 一种基于多模态注意力机制的医学图像报告自动生成方法 [P] . 中国专利： CN113035311A . 2021-06-25
3. Method and apparatus for automatically generating headlines based on data retrieved from a network and for answering questions related to a headline [P] . 美国专利： US8429148B1 . 2013-04-23

机译：用于基于从网络检索的数据自动生成标题并回答与标题相关的问题的方法和装置
4. ELECTRONIC DEVICE BASED ON ATTENTION RECURRENT NEURAL NETWORK USING MULTIMODAL DATA AND OPERATION METHOD THEREOF [P] . 世界知识产权组织专利： WO2020196976A1 . 2020-10-01

机译：基于多模态数据的注意力递归神经网络的电子设备及其操作方法
5. (54) Title: METHOD OF IMPROVING PRINT PERFORMANCE IN FLEXOGRAPHIC PRINTING PLATES (57) Abstract: A method of making a relief image printing element from a photosensitive printing blank is provided. A photosen¬sitive printing blank with a laser ablatable layer disposed on at least one photocurable layer is ablated with a laser to create an hi situ mask. The printing blank is then exposed to at least one source of actinic radiation through the in situ mask to selectively cross link and cure portions of the photocurable layer. Diffusion of air into the at least one photocurable layer Is limited during the exposing step and preferably at least one of the type, power and incident angle of iLLumination of the at least one source of actinic radiation is altered during the exposure step. The resulting relief image comprises aplurality of dots and a dot shape of the plurali¬ty of dots is produced that is highly resistant to print fluting for printing on corrugated board. [P] . IN2012CN02098A . 2012-11-02

机译：（54）标题：改善柔性版印刷板的印刷性能的方法（57）摘要：提供了一种由感光印刷坯料制造浮雕图像印刷元件的方法。用激光烧蚀具有设置在至少一个光可固化层上的激光可烧蚀层的光敏印刷坯料，以形成原位掩模。然后通过原位掩模使印刷坯料暴露于至少一种光化辐射源，以选择性地交联和固化可光固化层的部分。空气在至少一个光固化层中的扩散在曝光步骤中受到限制，并且优选在曝光步骤中改变至少一种光化辐射源的光的类型，功率和入射角中的至少一种。所得的浮雕图像包括多个点，并且产生了多个点的点形状，该点形状高度耐受用于在瓦楞纸板上印刷的印刷槽纹。