基于注意力机制的细粒度语义关联视频-文本跨模态实体分辨

曾志贤; 曹建军; 翁年凤; 蒋国权; 徐滨

首页> 中文期刊>计算机科学 >基于注意力机制的细粒度语义关联视频-文本跨模态实体分辨

基于注意力机制的细粒度语义关联视频-文本跨模态实体分辨

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着移动网络、自媒体平台的迅速发展,大量的视频和文本信息不断涌现,这给视频-文本数据跨模态实体分辨带来了迫切的现实需求。为提高视频-文本跨模态实体分辨的性能,提出了一种基于注意力机制的细粒度语义关联视频-文本跨模态实体分辨模型(Fine-grained Semantic Association Video-Text Cross-Model Entity Resolution Model Based on Attention Mechanism,FSAAM)。对于视频中的每一帧,利用图像特征提取网络特征信息,并将其作为特征表示,然后通过全连接网络进行微调,将每一帧映射到共同空间;同时,利用词嵌入的方法对文本描述中的词进行向量化处理,通过双向递归神经网络将其映射到共同空间。在此基础上,提出了一种自适应细粒度视频-文本语义关联方法,该方法计算文本描述中的每个词与视频帧的相似度,利用注意力机制进行加权求和,得出视频帧与文本的语义相似度,并过滤与文本语义相似度较低的帧,提高了模型性能。FSAAM主要解决了文本描述的词与视频帧关联程度不同而导致视频-文本跨模态数据语义关联难以构建以及视频冗余帧的问题,在MSR-VTT和VATEX数据集上进行了实验,实验结果验证了所提方法的优越性。

著录项

来源
《计算机科学》|2022年第7期|106-112|共7页
作者
曾志贤; 曹建军; 翁年凤; 蒋国权; 徐滨;
展开▼
作者单位

中国人民解放军国防科技大学第六十三研究所;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
跨模态实体分辨; 共同空间; 注意力机制; 细粒度; 语义相似度; 特征提取;
入库时间 2022-09-28 18:50:43

相似文献

中文文献
外文文献
专利

1. 结合关键帧提取的视频-文本跨模态实体分辨双重编码方法 [J] . 曾志贤 ,曹建军 ,翁年凤 . 兵工学报 . 2022,第5期
2. 一种新的基于注意力机制的细粒度视频分析神经网络结构 [J] . 李麟 ,孙康博 ,朱杰 . 上海师范大学学报（自然科学版） . 2019,第004期
3. 基于堆叠交叉注意力的图像文本跨模态匹配方法 [J] . 王红斌 ,张志亮 ,李华锋 . 信号处理 . 2022,第2期
4. 基于结构保持对抗网络的跨模态实体分辨 [J] . 吕国俊 ,曹建军 ,郑奇斌 . 南京大学学报：自然科学版 . 2020,第2期
5. 学术文本中细粒度知识实体的关联分析 [J] . 章成志 ,谢雨欣 ,宋云天 . 图书馆论坛 . 2021,第3期
6. 基于注意力GRU模型的高分辨率遥感图像语义描述 [C] . Xue Qiao ,乔雪 ,Zhoujun Xu . 第五届高分辨率对地观测学术年会 . 2018
7. 基于跨模态相关语义及注意力机制的图像-文本互译方法 [A] . 田明 . 2020

基于注意力机制的细粒度语义关联视频-文本跨模态实体分辨

摘要

著录项

相似文献

相关主题

期刊订阅