基于多语义线索的跨模态视频检索算法

丁洛; 李逸凡; 于成龙; 刘洋; 王轩; 漆舒汉

首页> 中文期刊> 《北京航空航天大学学报》 >基于多语义线索的跨模态视频检索算法

基于多语义线索的跨模态视频检索算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对现有的大多数跨模态视频检索算法忽略了数据中丰富的语义线索,使得生成特征的表现能力较差的问题,设计了一种基于多语义线索的跨模态视频检索模型,该模型通过多头目自注意力机制捕捉视频模态内部对语义起到重要作用的数据帧,有选择性地关注视频数据的重要信息,获取数据的全局特征;采用双向门控循环单元(GRU)捕捉多模态数据内部上下文之间的交互特征;通过对局部数据之间的细微差别进行联合编码挖掘出视频和文本数据中的局部信息.通过数据的全局特征、上下文交互特征和局部特征构成多模态数据的多语义线索,更好地挖掘数据中的语义信息,进而提高检索效果.在此基础上,提出了一种改进的三元组距离度量损失函数,采用了基于相似性排序的困难负样本挖掘方法,提升了跨模态特征的学习效果.在MSR-VTT数据集上的实验表明:与当前最先进的方法比较,所提算法在文本检索视频任务上提高了11.1％;在MSVD数据集上的实验表明:与当前先进的方法比较,所提算法在文本检索视频任务上总召回率提高了5.0％.

著录项

来源
《北京航空航天大学学报》 |2021年第3期|596-604|共9页
作者
丁洛; 李逸凡; 于成龙; 刘洋; 王轩; 漆舒汉;
展开▼
作者单位

哈尔滨工业大学(深圳)计算机科学与技术学院深圳 518055;

哈尔滨工业大学(深圳)计算机科学与技术学院深圳 518055;

深圳信息职业技术学院数字媒体学院深圳 518172;

哈尔滨工业大学(深圳)计算机科学与技术学院深圳 518055;

哈尔滨工业大学(深圳)计算机科学与技术学院深圳 518055;

鹏城实验室深圳 518055;

哈尔滨工业大学(深圳)计算机科学与技术学院深圳 518055;

鹏城实验室深圳 518055;

展开▼
原文格式 PDF
正文语种 chi
中图分类模式识别与装置;
关键词
跨模态视频检索; 多语义线索; 多头目注意力机制; 距离度量损失函数; 多模态;

相似文献

中文文献
外文文献
专利

1. 基于多级语义的判别式跨模态哈希检索算法 [J] . 刘芳名 ,张鸿 . 计算机应用 . 2021,第008期
2. 基于概念的视频检索中概念语义匹配算法研究 [J] . 张皓翔 ,尚麟宇 . 泰山学院学报 . 2011,第006期
3. 基于跨模态语义增强的图像检索方法 [J] . 王琪 ,王睿 ,王力 . 南阳理工学院学报 . 2021,第002期
4. 基于语义相似性的跨模态图文内容筛选存储机制研究 [J] . 刘渝 ,郭婵 ,冯树耀 . 计算机研究与发展 . 2021,第002期
5. 基于语义相似性的跨模态图文内容筛选存储机制研究 [J] . 刘渝 ,郭婵 ,冯树耀 . 计算机研究与发展 . 2021,第002期
6. 基于语义的视频检索结果重排算法研究 [C] . SANG Miaojie ,桑苗杰 ,JIA Kebin . 第九届全国信号和智能信息处理与应用学术会议 . 2015
7. 基于矩阵分解和语义关联的跨模态哈希检索算法研究 [A] . 刘志虎 . 2021

基于多语义线索的跨模态视频检索算法

摘要

著录项

相似文献

相关主题

期刊订阅