针对长视频问答的深度记忆融合模型

孙广路; 吴猛; 邱景; 梁丽丽

首页> 中文期刊> 《哈尔滨理工大学学报》 >针对长视频问答的深度记忆融合模型

针对长视频问答的深度记忆融合模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

长视频问答包含丰富的多模态语义信息和推理信息.当前,基于循环神经网络的视频问答模型难以充分保存重要记忆信息、忽略无关冗余信息和实现记忆信息高效融合.针对该问题,依据记忆网络思想,提出一种深度记忆融合模型.本模型利用记忆网络的记忆组件有效保存视频剪辑及其字幕的融合特征,提出一种多模态相似性匹配方法过滤冗余记忆信息.经过卷积网络的初步融合和注意力机制的二次融合,生成整个视频的上下文表示,并进行答案生成.本模型在长视频剪辑MovieQA数据集上进行实验,平均准确率为39.78％,相较传统方法提升近10％且比当前最先进方法提升近5％,准确率提升明显,模型泛化性能好.

著录项

来源
《哈尔滨理工大学学报》 |2021年第1期|1-8|共8页
作者
孙广路; 吴猛; 邱景; 梁丽丽;
展开▼
作者单位

哈尔滨理工大学计算机科学与技术学院哈尔滨150080;

哈尔滨理工大学计算机科学与技术学院哈尔滨150080;

哈尔滨理工大学计算机科学与技术学院哈尔滨150080;

哈尔滨理工大学计算机科学与技术学院哈尔滨150080;

展开▼
原文格式 PDF
正文语种 chi
中图分类检索机;
关键词
视频问答; 长视频理解; 记忆网络; 注意力机制; 多模态融合;

相似文献

中文文献
外文文献
专利

1. 融合内容特征和时序信息的深度注意力视频流行度预测模型 [J] . 武维 ,李泽平 ,杨华蔚 . 计算机应用 . 2021,第007期
2. 基于深度双向模型和特征融合的视频转文字研究 [J] . 宁培阳 ,史景伦 ,张荣锋 . 计算机应用研究 . 2020,第001期
3. 深度分层融合超像素分割的深度视频去噪算法 [J] . 韩丰泽 ,董文帅 ,张维忠 . 青岛大学学报（工程技术版） . 2020,第001期
4. 微博台网短视频联盟在沪成立深度融合短视频产业链 [J] . . 影视制作 . 2017,第10期
5. 增强融合深度实现校企双赢--对话校企合作企业昊华骏化董事长汤广斌、置地集团董事长李万顺 [J] . . 决策探索 . 2015,第007期
6. 针对快速视频检索的DCT域内基于高斯模型的视频镜头内容代表 [C] . 蔡骋 ,谈正 . 第十二届全国图象图形学学术会议 . 2005
7. 基于深度记忆融合方法的视频问答研究 [A] . 吴猛 . 2021

针对长视频问答的深度记忆融合模型

摘要

著录项

相似文献

相关主题

期刊订阅