基于空时变换网络的视频摘要生成

李群; 肖甫; 张子屹; 张锋; 李延超

首页> 中文期刊> 《软件学报》 >基于空时变换网络的视频摘要生成

基于空时变换网络的视频摘要生成

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

生成是计算机视觉领域必不可少的关键任务,这一任务的目标是通过选择视频内容中信息最丰富的部分来生成一段简洁又完整的视频摘要,从而对视频内容进行总结.所生成的视频摘要通常为一组有代表性的视频帧(如视频关键帧)或按时间顺序将关键视频片段缝合所形成的一个较短的视频.虽然视频摘要生成方法的研究已经取得了相当大的进展,但现有的方法存在缺乏时序信息和特征表示不完备的问题,很容易影响视频摘要的正确性和完整性.为了解决视频摘要生成问题,提出一种空时变换网络模型,该模型包括3大模块,分别为:嵌入层、特征变换与融合层、输出层.其中,嵌入层可同时嵌入空间特征和时序特征,特征变换与融合层可实现多模态特征的变换和融合,最后输出层通过分段预测和关键镜头选择完成视频摘要的生成.通过空间特征和时序特征的分别嵌入,以弥补现有模型对时序信息表示的不足;通过多模态特征的变换和融合,以解决特征表示不完备的问题.在两个基准数据集上做了充分的实验和分析,验证了所提模型的有效性.

著录项

来源
《软件学报》 |2022年第9期|3195-3209|共15页
作者
李群; 肖甫; 张子屹; 张锋; 李延超;
展开▼
作者单位

南京邮电大学计算机学院、软件学院、网络空间安全学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
视频摘要生成; 空时变换网络; ViLBERT; 特征融合; 多模态;

相似文献

中文文献
外文文献
专利

1. 基于改进的双向长短期记忆网络的视频摘要生成模型 [J] . 武光利 ,李雷霆 ,郭振洲 . 计算机应用 . 2021,第7期
2. 基于时-空特征的全卷积网络用于视频人眼关注预测的研究 [J] . 史久琛 ,孙美君 ,王征 . 天津大学学报 . 2019,第010期
3. 基于视频分段的空时双通道卷积神经网络的行为识别 [J] . 王萍 ,庞文浩 . 计算机应用 . 2019,第7期
4. 时／空变换网络集成电路MT8980 [J] . 周淑华 . 电信技术 . 1991,第008期
5. 一种基于K-L变换和聚类的视频摘要方法 [J] . 王毅 ,李弼程 . 计算机应用研究 . 2010,第009期
6. 基于AP聚类和频繁模式挖掘的视频摘要生成方法 [C] . Gu Zheng ,顾诤 ,Xiao Ruogui . 第六届智能CAD与数字娱乐学术会议 . 2009
7. 基于GRU网络的视频摘要生成技术研究 [A] . 陈周元 . 2021

基于空时变换网络的视频摘要生成

摘要

著录项

相似文献

相关主题

期刊订阅