基于多模态输入的对抗式视频生成方法

于海涛; 杨小汕; 徐常胜

首页> 中文期刊>计算机研究与发展 >基于多模态输入的对抗式视频生成方法

基于多模态输入的对抗式视频生成方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

视频生成是计算机视觉和多媒体领域一个重要而又具有挑战性的任务.现有的基于对抗生成网络的视频生成方法通常缺乏一种有效可控的连贯视频生成方式.提出一种新的多模态条件式视频生成模型.该模型使用图片和文本作为输入,通过文本特征编码网络和运动特征解码网络得到视频的运动信息,并结合输入图片生成连贯的运动视频序列.此外,该方法通过对输入图片进行仿射变换来预测视频帧,使得生成模型更加可控、生成结果更加鲁棒.在SBMG(single-digit bouncing MNIST gifs),TBMG (two digit bouncing MNIST gifs)和KTH(kungliga tekniska h(o)gskolan human actions)数据集上的实验结果表明:相较于现有的视频生成方法,生成结果在目标清晰度和视频连贯性方面都具有更好的效果.另外定性评估和定量评估(SSIM(structural similarity index)与PSNR(peak signal to noise ratio)指标)表明提出的多模态视频帧生成网络在视频生成中起到了关键作用.

著录项

来源
《计算机研究与发展》|2020年第7期|1522-1530|共9页
作者
于海涛; 杨小汕; 徐常胜;
展开▼
作者单位

合肥工业大学计算机与信息学院合肥230031;

模式识别国家重点实验室(中国科学院自动化研究所) 北京 100190;

合肥工业大学计算机与信息学院合肥230031;

模式识别国家重点实验室(中国科学院自动化研究所) 北京 100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
深度学习; 视频生成; 视频预测; 卷积神经网络; 生成对抗网络;
入库时间 2022-08-19 04:29:25

相似文献

中文文献
外文文献
专利

1. 基于生成式对抗网络的通用性对抗扰动生成方法 [J] . 刘恒 ,吴德鑫 ,徐剑 . 信息网络安全 . 2020,第005期
2. 基于生成式对抗网络的拟态蜜罐特征生成方法 [J] . 刘祎豪 . 计算机与现代化 . 2021,第007期
3. Mask-2-Human:基于生成式对抗网络的人物图像生成方法 [J] . 欧阳雯琪 ,徐昆 . 中国科技论文 . 2019,第003期
4. Mask-2-Human:基于生成式对抗网络的人物图像生成方法 [J] . 欧阳雯琪1 ,徐昆1 . 中国科技论文 . 2019,第003期
5. 基于条件生成对抗网络的空气预热器内红外补光监测视频图像清晰化方法 [J] . 刘君 ,邓毅 ,杨延西 . 热力发电 . 2021,第010期
6. 基于生成式对抗网络的文本生成研究 [C] . 代威 ,陈博 ,熊振 . 辽宁省通信学会2019年度学术年会 . 2019
7. 基于生成式对抗学习的单一与多模态图像转换 [A] . 韩毓璇 . 2019

基于多模态输入的对抗式视频生成方法

摘要

著录项

相似文献

相关主题

期刊订阅