融合场景因素的视频内容理解模型

彭玉青; 刘璇; 王纬华; 赵晓松; 魏铭

首页> 中文期刊> 《中国科技论文》 >融合场景因素的视频内容理解模型

融合场景因素的视频内容理解模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

提出了一种融合场景因素的视频内容理解模型,首先通过ResNet提取全局特征,并结合迁移学习的Places365-CNNs提取深度场景特征;然后经由多层感知器生成相应的场景向量,并将其作为LSTM网络结构的输入,对视频中图像及其描述语句进行编码-解码处理;最后通过MSCOCO数据集预训练,为视频中的关键帧生成准确、具体的描述语句,使观众了解视频详细内容。将所提出模型在Flickr8K、Flickr30K和MSCOCO数据集以及视频《第三极》中进行训练和测试,并且使用不同的评估方法进行验证,结果表明输出语句对视频的描述较为准确,所提模型与其他现有模型相比性能有所提高。

著录项

来源
《中国科技论文》 |2018年第14期|P.1584-1589|共6页
作者
彭玉青; 刘璇; 王纬华; 赵晓松; 魏铭;
展开▼
作者单位

[1]河北工业大学人工智能与数据科学学院;

天津300401;

[2]河北工业大学河北省大数据计算重点实验室;

天津300401;

[1]河北工业大学人工智能与数据科学学院;

天津300401;

[2]河北工业大学河北省大数据计算重点实验室;

天津300401;

[1]河北工业大学人工智能与数据科学学院;

天津300401;

[2]河北工业大学河北省大数据计算重点实验室;

天津300401;

[1]河北工业大学人工智能与数据科学学院;

天津300401;

[2]河北工业大学河北省大数据计算重点实验室;

天津300401;

[1]河北工业大学人工智能与数据科学学院;

天津300401;

[2]河北工业大学河北省大数据计算重点实验室;

天津300401;

展开▼
原文格式 PDF
正文语种 CHI
中图分类信息处理（信息加工）;
关键词
视频内容理解; 深度神经网络; 语义信息; 卷积神经网络; 循环神经网络;

相似文献

中文文献
外文文献
专利

1. 融合场景因素的视频内容理解模型 [J] . 彭玉青 ,刘璇 ,王纬华 . 中国科技论文 . 2018,第014期
2. 内容、故事、场景:短视频的内容营销探究 [J] . 尚婵媛 . 新闻研究导刊 . 2019,第006期
3. 论移动视觉场景下短视频传播场景的高互动融合 [J] . 王婷婷 . 科技传播 . 2020,第005期
4. 融合内容特征和时序信息的深度注意力视频流行度预测模型 [J] . 武维 ,李泽平 ,杨华蔚 . 计算机应用 . 2021,第007期
5. 智媒时代高新视频冬奥赛事应用场景探究——以5G高新视频体育融合创新应用国家广播电视总局实验室实践为例 [J] . 解植岗 . 广播电视信息 . 2021,第012期
6. 基于视频的静态场景与运动物体快速三维构建与融合 [C] . WANG Lin ,王淋 ,HE Kun-Jin . 第十届中国计算机图形学大会暨第十八届全国计算机辅助设计与图形学会会议 . 2014
7. 基于短视频内容理解的用户偏好预测模型研究 [A] . Author Name . 2020

融合场景因素的视频内容理解模型

摘要

著录项

相似文献

相关主题

期刊订阅