基于粗粒度和多模态特征的视频分割算法及其应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着当前互联网技术和多媒体技术地迅猛发展，网络视频信息呈现出爆炸式增长的形势，如何有效而且自动化地对视频数据进行浏览、管理和检索已然成为目前计算机视觉领域中的研究重点。视频分割是指在时域上将一个视频拆分成多个语义片段，这些语义片段通常来说，是根据用户意图来定义的某些特定概念或主题。视频分割的意义在于可以通过将视频划分为多个独立的语义单元来对需要处理的视频构建目录，实现对视频地快速浏览，以及找到视频中内容单元的边界。然而现有的视频分割方法仍存在无法自动适应场景粒度，分割效率低下等问题。　　针对现有视频分割方法的场景概念依赖于人为判断，镜头的平移缩放难以处理，聚类算法需要阈值等问题，本文提出了基于粗粒度特征的用户引导的视频场景分割算法。算法包括特征提取阶段和场景分割阶段。在特征提取阶段中，对视频进行粗粒度特征提取，节省了时间开销和计算开销。在场景分割阶段中，提出了计算帧间相似距离的算子，用来解决镜头移动问题。提出了根据用户需求计算聚类半径的半径回归算法，用来解决场景概念依赖人为判断和聚类算法需要阈值的问题。除此之外，还提出了时域均值聚类算法和多级聚类算法。　　针对目前新闻节目种类多，数据量大，媒体从业人员对新闻视频进行手动分割效率低下等问题，本文提出了一种采用VGG网络进行特征提取，采用孪生网络进行分类判断的新闻拆条算法。该算法包含视频多模态特征提取，视频候选分割点预测和候选分割点判定三个阶段。在视频多模态特征提取阶段，将视频的字幕信息、音频特征和视频特征综合起来分析。在视频候选分割点预测阶段，利用静音帧的性质对新闻视频进行候选分割点的预测。在最后的候选分割点判定阶段，利用孪生网络进行相似度检测，利用特征自提取后的特征向量进行相似度度量，分辨出真实的分割点。　　实验表明，本文所提出的视频场景分割算法的平均F值为0.72，在不需要精确分割或需要根据用户意图快速迭代分割的情况下，所提出的视频场景分割是一种更经济、更有前景的方法。所提出的新闻视频自动拆条算法准确度为92%，能够成为媒体从业人员进行新闻拆条的重要辅助工具。

著录项

作者
彭馨慧;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科计算机技术
授予学位硕士
导师姓名李蕊,唐涛;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
视频分割,深度学习,聚类算法,粗粒度,多模态特征;

相似文献

中文文献
外文文献
专利

1. 基于深度网络的多模态视频场景分割算法 [J] . 苏筱涵 ,丰洪才 ,吴诗尧 . 武汉理工大学学报（信息与管理工程版） . 2020,第003期
2. 基于遗传算法的多模态视频场景分割算法 [J] . 赵杰雪 ,丰洪才 ,杨琳 . 武汉理工大学学报（信息与管理工程版） . 2015,第006期
3. 基于多模态融合和竞争力的视频场景分割算法 [J] . 杨亭 ,丰洪才 ,金凯 . 武汉理工大学学报（信息与管理工程版） . 2014,第006期
4. 基于镜头竞争力的多模态视频场景分割算法 [J] . 向云柱 . 计算机与数字工程 . 2014,第002期
5. 一种多模态融合新闻视频条目分割算法 [J] . 王国营 ,寇红召 ,李涛 . 计算机工程与科学 . 2011,第006期
6. 一种基于DC缩略图颜色特征的压缩域视频镜头分割算法 [C] . 郑金龙 ,张明新 ,赵彩云 . 2010年全国模式识别学术会议（CCPR2010) . 2010
7. 基于特征融合的图像和视频前景分割算法研究 [A] . 潘家兴 . 2020

基于粗粒度和多模态特征的视频分割算法及其应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅