首页> 中国专利> 基于集群及H264的视频浓缩算法的海量视频摘要生成方法

基于集群及H264的视频浓缩算法的海量视频摘要生成方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于集群及H264的视频浓缩算法的海量视频摘要生成方法，包括如下步骤：①选取原始视频，并对其进行切割，得到n个长度近似相等的片段，编码格式为H264，其中n为自然数；②对切割后的各片段进行视频解码，根据运动估计以及背景图来获取前景目标，并通过基于稀疏光流的误报删除及漏检修复算法，对各片段的检测率进行完善，并更新背景图；③将单个包含运动信息的片段视作浓缩单元，进行压缩，压缩完成后进行拼接，生成一段完整的视频摘要。

著录项

公开/公告号CN105357594A

专利类型发明专利
公开/公告日2016-02-24

原文格式PDF
申请/专利权人南京云创大数据科技股份有限公司;
展开▼

申请/专利号CN201510802199.4
发明设计人张真;刘鹏;杨雪松;曹骝;秦恩泉;
展开▼

申请日2015-11-19
分类号H04N21/845(20110101);H04N21/8549(20110101);
代理机构32256 南京利丰知识产权代理事务所(特殊普通合伙);
代理人任立
地址 210000 江苏省南京市秦淮区永智路6号南京白下高新技术产业园区四号楼A栋9层
入库时间 2023-12-18 14:30:45

法律信息

法律状态公告日

法律状态信息

法律状态
2022-12-09

专利权质押合同登记的生效 IPC(主分类):H04N21/845 专利号:ZL2015108021994 登记号:Y2022980022505 登记生效日:20221121 出质人:南京云创大数据科技股份有限公司质权人:江苏银行股份有限公司南京分行发明名称:基于集群及H264的视频浓缩算法的海量视频摘要生成方法申请日:20151119 授权公告日:20180831

专利权质押合同登记的生效、变更及注销
2018-08-31

授权

授权
2016-03-23

实质审查的生效 IPC(主分类):H04N21/845 申请日:20151119

实质审查的生效
2016-02-24

公开

公开

说明书

技术领域

本发明属于海量视频数据浓缩技术领域，特别是一种基于集群及H264的视频浓缩算法的海量视频摘要生成方法。

背景技术

众所周知，视频监控系统正渗入到社会的各种场合之中，并在许多行业如安防、交通、工业生产等环境下发挥着越来越重要的作用；随着监控摄像头的数量快速地增长，每天海量的视频数据也随之产生，目前大多是以人工方式浏览这些视频，并提取其中有意义的信息。

一方面，视频越多，所需要的人员也越多；另一方面，人工处理效率也会因为越来越多的数据变得低下，处理结果难免有所遗漏或出现差错；然而，其处理成本相当可观；视频摘要技术应运而生，其能够自动地保留有意义视频数据，舍去无用信息，这样人工只需浏览有意义的数据，成本得到有效降低。

视频摘要又称视频浓缩，该技术的处理过程通常是：首先通过背景建模，获取前景物体；随后使用跟踪算法，保存运动轨迹；最后将物体的轨迹按照某种方式组合，并复制到背景图像中，形成浓缩视频；然而，现有的视频浓缩技术浓缩后的视频长度一般远小于原视频，如果有一段时长为10小时的高清视频，通常的背景建模算法，如GMM，其运行速度约等于实时播放速度，倘若要浏览整个浓缩后的视频，同样要消耗10小时，效率却没有大幅提升。

发明内容

本发明所要解决的技术问题是，克服现有技术的缺点，提供一种基于集群及H264的视频浓缩算法的海量视频摘要生成方法。

为了解决以上技术问题，本发明提供一种基于集群及H264的视频浓缩算法的海量视频摘要生成方法，包括如下步骤：

①选取原始视频，并对其进行切割，得到n个长度近似相等的片段，编码格式为H264，其中 n为自然数；

②对切割后的各片段进行视频解码，根据运动估计以及背景图来获取前景目标，并通过基于稀疏光流的误报删除及漏检修复算法，对各片段的检测率进行完善，并更新背景图；

③将单个包含运动信息的片段视作浓缩单元，进行压缩，压缩完成后进行拼接，生成一段完整的视频摘要。

本发明进一步限定的技术方案是：

进一步的，前述的基于集群及H264的视频浓缩算法的海量视频摘要生成方法，所述n个长度近似相等的片段为并行的进行步骤②及步骤③中的浓缩操作，相互独立。

前述的基于集群及H264的视频浓缩算法的海量视频摘要生成方法，所述步骤①具体包括如下处理：

假设原始视频第i帧为用户设定的视频切割点，定义帧范围F∈[ik×fi+k×f]，k为迭代次数，f为常数，在此范围内查找图像j，使得第j帧内无前景目标，且|ij|为最小；

在范围[ik×fi+k×f]内找到连续m帧的运动估计的数值若小于阈值Tmv，则认为无前景目标，如果这m帧图像皆为背景图，这样获得了一幅背景图，若F中无背景图，k＝k+1，转到步骤①；若第j帧为背景图(j∈[ik×fi+k×f])，计算|ij|并且使|ij|最小，则j为视频的切割点，退出循环；

所述步骤②具体包括如下处理：

若运动估计数值小于阈值Tmv，则认为无前景目标，如果连续多帧无前景目标，这样获得了一幅背景图；对于P帧或B帧，首先判断当前帧中的运动估计是否大于阈值Tmv，若大于Tmv，则将当前图像及背景图两者灰度化并对应像素相减，相减后的绝对值若大于某阈值Tdiff则赋为 255，否则赋为0，这样就得到一幅二值图像M；若运动估计小于Tmv，则不作任何处理，进入到下一帧继续计算；对于I帧，以同样的方法计算当前图像与背景图的差异值M；

去除噪声及目标提取，首先将二值图像M作闭运算，随后提取每个物体最外层的轮廓，用外接矩形表示其大小及位置；若矩形的长、宽都大于阈值Tlen，则认为是一个前景目标，否则被视为噪声；

目标跟踪，计算当前帧每个目标与下一帧每个目标两两之间的矩形重合度，若某目标与下一帧的最大重合度大于阈值Toverlap，则认为这两个矩形是同一个目标，跟踪成功；若跟踪失败，且物体已运动到图像边界附近，则物体在下一帧已移出视野(或感兴趣区域)，无需跟踪；

去除误报及修复漏检，若某目标在下一帧未跟踪成功，则认为发生了漏检；对于漏检，首先计算矩形内的harris角点，若某harris角点在二值图M中对应的像素为0，则剔除该角点，其次利用光流法对所有角点进行跟踪，计算角点在水平及垂直方向的平均位移dx和dy，将当前目标在水平和水质方向分别平移dx和dy个像素，作为下一帧的位置；如果某目标连续多帧发生了漏检，且连续漏检帧数大于Tm，则认为该目标是一个误报，将其删除；

背景图像Bg的更新，在以上处理步骤执行之后，确定图像中哪些区域属于前景，哪些属于背景，背景更新只针对那些非目标区域内的点，具体步骤是，若当前帧Fcur的某像素pxl不在任一目标矩形内，则该背景像素被替换为对应坐标的Fcur与Bg的均值；保存检测到的前景物体坐标、大小、子图像以及运动片段信息；

所述步骤③的包括如下具体处理：

(1)基于H264的背景建模，保存检测到的前景物体坐标、大小、子图像以及运动片段的起始帧、结束帧等信息；若内存中片段数目累计到Tsec或者已到达视频最后一帧且片段数大于 1，则转到步骤(2)；若到达最后一帧且片段数为0，则退出程序；

(2)将第一个片段加入到集合A并将该片段第一帧内所有目标图像复制到背景图；

(3)依次判断剩余的片段与集合A中的片段在物体平均、最大重合度两方面是否满足用户设定的值，若满足，则把该片段加入集合A；

(4)将集合A中所有片段对应帧号内的目标图像复制到背景图；若某个片段已复制完最后一帧，将其从集合A中删除；若集合A中所有片段都已复制完且无剩余片段，转到步骤(1)，否则进入下一帧，转到步骤(3)。

本发明的有益效果是：

1.本发明所设计的基于集群及H264的视频浓缩算法的海量视频摘要生成方法利用并行处理的方式，大幅提高了视频浓缩的效率；

2.本发明所设计的基于集群及H264的视频浓缩算法的海量视频摘要生成方法能够解决由漏检、物体粘连引起的两类屏幕闪烁问题。

附图说明

图1为本发明中基于集群的视频摘要生成方法的总流程图；

图2为本发明中基于集群的视频摘要生成方法的详细流程图；

图3为本发明中基于集群的视频摘要生成方法的硬件装置示意图；

图4为本发明中基于集群的视频摘要生成方法的运动片段浓缩示意图；

图5为本发明中浓缩总时间与并行处理的进程数目之间的变化关系图。

具体实施方式

如图1-图4所示，本实施例提供的一种基于集群及H264的视频浓缩算法的海量视频摘要生成方法，包括如下步骤：

①选取原始视频，并对其进行切割，得到n个长度近似相等的片段，编码格式为H264，其中 n为自然数；

③将单个包含运动信息的片段视作浓缩单元，进行压缩，压缩完成后进行拼接，生成一段完整的视频摘要；所述n个长度近似相等的片段为并行的进行步骤②及步骤③中的浓缩操作，相互独立。

所述步骤①具体包括如下处理：

所述步骤②具体包括如下处理：

所述步骤③的包括如下具体处理：

(2)第一个片段加入到集合A并将该片段第一帧内所有目标图像复制到背景图；

(3)依次判断剩余的片段与集合A中的片段在物体平均、最大重合度两方面是否满足用户设定的值，若满足，则把该片段加入集合A；

在实际的试验中，选用一段时长为8分钟的监控视频，分辨率1280×720，分别用混合Gauss 背景建模、vibe背景建模以及本发明的建模算法(视频切割成5段，每一段用一个独立的进程来浓缩)，本发明的总耗时包括以下几类：1、视频切割时间；2、每段视频浓缩时间；3、浓缩后拼接每段视频所耗时间,性能对比见表1；

表1

GMM建模 Vibe建模本发明算法平均每帧耗时 41.46ms 22.45ms 12.24ms 总耗时 550.66s 316.44s 47.82s

由表1能够看出，采用办发明所设计的基于集群及H264的视频浓缩算法的海量视频摘要生成方法与现有技术相比，能够大大提高效率达100％以上；图5是选用100分钟时长的视频进行浓缩，浓缩总时间与并行处理的进程数目之间的变化关系。

以上实施例仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于集群及H264的视频浓缩算法的海量视频摘要生成方法 [P] . 中国专利： CN105357594B . 2018.08.31
2. 基于集群及H264的视频浓缩算法的海量视频摘要生成方法 [P] . 中国专利： CN105357594A . 2016-02-24
3. MULTI-MODAL BASED VIDEO ABSTRACT GENERATION METHOD AND APPARATUS THEREOF [P] . 日本专利： JP2007143114A . 2007-06-07

机译：基于多模态的视频摘要生成方法及其装置
4. METHOD AND APPARATUS FOR GENERATING VIDEO ABSTRACT INFORMATION AT HIGH SPEED ON BASED MULTI-MODAL [P] . 韩国专利： KR100650407B1 . 2006-11-21

机译：基于多模态的视频摘要信息的高速生成方法和装置
5. METHOD AND APPARATUS FOR GENERATING VIDEO ABSTRACT INFORMATION AT HIGH SPEED ON BASED MULTI-MODAL [P] . 韩国专利： KR100650407B1 . 2006-11-29

机译：基于多模态的视频摘要信息的高速生成方法和装置