公开/公告号CN105049678A
专利类型发明专利
公开/公告日2015-11-11
原文格式PDF
申请/专利权人 成都鹰眼视觉科技有限公司;
申请/专利号CN201510504730.X
发明设计人 陶科锐;
申请日2015-08-17
分类号H04N5/14(20060101);H04N5/21(20060101);
代理机构成都顶峰专利事务所(普通合伙);
代理人杨俊华
地址 610000 四川省成都市天府新区华阳街道天府大道南段846号
入库时间 2023-12-18 12:06:53
法律状态公告日
法律状态信息
法律状态
2022-07-29
未缴年费专利权终止 IPC(主分类):H04N 5/14 专利号:ZL201510504730X 申请日:20150817 授权公告日:20180803
专利权的终止
2018-08-03
授权
授权
2015-12-09
实质审查的生效 IPC(主分类):H04N5/14 申请日:20150817
实质审查的生效
2015-11-11
公开
公开
背景技术
本发明涉及移动端设备拍摄的图像处理方法,具体的说,是涉及一种移动 端拍摄的视频的防抖方法。
技术领域
移动端拍摄的视频,因为拍摄过程中摄像头在晃动,不规律的晃动会照成 拍摄出的画面晃动,从而降低视频的观看质量,因此,为了提供移动端拍摄视频 的观看质量,视频防抖处理显得尤为重要。
视频防抖致力于降低视频拍摄过程中的抖动,产生出稳定的视频,从而提 升视频的观看质量。现有的视频防抖方法大致可以分为三个模块,运动估计模 块,路径优化模块和视频渲染模块。其中,运动估计模块致力于利用各种各样 的形式来表征相机的原始运动,常用的方法包括块匹配法,特征点法,三维重 建法;路径优化模块致力于将相机从原始抖动运动变换出稳定的相机运动,常 用的方法有低通滤波器,运动矢量平滑;视频渲染模块将原始视频中的每一帧 从抖动的原始运动路径变换到稳定的相机路径上,从而产生出稳定的视频效果, 常用的方法有基于单个单应性变换方法和基于块单应性变换方法。
然而,移动端拍摄出的视频内容多种多样,视频的运动形式亦多种多样: 内容可涵盖白天、夜晚、室内、室外、开阔空旷、人海嘈杂;视频运动形式涵 盖普通走路拍摄、机载快速运动拍摄、户外运动拍摄、视频焦距拉长缩短、视 频快速转场。视频拍摄内容与视频运动形式的多样性,对视频防抖中的三个模 块均造成不同程度的影响,导致稳定的视频产生失真现象(视频帧出现扭曲或 视频内容留存度过小)。
具体来讲,在运动估计模块,块匹配法和特征点法在场景过于单一或过于 复杂的情况下,精度会受到一定的影响,不准确的运动估计会对之后的两个模 块带来影响,从而导致稳定效果下降,严重的情况还会引起视频帧的扭曲失真。 三维重建的方法因为依赖对场景的三维重建,消耗大量的计算资源和时间,且 容易出错产生错误的重建结果,因此缺乏实用性。在路径优化模块中,低通滤 波和运动矢量平滑可以有效去除相机抖动中的高频分量,却很难有效去除掉相 机运动中的一些低频率运动分量,其中高频分量对应着相机的颤抖,低频分量 对应着相机平滑的晃动。如若强行去除相机的晃动,则会对渲染模块带来困扰。 在快速运动的场景中,去除相机的晃动会使得最终渲染出的结果视频内容留存 度过小,影响观看效果。
发明内容
为了克服上述问题,本发明提供一种基于绕环自适应相机路径优化的视频 防抖方法。
为了实现上述目的,本发明采用的技术方案如下:
一种基于绕环自适应相机路径优化的视频防抖方法,包括以下步骤:
步骤1.通过相邻帧特征点匹配和相邻帧块搜索共同作用,估算出相邻帧间 基于单应性变换的帧间运动模型;
步骤2.对抖动帧的帧间运动模型进行高斯平滑,得到稳定帧的帧间运动模 型;
步骤3.对平滑后的帧作扭曲度检测,对平滑后的帧作留存度检测;
步骤4.相机路径绕环;
步骤5.重复步骤2到步骤4直到去除掉视频中的高频分量和低频分量;
步骤6.通过图像变换渲染出最终稳定视频。
进一步的,所述步骤1的具体方式如下:
(11)对帧间进行运动估计,采用单应性变换作为帧间运动模型,以描述 相邻帧间的运动
式中,(x′,y′,z′)表示变换后的坐标,对应着当前帧的前一帧中图像点的 位置,(x,y)表示变换前的坐标,对应着当前帧图形点的位置,单应性变换矩阵 中a,b,d,e表征图像的旋转,缩放,g,h表征图形的透视变换,c,f表征图像的平移 变换;
(12)通过公式A={(x′,y′)-(x,y)},估算出前一帧和后一帧中对应点对 位置,进而估算出帧间运动模型中的各个参数的值。
进一步的,所述步骤(12)的具体方式如下:
(121)通过图像的特征点匹配,获取初始的点对集合,基于单应性变换模 型并利用RANSAC,剔除掉匹配错误的点对,最后形成的第一批点对集合记为A1;
(122)对图像分块,将图像分成大小均等的16x16的区域块,同时将视频中 的每一帧转换为灰度图像,算出每一块内灰度图像的方差值,并留下方差值大 于指定阀值的区块;
(123)块匹配:对留下的每一个区块,在前一帧灰度图像内容中搜索对应 的最匹配的区块,通过块匹配,收集到了第二批点对集合,记录为A2;
(124)将两组点对集合组合成一对点对集,记为A=A1∪A2;
(125)通过最小二乘法,将两组点对写入如下公式:
利用最小二乘法求解获得帧间运动模型中的各个参数。
进一步的,所述步骤2的具体方式如下:从第0时刻开始,一直到视频结 束,每两帧之间算出一个Ft,将两两帧之间的Ft依次级联起来获得抖动帧帧间运 动模型的串集合:
F={F0,F0F1,…F0F1..Ft-1Ft}
对集合中的每一个元素作平滑操作,获得稳定帧帧间运动模型的集合:
H={H0,H0H1,…H0H1..Ht-1Ht}。
进一步的,所述步骤4中相机路径绕环通过绕环公式:
进行多次平滑操作,直到消除视频中存在的低频分量为止;其中,用式(3) 算出的Ht,替换原始路径中的Ft即可实施下一次的平滑操作,Bt表示每一个时 刻t帧由抖动变为稳定的变换矩阵,其亦为一个单应性变换运动模型。其中, Ht指每两帧之间F平滑操作后得到的稳定帧的帧间运动模型。
进一步的,所述步骤3中对变换矩阵Bt作分析,获得视频帧扭曲度的客观 反映值:
取变换矩阵Bt左上角四个元素,组成一个小的4x4矩阵
对变换矩阵Bt作分析,获得帧内容的留存度:通过对帧内图像的4个角点进行 单应性变换,获得4个新角点,然后根据4个新角点可以获得一个新的四边形, 在新的四边形中寻找最大内切矩形,计算出最大内切矩形占原始矩形的面积比 例,记为π。原始的4个角点为图片的4个顶点,如图3中左边部分所示,为矩 形的4个角,每一个角点可写成[x,y,1]的形式,然后利用Bt依据公式(1) 进行变换,
进一步的,在每次平滑操作的过程中,观察κ与π的值,当κ<0.9,或者κ> 1.1,或者π<0.8的时候,即将该帧对应的变换矩阵Bt减半,减半方式为Bt= Bt+I,其中I表示单位矩阵。
需要说明的是,本申请文件中的“相机”是指具有拍摄功能的设备,如: 智能手机、平板电脑等,而不是特指传统的相机。
本发明与现有技术相比,具有以下优点:
本发明通过对传统的运动估计进行优化,并通过绕环的方式,建立了一套 可自适应视频扭曲度与视频内容留存度的路径优化方法,在减小视频帧扭曲并 克服视频内容留存度过小问题的同时,有效抑制视频中的低频分量,从而提升 视频的稳定度,能很好地应对场景变换与相机运动变换。
附图说明
图1为本发明-实施例中初始的相机运动位置和稳定后相机的运动位置之间 的关系图。
图2为本发明-实施例中低通高斯滤波示意图。
图3为本发明-实施例中帧内容的留存度计算示意图。
图4为本发明的流程示意图。
具体实施方式
实施例
如图4所示,本实施例提供了一种基于绕环自适应相机路径优化的视频防 抖方法,该方法由三个部分组成:(1)运动估计模块;(2)路径优化模块;(3) 视频渲染模块。
运动估计模块利用单应性变换(Homography)作为基础,并对估计单应性 变换的过程进行了改进,有效的提高了运动估计的准确性。通过运动估计得到 帧间运动模型,具体如下:
1.运动估计,对帧间进行运动估计,采用单应性变换作为帧间运动模型, 以描述相邻帧间的运动。可描述的运动类型包括:旋转,平移,缩放和透视变 换,帧间运动模型如下:
其中,(x′,y′,z′)表示变换后的坐标,对应着当前帧的前一帧中图像点的 位置。(x,y)表示变换前的坐标,对应着当前帧图形点的位置。具体来讲,变换 后的真实X-Y坐标为:其中,单应性变换矩阵中待确定的参数为 a,b,c,d,e,f,g,h.其中,a,b,d,e表征图像的旋转,缩放;g,h表征图形的透视变 换;c,f表征图像的平移变换;
2.通过估算出前一帧和后一帧中对应点对位置,A={(x′,y′)-(x,y)},进而 估算出单应性变换中的各个参数的值,获取点对的位置包括以下步骤:
(a)通过图像的特征点匹配,获取初始的点对集合,基于单应性变换模型并 利用RANSAC,剔除掉匹配错误的点对,最后形成的第一批点对集合记为A1;
(b)对图像作分块,将图像分成大小均等的16x16的区域块,同时将视频中的 每一帧转换为灰度图像,算出每一块内,灰度图像的方差值,留下方差值 大于指定阀值的区块。
(c)对留下的每一个区块,在前一帧灰度图像内容中搜索对应的最匹配的区 块。最匹配的条件利用MAD(MeanAbsoluteDifference)作为准则,即平 均绝对差。原区块中心点记为(x,y),搜索半径记为r=16,即搜索区 域为原区块位置周围区域:(x-r,y-r)~(x+r,y+r)。在搜索过程中发 现的最优位置,对应最小的MAD值,记录为(x′,y′)。这样通过块匹配,收 集到了第二批点对集合,记录为A2。
(d)将两组点对集合组合成一对点对集,记为A=A1∪A2
(e)通过最小二乘法,将两组点对写入如下公式:
其中,A中每一组点对,可以写出上述两行等式,将A中所有点对写成公式 即可获得一个超定的线性方程组。利用最小二乘法求解可获得帧间运动单应性 变换参数。获取的帧间单应性变换运动模型,为当前帧往前一帧上运算所获得。 若当前帧时刻为t,前一帧时刻为t-1,记单应性变换运动模型为Ft。
从第0时刻开始,一直到视频结束,每两帧之间都可以算出一个Ft,将两两 帧之间的Ft依次级联起来可以获得一个串集合:F={F0,F0F1,…F0F1..Ft-1Ft}。
路径优化模块是基于绕环自适应的相机路径优化方法,其中,绕环是指在 路径优化中,初始抖动路径和优化路径之间,相邻帧间存在着一个级联式的环, 通过绕环的方式可迭代式的优化相机路径,从而有效的去除相机路径中留存的 低频分量;自适应是指,在相机路径绕环优化的过程中,自动检测出不能进行 绕环的位置,从而避免因过渡优化带来的视频内容留存度过小的问题。通过在 绕环的过程中,将代表帧间运动的单应性变换设置为基础矩阵(Identity Matrix),绕环优化过程中亦可以将运动估计不准确的部分,还原为原始视频帧, 即将不能做路径优化的部分不做路径优化,部分结果变为原始的视频帧,或者 接近原始视频帧的位置,从而有效减小结果中的视频帧扭曲。自适应的绕环路 径优化可在减小视频帧扭曲并克服视频内容留存度过小问题的同时,有效抑制 视频中的低频分量,从而提升视频的稳定度。
本实施例中,路径优化的具体内容如下:
对串集合:F={F0,F0F1,…F0F1..Ft-1Ft}中的每一个元素作平滑操作,可以 获得一个新的集合:H={H0,H0H1,…H0H1..Ht-1Ht}。如图1所示,展示了初始 的相机运动位置和稳定后相机的运动位置之间的关系图,第一排为原始抖动帧, 帧间的运动由单应性变换模型Ft表示,第二排表示优化中或优化后的稳定帧,帧 间的运动由单应性变换模型Ht表示。每一个时刻t,帧由抖动位置(第一排)变 换到稳定位置(第二排)的变换矩阵表示为Bt,该变换矩阵Bt也是一个单应性变 换。
在平滑的过程中,对帧间运动模型矩阵中的相应位置作低通高斯滤波。具 体为:矩阵中的每一个位置作低通滤波,如图2所示,每一个九宫格表示一个单 应性变换矩阵Ft,将每一个对应格子里的值,连成一个串,组成一个信号,如左 上角信号可表征为a0a1a2…at,除右下角为1外,共可获得8个有效信号。对8个 信号,分别独立的作平滑操作可获得平滑信号,平滑核心采用普通的高斯核心, 记为G,将这一平滑过程记录为:平滑之后可以获得每一帧对应的变换 矩阵Bt,进而算出稳定位置的变换Ht。
一次平滑操可以有效的去除掉视频中的高频分量,但却很难有效的去除掉 视频中的低频分量,因此需要多次滤波。这里涉及到一个绕环操作,即将Ht通 过Ft与Bt和Bt-1,表示出来。具体来说,绕环公式为:用绕环公式算出的H,替换原始路径中的F,就可以实施下一次的 平滑操作,直到消除视频中存在的低频分量为止。
在绕环计算中,还应当对平滑后的帧作扭曲度检测,对平滑后的帧作留存 度检测,具体如下:
1、对变换矩阵Bt作分析,可以获得视频帧扭曲量的客观反映值。变换矩阵 Bt亦为一个单应性变换,取其左上角四个元素,组成一个小的4x4矩阵
2、对变换矩阵Bt作分析,还可以获得该帧内容的留存度。如图3所示,通 过对4个角点进行单应性变换,可以获得一个新的四边形,在新四边形中寻找 最大内切矩形,虚线表示。可计算出最大内切矩形占原始矩形的面积比例,记 为π。
在每次平滑的过程中,观察κ与π的值,当κ<0.9或者κ>1.1或者π<0.8 的时候,即将该帧对应的转换矩阵Bt减半,减半方式为Bt=Bt+I,其中I表示 单位矩阵,数值表示停止条件。直到所有帧的Bt对应的κ与π均满足第14条的条 件,结束运算。
运用减半的Bt将视频中的输入帧变换到稳定的位置上,采用的变换方式为 基于单应性变换的图像坐标变换(Imagewarping)。完成路径优化后,最后通 过图像变换渲染出最终稳定视频。
按照上述实施例,便可很好地实现本发明。值得说明的是,在上述技术方 案的前提下,为解决同样的技术问题,即使在本发明上做出一些无实质性的改 动或润色,所采用的技术方案的实质仍然与本发明一样,故其也应当在本发明 的保护范围内。
机译: 防抖装置,电子设备,相机防抖方法以及相机防抖程序
机译: 视频防抖方法及视频防抖装置
机译: 视频防抖方法及视频防抖装置