首页> 中国专利> 确定图像相似度的方法、视频场景切换识别方法及装置

确定图像相似度的方法、视频场景切换识别方法及装置

摘要

本发明实施例提供了一种确定图像相似度的方法、视频场景切换识别方法及装置,其中,所述确定图像相似度的方法包括:将获取的视频数据中的本帧图像的第一特征点集,与对比帧图像的第二特征点集之间相匹配的特征点,作为关联特征点对集;获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度;基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度;关联特征点对集的相似度分别与关联特征点对集的数量呈正相关,与关联特征点对集的欧式距离呈负相关;将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。

著录项

  • 公开/公告号CN109447023A

    专利类型发明专利

  • 公开/公告日2019-03-08

    原文格式PDF

  • 申请/专利权人 北京奇艺世纪科技有限公司;

    申请/专利号CN201811327209.3

  • 发明设计人 刘思阳;

    申请日2018-11-08

  • 分类号G06K9/00(20060101);G06K9/62(20060101);

  • 代理机构11413 北京柏杉松知识产权代理事务所(普通合伙);

  • 代理人丁芸;项京

  • 地址 100080 北京市海淀区海淀北一街2号鸿城拓展大厦10、11层

  • 入库时间 2024-02-19 07:20:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-03

    授权

    授权

  • 2019-04-02

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20181108

    实质审查的生效

  • 2019-03-08

    公开

    公开

说明书

技术领域

本发明涉及视频处理技术领域,特别是涉及一种确定图像相似度的方法、视频场景切换识别方法及装置。

背景技术

随着多媒体信息数据的发展,目前影视剧等视频数据在制作过程中,会将不同场景的不同摄影角度的视频片段进行组合,运用不同镜头语言表达不同的情绪和传递多样关系。在制作过程中,往往需要对不同场景的视频片段进行分割,对不同场景的视频片段配置不同的颜色修复参数,比如,在老电影的修复项目中需要对不同场景的视频片段配置不同的颜色修复参数,这样就需要识别出视频的场景切换。

目前相关技术中的确定图像相似度的方法,主要步骤包括:通过将视频数据相邻两帧图像进行整帧比较,如果相邻两视频帧的场景变化率超过预设阈值,则认为视频场景切换。比如,某发言人在户外发言,期间发言人不变,但是由于在户外,有不停走动的人群及车辆等变化因素,这样移动的背景会不断变化,相邻两视频帧的场景变化率可能很高,相当于与发言人不相干的变化因素,对视频场景切换造成较大的影响。而实际上发言人的场景并没有变化,因此,在识别视频场景切换过程中,使用这些与发言人不相干的变化因素增大场景变化率,使得相邻两视频帧的场景变化率与实际场景的场景变化率存在较大差异。

发明内容

本发明实施例的目的在于提供一种确定图像相似度的方法、视频场景切换识别方法及装置,用以解决现有技术中相邻两视频帧的场景变化率与实际场景的场景变化率存在较大差异的技术问题。具体技术方案如下:

第一方面,本发明实施提供了一种确定图像相似度的方法,所述方法包括:

获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;

获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;

基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;

将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。

进一步的,所述获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,包括:

对所述本帧图像进行均匀区块划分,得到两个以上第一区块;

对所述第一区块进行特征提取,得到所述第一区块中的特征点集;

将所述第一区块中的特征点集作为第一特征点集;

对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;

对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;

将所述各第一区块对应的第二区块的特征点集作为第二特征点集;

将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;

将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。

进一步的,所述基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,包括:

基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。

进一步的,所述预设相似度计算公式为

式中,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度,所述为映射函数,所述映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示所述关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,所述l表示所述关联特征点对集的总数,P表示所述关联特征点对集,A表示由本帧图像生成的numpy矩阵中的第一区块,B表示由对比帧图像生成的numpy矩阵中的第二区块,表示所述本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,所述x表示特征点的水平坐标,所述y表示特征点的垂直坐标,(x,y)表示关联特征点对集中的任一关联特征点对,所述i表示行的序号,表示的取值范围为并且i取的值,不取的值,j表示列的序号,表示的取值范围为并且j取的值,不取的值,所述h为图像的高,所述w为图像的宽,所述h为图像的横向划分个数,所述wb为图像的纵向划分个数,所述Aij表示由所述本帧图像生成的numpy矩阵中第i行j列的第一区块,所述Bij表示由所述对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示所述第二调整系数,0<<1,τ表示所述第一调整系数,0<<1。

进一步的,所述将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度,包括:

针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;

将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;

针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。

进一步的,采用如下公式,将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度:

其中,s为所述本帧图像和所述对比帧图像之间的全局特征相似度,所述为映射函数,为图像的纵向划分个数,h为图像的横向划分个数,1≤i≤wb,1≤j≤hb,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度。

第二方面,本发明实施提供了一种视频场景切换识别方法,所述方法包括:

获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;

获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;

基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;

将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度;

如果所述全局特征相似度小于预设值,则识别出所述本帧图像相对于所述对比帧图像发生视频场景切换。

进一步的,所述获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,包括:

对所述本帧图像进行均匀区块划分,得到两个以上第一区块;

对所述第一区块进行特征提取,得到所述第一区块中的特征点集;

将所述第一区块中的特征点集作为第一特征点集;

对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;

对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;

将所述各第一区块对应的第二区块的特征点集作为第二特征点集;

将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;

将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。

进一步的,所述基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,包括:

基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。

进一步的,所述预设相似度计算公式为

式中,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度,所述为映射函数,所述映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示所述关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,所述l表示所述关联特征点对集的总数,P表示所述关联特征点对集,A表示由本帧图像生成的numpy矩阵,B表示由对比帧图像生成的numpy矩阵,表示所述本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,(x,y)表示关联特征点对集中的任一关联特征点对,所述i表示行的序号,表示的取值范围为并且i取的值,不取的值,j表示列的序号,表示的取值范围为并且j取的值,不取的值,所述h为图像的高,所述w为图像的宽,所述h为图像的横向划分个数,所述wb为图像的纵向划分个数,所述Aij表示由所述本帧图像生成的numpy矩阵中第i行j列的第一区块,所述Bij表示由所述对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示所述第二调整系数,0<Θ<1,τ表示所述第一调整系数,0<τ<1。

进一步的,所述将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度,包括:

针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;

将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;

针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。

进一步的,采用如下公式,将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度:

其中,S为所述本帧图像和所述对比帧图像之间的全局特征相似度,所述为映射函数,wb为图像的纵向划分个数,hb为图像的横向划分个数,1≤i≤wb,1≤j≤hb,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度。

第三方面,本发明实施提供一种确定图像相似度的装置,所述装置包括:

第一获取模块,用于获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;

第二获取模块,用于获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;

计算模块,用于基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;

获得模块,用于将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。

进一步的,所述第一获取模块,用于:

对所述本帧图像进行均匀区块划分,得到两个以上第一区块;

对所述本帧图像进行均匀区块划分,得到两个以上第一区块;

对所述第一区块进行特征提取,得到所述第一区块中的特征点集;

将所述第一区块中的特征点集作为第一特征点集;

对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;

对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;

将所述各第一区块对应的第二区块的特征点集作为第二特征点集;

将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;

将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。

进一步的,所述计算模块,用于:

基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。

进一步的,所述获得模块,用于:

针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;

将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;

针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。

第四方面,本发明实施提供一种视频场景切换识别装置,所述装置包括:

第一获取模块,用于获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;

第二获取模块,用于获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;

计算模块,用于基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;

获得模块,用于将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度;

识别模块,用于如果所述全局特征相似度小于预设值,则识别出所述本帧图像相对于所述对比帧图像发生视频场景切换。

进一步的,所述第一获取模块,用于:

对所述本帧图像进行均匀区块划分,得到两个以上第一区块;

对所述本帧图像进行均匀区块划分,得到两个以上第一区块;

对所述第一区块进行特征提取,得到所述第一区块中的特征点集;

将所述第一区块中的特征点集作为第一特征点集;

对所述对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;

对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;

将所述各第一区块对应的第二区块的特征点集作为第二特征点集;

将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;

将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。

进一步的,所述计算模块,用于:

基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,利用预设相似度计算公式,计算所述关联特征点对集的相似度,其中,所述预设相似度计算公式中包含第一调整系数和第二调整系数,所述第一调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述第二调整系数用于调整所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关。

进一步的,所述获得模块,用于:

针对每个第一区块和所述第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为所述第一区块和所述第一区块对应的第二区块之间的相似度;

将所述第一区块和所述第一区块对应的第二区块之间的相似度,作为区块匹配相似度;

针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为所述本帧图像和所述对比帧图像之间的全局特征相似度。

第五方面,本发明实施提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现第一方面所述的方法步骤。

第六方面,本发明实施提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现第二方面所述的方法步骤。

第七方面,本发明实施提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面任一的方法。

第八方面,本发明实施提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第二方面任一的方法。

第九方面,本发明实施还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面任一的方法。

第十方面,本发明实施还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第二方面任一的方法。

本发明实施例提供的一种确定图像相似度的方法,将获取的视频数据中的本帧图像的第一特征点集,与对比帧图像的第二特征点集之间相匹配的特征点,作为关联特征点对集;获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度;基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度分别与所述关联特征点对集的数量呈正相关,与所述关联特征点对集的欧式距离呈负相关;将预设相似度与关联特征点对集的相似度的加权平均,确定为本帧图像和对比帧图像之间的全局特征相似度。

由此可见,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,然后在计算全局特征相似度时,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,基于与关联特征点对集的相似度呈负相关的关联特征点对集的欧式距离,来计算关联特征点对集的相似度,说明减少距离较远的关联特征点的影响;以及基于与关联特征点对集的相似度呈正相关的关联特征点对集的数量,来计算关联特征点对集的相似度,说明关联特征点对集的数量越多,本帧图像与对比帧图像越相似,越需要提高较多的关联特征点对集的影响,相较于现有技术,本发明实施例的关联特征点对集的相似度与实际场景的相似度更加接近,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度,相较于现有技术更加准确。

本发明实施例还提供的一种确定图像相似度的方法视频场景切换识别方法及装置,将获取的视频数据中的本帧图像的第一特征点集,与对比帧图像的第二特征点集之间相匹配的特征点,作为关联特征点对集;获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度;基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度分别与所述关联特征点对集的数量呈正相关,与所述关联特征点对集的欧式距离呈负相关;将预设相似度与关联特征点对集的相似度的加权平均,确定为本帧图像和对比帧图像之间的全局特征相似度;如果所述全局特征相似度小于预设值,则识别出所述本帧图像相对于所述对比帧图像发生视频场景切换。

由此可见,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,然后在计算全局特征相似度时,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,基于与关联特征点对集的相似度呈负相关的关联特征点对集的欧式距离,来计算关联特征点对集的相似度,说明减少距离较远的关联特征点的影响;以及基于与关联特征点对集的相似度呈正相关的关联特征点对集的数量,来计算关联特征点对集的相似度,说明关联特征点对集的数量越多,本帧图像与对比帧图像越相似,越需要提高较多的关联特征点对集的影响,相较于现有技术,本发明实施例的关联特征点对集的相似度与实际场景的相似度更加接近,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度,相较于现有技术更加准确。

当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图作简单地介绍。

图1为本发明实施例提供的确定图像相似度的方法的第一流程示意图;

图2为本发明实施例提供确定图像相似度的方法的第二流程示意图;

图3为本发明实施例提供确定图像相似度的方法的整体实现流程示意图;

图4为本发明实施例的确定图像相似度的方法的第三流程示意图;

图5为本发明实施例的确定图像相似度的方法的第四流程示意图;

图6为本发明实施例的输出视频源素材中发生视频场景切换的图像的具体实现流程示意图;

图7为本发明实施例的确定图像相似度的装置的第一结构示意图;

图8为本发明实施例的确定图像相似度的装置的第二结构示意图;

图9为本发明实施例提供的电子设备的第一结构示意图;

图10为本发明实施例提供的电子设备的第二结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

针对现有技术的相邻两视频帧的场景变化率与实际场景的场景变化率存在较大差异的问题,本发明实施例提供一种确定图像相似度的方法及装置,采用如下步骤,识别出视频数据中本帧图像相对于对比帧图像发生的视频场景切换:

将获取的视频数据中的本帧图像的第一特征点集,与对比帧图像的第二特征点集之间相匹配的特征点,作为关联特征点对集;获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度;基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度;关联特征点对集的相似度分别与关联特征点对集的数量呈正相关,与关联特征点对集的欧式距离呈负相关;将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。

由此可见,在计算全局特征相似度时,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。

下面首先对本发明实施例提供的一种确定图像相似度的方法进行介绍。

本发明实施例所提供的一种确定图像相似度的方法,应用于电子设备。进一步的,应用于电子设备的视频播放器,比如PC(personal computer,个人计算机端)上用于视频播放的APP(Application,应用程序),以及客户端上用于视频播放的APP。

参见图1,图1为本发明实施例提供的确定图像相似度的方法的第一流程示意图。本发明实施例所提供的确定图像相似度的方法,可以包括如下步骤:

步骤110,获取视频数据中本帧图像的第一特征点集,与视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将第一特征点集与第二特征点集相匹配的特征点,作为关联特征点对集,对比帧图像与本帧图像属于不同帧的图像。

其中,上述视频数据21可以包括拍摄的完整视频,或者拍摄的部分视频,参见3所示。示例性的,视频数据可以是精剪后的完整视频节目,上述对比帧图像23可以为完整视频节目中本帧图像22之前相邻的一帧图像,或者可以为完整视频节目中本帧图像22之前,且与本帧图像22之间存在预设间隔帧的一帧图像,又或者可以为完整视频节目中本帧图像22之后相邻的一帧图像,再或者可以为完整视频节目中本帧图像22之后,且与本帧图像22之间存在预设间隔帧的一帧图像。这个预设间隔帧是指本帧图像22与上述对比帧图像23之间间隔了一个以上帧。这个预设间隔帧可以根据用户需求进行设置。这样本帧图像22和对比帧图像23均来源于同一视频数据中的不同帧图像,从而方便确定本帧图像22相对于对比帧图像23之间的全局特征相似度。

上述本帧图像中的特征点集,称为第一特征点集;上述对比帧图像的的特征点集,称为第二特征点集。上述第二特征点集中特征点的数目大于或等于三。同理,第一特征点集中特征点的数目大于或等于三。

上述步骤110中第一特征点集的一种确定方式可以是对本帧图像直接进行特征提取,得到本帧图像的特征点集;将本帧图像的特征点集,作为第一特征点集,这样方便直接得到第一特征点集。

由于镜头运动方式并未发生运动,仅仅是因为本帧图像中画面内容的部分特征点发生运动,比如,由于人物的移动而使得人物的特征点运动。因此为了避免发生运动的画面内容影响到最终关联特征点对集中各第一特征点集相对于匹配的第二特征点集对应的镜头运动方式,本发明实施例上述第一特征点集的另一种确定方式可以是采用如下步骤:

第一步,对第一区块进行特征提取,得到第一区块中的特征点集;第二步,将第一区块中的特征点集,作为第一特征点集。

参见图2所示,上述第一步进一步可以包括如下步骤111和步骤112:

步骤111,对本帧图像进行均匀区块划分,得到两个以上第一区块。

其中,将上述本帧图像进行均匀区块划分,得到两个以上区块,将这些位于本帧图像中的区块称为第一区块。这些第一区块可以但并不限定于是将本帧图像所有图像区域进行全部均匀区块划分。区块划分方式进一步的可以是在本帧图像中进行预设形状的全部区块划分。这样可以得到两个以上预设形状的第一区块。进一步的,这些第一区块的预设形状可以根据用户需求进行设置。这些第一区块的预设形状可以是圆形,或者也可以是方形,在此不做限定。对于均匀区块划分而言,可以将所有图像区域的特征点集进行使用。而,对于按照预设形状的全部区块划分而言,可以从本帧图像中得到携带有特征点集的区块,进而进行确定各个第一区块的特征点集,减少运算量,提高运算的准确度。

上述步骤111进一步可以包括:将视频数据中的本帧图像生成numpy矩阵A;将本帧图像的numpy矩阵A进行均匀区块划分,得到第一区块,即i表示行的序号,表示的取值范围为并且i取的值,不取的值,j表示列的序号,表示的取值范围为并且j取的值,不取的值,h为图像的高,w为图像的宽,hb为图像的横向划分个数,wb为图像的纵向划分个数,Aij表示由本帧图像生成的numpy矩阵中第i行j列的第一区块。

步骤112,对第一区块进行特征提取,得到第一区块中的特征点集,将第一区块中的特征点集作为第一特征点集。

上述特征提取方式可以是指SHIF(Scale-invariant feature transform,检测局部特征的算法),ORB(Oriented FAST and Rotated BRIEF,快速特征点集提取和描述的算法),SURF(Speeded Up Robust Features,加速稳健特征)中的任一种特征提取。这样上述步骤112,进一步可以包括:采用上述特征提取方式,对第一区块Aij进行特征提取,得到第一区块中的特征点集,将第一区块中的特征点集作为第一特征点集。这样可以提取第一区块的特征点集。

上述从本帧图像中确定第一特征点集的确定方式中,将本帧图像均匀区块划分为第一区块的情况下,发生运动的画面内容的部分特征点所对应的区块的数量小于画面内容的部分特征点的数量,这样减少了画面内容的部分特征点发生运动,对关联特征点对集中各第一特征点集相对于匹配的第二特征点集对应的镜头运动方式的影响,这样不仅提高了关联特征点对集中各第一特征点集相对于匹配的第二特征点集对应的镜头运动方式的准确性,而且由于第一区块的限制,方便从本帧图像的第一区块进行特征提取,可以提高特征点集的提取效率。

基于上述第一特征点集的说明,同理,上述步骤120中第二特征点集的一种确定方式可以是指对对比帧图像直接进行特征提取,得到对比帧图像的特征点集,这样方便直接得到第二特征点集。

由于镜头运动方式并未发生运动,仅仅是因为本帧图像中画面内容的部分特征点发生运动,比如,由于人物的移动而使得人物的特征点运动。因此为了避免发生运动的画面内容影响到最终关联特征点对集中各第一特征点集相对于匹配的第二特征点集对应的镜头运动方式,本发明实施例上述第二特征点集的另一种确定方式可以是采用如下步骤:

第1步,对第二区块进行特征提取,得到第二区块中的特征点集;第2步,将第二区块中的特征点集,作为第二特征点集。

上述第1步进一步可以包括如下步骤113和步骤114:

步骤113,对对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块。

将对比帧图像进行均匀区块划分,得到两个以上区块,将这些位于对比帧图像中的区块称为第二区块。第二区块的区块划分方式与第一区块的划分方式,除以第一区块作为区块划分方式的对象不同外,第二区块的区块划分方式的过程与第一区块的区块划分方式的过程相同,均可参照第一区块的区块划分方式,在此不再赘述。

上述步骤113,进一步可以包括:将视频数据中的对比帧图像生成numpy矩阵B;将对比帧图像的numpy矩阵B进行区块划分,得到第二区块,即其中,B就是本帧图像的numpy矩阵,Bij表示由对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块。

步骤114,对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集,将各第一区块对应的第二区块的特征点集作为第二特征点集。其中,第二区块的特征提取方式与第一区块的特征提取方式,除以第一区块作为特征提取方式的对象不同外,第二区块的特征提取方式的过程与第一区块的特征提取方式的过程相同,均可参照第一区块的特征提取方式,在此不再赘述。这样上述步骤113,进一步可以包括:采用上述特征提取方式,对各第一区块对应的第二区块Bij进行特征提取,得到各第一区块对应的第二区块Bij的特征点集,将各第一区块对应的第二区块Bij的特征点集作为第二特征点集。这样可以提取第二区块的特征点集。

步骤115,将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点;将各第一区块中第一特征点集与所述第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。

本步骤115,可以采用如下至少一种求取关联特征点对集的方式,确定关联特征点对集,其中,求取关联特征点对集的方式包括:KNN(k-Nearest Neighbor,K最近邻)算法。为了提高后期第一特征点集与第二特征点集匹配的准确性。进一步的,采用KNN算法,执行如下步骤,确定关联特征点对集:

第一步,利用KNN算法,确定第二特征点集与第一特征点集之间相匹配的特征点;第二步,将第二特征点集与第一特征点集之间相匹配的特征点,确定为关联特征点对集。这样方便准确得到关联特征点对集。

步骤120,获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度,这些预设相似度为最小相似度。

本步骤120中,第一特征点集与第二特征点集之间不匹配的特征点可以是除去关联特征点以外剩余的特征点。这样相当于后期使用所有的特征点。

上述最小相似度可以是根据用户需求设置的。只要能够表示对全局特征相似度影响较小的数值,均可以作为这些不匹配的特征点的最小相似度,在此不做限定。比如,最大相似度的取值可以为1,最小相似度的取值小于0.5。可选性的,最小相似度可以为零。此处仅仅是举例说明,在此不做限定。

步骤130,基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。

基于步骤130可知,由于关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关,确定出的关联特征点对集的相似度更加接近于实际场景的相似度。因此,只要能够包含关联特征点对集的总数和关联特征点对集的欧式距离,分别与关联特征点对集的相似度之间的关系,并能够计算出关联特征点对集的相似度的实现方案,均属于本发明实施例的保护范围。以下本步骤130中得到关联特征点对集的相似度的实现方案,可以包括以下至少之一,但并不限于此:

参见3所示,在一种实现方案中,基于关联特征点对集24的总数和关联特征点对集24的欧式距离,利用预设相似度计算公式25,计算关联特征点对集24的相似度,其中,预设相似度计算公式25中包含第一调整系数和第二调整系数,该第一调整系数用于调整关联特征点对集24的相似度与关联特征点对集24的数量呈正相关,该第二调整系数用于调整关联特征点对集24的相似度与关联特征点对集24的欧式距离呈负相关。这样可以使用第一调整系数和第二调整系数,分别调整关联特征点对集24的总数和关联特征点对集24的欧式距离,与关联特征点对集24的相似度之间的关系,得到更加准确的关联特征点对集24的相似度,进而确定本帧图像22和对比帧图像23之间的全局特征相似度。

上述第一调整系数和第二调整系数可以是根据用户需求或者工业需求设置的,上述第一调整系数和第二调整系数也可以是经验值。上述第一调整系数和第二调整系数可以在(0,1)的范围内取值。第二调整系数可以是第一调整系数的2倍数量级以上。示例性的,第二调整系数为0.2,第一调整系数为0.002。只要能够对应调整关联特征点对集24的总数和关联特征点对集24的欧式距离,分别与关联特征点对集24的相似度之间的关系,达到工业需求的预期相似度的关系状态,对应的第一调整系数和第二调整系数,均属于本发明实施例的保护范围,在此不再举例。

可选的,上述预设相似度计算公式可以为

式中,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度,所述为映射函数,所述映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示所述关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,所述l表示所述关联特征点对集的总数,P表示所述关联特征点对集,A表示由本帧图像生成的numpy矩阵中的第一区块,B表示由对比帧图像生成的numpy矩阵中的第二区块,表示所述本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,所述x表示特征点的水平坐标,所述y表示特征点的垂直坐标,(x,y)表示关联特征点对集中的任一关联特征点对,所述i表示行的序号,表示的取值范围为并且i取的值,不取的值,j表示列的序号,表示的取值范围为并且j取的值,不取的值,所述h为图像的高,所述w为图像的宽,所述h为图像的横向划分个数,所述wb为图像的纵向划分个数,所述Aij表示由所述本帧图像生成的numpy矩阵中第i行j列的第一区块,所述Bij表示由所述对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示所述第二调整系数,0<Θ<1,τ表示所述第一调整系数,0<τ<1。

本发明实施例中的映射函数可以为双曲正切函数,也可以为反双曲正切函数,任何能够实现将映射到[0,1]的取值范围内的映射函数,均属于本发明实施例的保护范围,在此不再一一举例。上述sij的取值范围为(0,1)。由此可见,如果关联特征点对集中特征点对的数目越多,则说明关联特征点对集的相似度越高,需要使上述公式中l影响关联特征点对集的相似度的作用越大;并且,关联特征点对集中特征点对的距离越远,则说明关联特征点对集的相似度越小,需要使上述公式中的影响关联特征点对集的相似度的作用越小,进而采用上述公式第一调整系数和第二调整系数,可以实现对关联特征点对集的相似度的调整,相较于现有技术,本发明实施例的关联特征点对集的相似度与实际场景的相似度更加接近,更加准确。

步骤140,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。其中,全局特征相似度是用来描述本帧图像的所有第一区块与对比帧图像中所有第二区块之间的相似度,也就是,表征整个本帧图像和整个对比帧图像之间的全部特征点的相似度。

本步骤140确定本帧图像和对比帧图像之间的全局特征相似度的实现方式可以包括以下至少之一,但并不限于此:

在一种实现方式中,将所有预设相似度与所有关联特征点对集的相似度直接加权平均,得到加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。这样可以直接依据本帧图像的特征点和对比帧图像的特征点,进行计算预设相似度与所有关联特征点对集的相似度,进而方便直接运算本帧图像和对比帧图像之间的全局特征相似度。

在另一种实现方式中,结合图1或图2的基础上,参见图4所示,步骤141,针对每个第一区块和第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为第一区块和第一区块对应的第二区块之间的相似度;

步骤142,将第一区块和第一区块对应的第二区块之间的相似度,作为区块匹配相似度;

步骤143,针对所有第一区块和所述第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。

本步骤142可以包括但不限于:获取所有第一区块与第一区块对应的第二区块的相似度的预设权重,按照对应的每个预设权重,将预设相似度与关联特征点对集的相似度的加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。预设权重是根据经验值设置的,只要能够满足每个第一区块与第一区块对应的第二区块的相似度呈正相关的预设权重,均属于本发明实施例的保护范围,在此不再一一举例。这样可以参照第一区块及第二区块,分别与实际情况中相似度的符合程度获取的预设权重,进而得到更加接近于实际情况的相似度,从而提高相似度的准确性。

在另一种实现方式中,采用如下公式,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度:

其中,S为所述本帧图像和所述对比帧图像之间的全局特征相似度,所述为映射函数,为图像的纵向划分个数,hb为图像的横向划分个数,1≤i≤wb,1≤j≤hb,所述sij表示第i行第j列的第一区块以及所述第一区块对应的第二区块的相似度。

本发明实施例中,在计算全局特征相似度时,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。

下面继续对本发明实施例提供的一种视频场景切换识别方法进行介绍。

参见图5,图5为本发明实施例提供的视频场景切换识别方法的第二流程示意图。本发明实施例所提供的视频场景切换识别方法,可以包括如下步骤:

步骤210,获取视频数据中本帧图像的第一特征点集,与视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将第一特征点集与第二特征点集相匹配的特征点,作为关联特征点对集,对比帧图像与本帧图像属于不同帧的图像。

步骤220,获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度,预设相似度为最小相似度。

步骤230,基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。

步骤240,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。

本发明实施例中的上述步骤210至步骤240与图1中的步骤110至步骤140相同,并且限定的内容相同,在此不再一一赘述。

步骤250,判断全局特征相似度是否小于预设值。

这里的预设值可以根据用户需求或工业需求进行设置。这个预设值可以是经验值。任何能够实现判断本帧图像相对于对比帧图像是否发生视频场景切换的预设值,均属于本发明实施例的保护范围,在此不再赘述。

步骤251,如果全局特征相似度小于预设值,则识别出本帧图像相对于对比帧图像发生视频场景切换。这样识别出本帧图像相对于对比帧图像发生视频场景切换,可以为如色彩修复,镜头运动方式的分类等算法,提供视频场景切换的信息,从而可以只使用视频场景切换的图像,而不使用未发生视频场景切换的图像,不需要每一帧图像进行运算,减少计算的图像数量,提高相应其他算法的计算效率与精度。

步骤252,如果全局特征相似度大于或等于预设值,则识别出本帧图像相对于对比帧图像未发生视频场景切换。这样识别视频场景切换时,可以不使用未发生视频场景切换的图像,可以只使用视频场景切换的图像,从而可减少计算图像的数量,在一个视频场景片段按需检测上述视频场景切换的图像,而不需对每帧图像都进行处理。

这样在计算全局特征相似度时,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。进而提高了识别本帧图像相对于对比帧图像的发生视频场景切换的准确性。

在一种可能的实现方式中,上述步骤210可以包括但不限于:

第一步,对本帧图像进行均匀区块划分,得到两个以上第一区块;

第二步,对第一区块进行特征提取,得到第一区块中的特征点集;

第三步,将第一区块中的特征点集作为第一特征点集;

第四步,对对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;

第五步,对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;

第六步,将各第一区块对应的第二区块的特征点集作为第二特征点集;

第七步,将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点;

第八步,将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。

在一种可能的实现方式中,上述步骤230可以包括但不限于:

基于关联特征点对集的总数和关联特征点对集的欧式距离,利用预设相似度计算公式,计算关联特征点对集的相似度,其中,预设相似度计算公式中包含第一调整系数和第二调整系数,第一调整系数用于调整关联特征点对集的相似度与关联特征点对集的数量呈正相关,第二调整系数用于调整关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。

在一种可能的实现方式中,预设相似度计算公式为

式中,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度,为映射函数,映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,l表示关联特征点对集的总数,P表示关联特征点对集,A表示由本帧图像生成的numpy矩阵,B表示由对比帧图像生成的numpy矩阵,表示本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,(x,y)表示关联特征点对集中的任一关联特征点对,i表示行的序号,表示的取值范围为并且i取的值,不取的值,j表示列的序号,表示的取值范围为并且j取的值,不取的值,h为图像的高,w为图像的宽,hb为图像的横向划分个数,wb为图像的纵向划分个数,Aij表示由本帧图像生成的numpy矩阵中第i行j列的第一区块,Bij表示由对比帧图像生成的numpy矩阵B中第i行j列第一区块对应的第二区块,Θ表示第二调整系数,0<Θ<1,τ表示第一调整系数,0<τ<1。

在一种可能的实现方式中,上述步骤240可以包括但不限于:

针对每个第一区块和第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为第一区块和第一区块对应的第二区块之间的相似度;

将第一区块和第一区块对应的第二区块之间的相似度,作为区块匹配相似度;

针对所有第一区块和第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。

在一种可能的实现方式中,采用如下公式,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度:

其中,S为本帧图像和对比帧图像之间的全局特征相似度,为映射函数,wb为图像的纵向划分个数,h为图像的横向划分个数,1≤i≤wb,1≤j≤hb,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度。

结合图1和图5,参见图6,本发明实施例的具体实现流程,进行如下举例说明:

首先,在步骤110之前,方法可以还包括:

步骤100,获取视频源素材,视频源素材包括:所有图像,图像的帧总数frames_len,图像的尺寸SIZE=(w,h),即图像的尺寸SIZE也就是一帧图像的宽w与高h。

步骤101,获取计数器的计数cnt,预设间隔帧jump_frames及预设划区块参数(wb,hb),其中计数器的计数cnt=0作为初始数值,wb为横向划分个数,hb为纵向划分个数;其中,计数器的计数cnt总数为图像的帧总数frames_len。

步骤102,从视频源素材中获取第cnt帧图像作为本帧图像;

步骤103,从视频源素材中获取第(cnt+jump_frames)帧图像作为对比帧图像。这样可以先得到本帧图像和对比帧图像,然后再执行步骤110,既可对本帧图像和对比帧图像进行处理。

步骤104,获取本帧图像的numpy矩阵以及获取对比帧图像的numpy矩阵然后继续执行步骤210至步骤250,使用步骤250来判断全局特征相似度是否小于预设值后,再然后执行步骤251或步骤252;其中,表示向量空间,3表示颜色通道数,进而确定出本帧图像相对于对比帧图像未发生视频场景切换或本帧图像相对于对比帧图像发生视频场景切换。

步骤105,判断cnt+3*jump_frames是小于,或者是等于图像的帧总数frames_len;

步骤106,如果cnt+3*jump_frames小于图像的帧总数frames_len,则cnt=cnt+2*jump_frames,返回继续执行步骤102;

步骤107,如果cnt+3*jump_frames等于图像的帧总数frames_len,则输出识别的视频源素材中发生视频场景切换的图像。

本发明实施例中,在视频数据为视频源素材的情况下,从视频源素材中获得第cnt帧图像作为本帧图像;以及获取第(cnt+jump_frames)帧图像作为对比帧图像。利用从本帧图像中的第一特征点集和对比帧图像中的第二特征点集相匹配的特征点,即本帧图像和对比帧图像之间的关联特征点对集。关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。进而确定出本帧图像相对于对比帧图像的发生视频场景切换,相较于现有技术也更加准确。

相较于现有技术中使用两帧图像的像素的颜色信息进行相似度计算,如颜色直方图等相似度计算的方法。本发明实施例具有更强的鲁棒性,提高识别本帧图像相对于对比帧图像的发生视频场景切换的准确性。

下面继续对本发明实施例提供的确定图像相似度的装置进行介绍。

参见7所示,图7为本发明实施例的确定图像相似度的装置的第一结构示意图。本发明实施例提供确定图像相似度的装置,包括:

第一获取模块31,用于获取视频数据中本帧图像的第一特征点集,与视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将第一特征点集与第二特征点集相匹配的特征点,作为关联特征点对集,对比帧图像与本帧图像属于不同帧的图像;

第二获取模块32,用于获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度,预设相似度为最小相似度;

计算模块33,用于基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关;

获得模块34,用于将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度。

在一种可能的实现方式中,第一获取模块,用于:

对本帧图像进行均匀区块划分,得到两个以上第一区块;

对本帧图像进行均匀区块划分,得到两个以上第一区块;

对第一区块进行特征提取,得到第一区块中的特征点集;

将第一区块中的特征点集作为第一特征点集;

对对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;

对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;

将各第一区块对应的第二区块的特征点集作为第二特征点集;

将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点;

将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。

在一种可能的实现方式中,计算模块,用于:

基于关联特征点对集的总数和关联特征点对集的欧式距离,利用预设相似度计算公式,计算关联特征点对集的相似度,其中,预设相似度计算公式中包含第一调整系数和第二调整系数,第一调整系数用于调整关联特征点对集的相似度与关联特征点对集的数量呈正相关,第二调整系数用于调整关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。

在一种可能的实现方式中,预设相似度计算公式为

式中,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度,为映射函数,映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,l表示关联特征点对集的总数,P表示关联特征点对集,A表示由本帧图像生成的numpy矩阵中的第一区块,B表示由对比帧图像生成的numpy矩阵中的第二区块,表示本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,x表示特征点的水平坐标,y表示特征点的垂直坐标,(x,y)表示关联特征点对集中的任一关联特征点对,i表示行的序号,表示的取值范围为并且i取的值,不取的值,j表示列的序号,表示的取值范围为并且j取的值,不取的值,h为图像的高,w为图像的宽,hb为图像的横向划分个数,wb为图像的纵向划分个数,Aij表示由本帧图像生成的numpy矩阵中第i行j列的第一区块,Bij表示由对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示第二调整系数,0<Θ<1,τ表示第一调整系数,0<τ<1。

在一种可能的实现方式中,获得模块,用于:

针对每个第一区块和第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为第一区块和第一区块对应的第二区块之间的相似度;

将第一区块和第一区块对应的第二区块之间的相似度,作为区块匹配相似度;

针对所有第一区块和第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。

在一种可能的实现方式中,采用如下公式,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度:

其中,S为本帧图像和对比帧图像之间的全局特征相似度,为映射函数,wb为图像的纵向划分个数,hb为图像的横向划分个数,1≤i≤wb,1≤j≤hb,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度。

参见8所示,图8为本发明实施例的确定图像相似度的装置的第二结构示意图。本发明实施例提供确定图像相似度的装置,包括:

第一获取模块41,用于获取视频数据中本帧图像的第一特征点集,与视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将第一特征点集与第二特征点集相匹配的特征点,作为关联特征点对集,对比帧图像与本帧图像属于不同帧的图像;

第二获取模块42,用于获取第一特征点集与第二特征点集之间不匹配的特征点的预设相似度,预设相似度为最小相似度;

计算模块43,用于基于关联特征点对集的总数和关联特征点对集的欧式距离,计算关联特征点对集的相似度,关联特征点对集的相似度与关联特征点对集的数量呈正相关,关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关;

获得模块44,用于将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度;

识别模块45,识别模块,用于如果全局特征相似度小于预设值,则识别出本帧图像相对于对比帧图像发生视频场景切换。

这样在计算全局特征相似度时,将第一特征点集与第二特征点集之间不匹配的特征点的相似度,设置为最小相似度,相当于并未使用不匹配的特征点的相似度,说明减少了不匹配的特征点的影响;并且,关联特征点对集的数量越多,说明本帧图像与对比帧图像越相似,越需要提高数量较多的关联特征点对集的影响,以及关联特征点对集距离越远,说明本帧图像与对比帧图像越相似越不相似,越需要减少距离较远的关联特征点的影响,因此相较于现有技术,基于关联特征点对集的欧式距离以及关联特征点对集的数量,计算的关联特征点对集的相似度更加接近于实际场景的相似度,更加准确,进而计算的本帧图像和对比帧图像之间的全局特征相似度更加准确。进而提高了识别本帧图像相对于对比帧图像的发生视频场景切换的准确性。

在一种可能的实现方式中,第一获取模块,用于:

对本帧图像进行均匀区块划分,得到两个以上第一区块;

对本帧图像进行均匀区块划分,得到两个以上第一区块;

对第一区块进行特征提取,得到第一区块中的特征点集;

将第一区块中的特征点集作为第一特征点集;

对对比帧图像进行均匀区块划分,得到各第一区块对应的第二区块;

对各第一区块对应的第二区块进行特征提取,得到各第一区块对应的第二区块的特征点集;

将各第一区块对应的第二区块的特征点集作为第二特征点集;

将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集进行匹配,得到各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点;

将各第一区块中第一特征点集与第一区块对应的第二区块中第二特征点集相匹配的特征点,作为关联特征点对集。

在一种可能的实现方式中,计算模块,用于:

基于关联特征点对集的总数和关联特征点对集的欧式距离,利用预设相似度计算公式,计算关联特征点对集的相似度,其中,预设相似度计算公式中包含第一调整系数和第二调整系数,第一调整系数用于调整关联特征点对集的相似度与关联特征点对集的数量呈正相关,第二调整系数用于调整关联特征点对集的相似度与关联特征点对集的欧式距离呈负相关。

在一种可能的实现方式中,预设相似度计算公式为

式中,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度,为映射函数,映射函数用于将映射到[0,1]的取值范围内,使得sij处于[0,1]的取值范围内,l表示关联特征点对集的总数,k表示关联特征点对的序号,1≤k≤l,l表示关联特征点对集的总数,P表示关联特征点对集,A表示由本帧图像生成的numpy矩阵中的第一区块,B表示由对比帧图像生成的numpy矩阵中的第二区块,表示本帧图像生成的numpy矩阵以及对比帧图像生成的numpy矩阵的第k关联特征点对,表示第k关联特征点对中位于本帧图像生成的numpy矩阵中的特征点;表示第k关联特征点对中位于对比帧图像生成的numpy矩阵中的特征点,x表示特征点的水平坐标,y表示特征点的垂直坐标,(x,y)表示关联特征点对集中的任一关联特征点对,i表示行的序号,表示的取值范围为并且i取的值,不取的值,j表示列的序号,表示的取值范围为并且j取的值,不取的值,h为图像的高,w为图像的宽,hb为图像的横向划分个数,wb为图像的纵向划分个数,Aij表示由本帧图像生成的numpy矩阵中第i行j列的第一区块,Bij表示由对比帧图像生成的numpy矩阵中第i行j列第一区块对应的第二区块,Θ表示第二调整系数,0<Θ<1,τ表示第一调整系数,0<τ<1。

在一种可能的实现方式中,获得模块,用于:

针对每个第一区块和第一区块对应的第二区块,将所有预设相似度和所有关联特征点对集之和,确定为第一区块和第一区块对应的第二区块之间的相似度;

将第一区块和第一区块对应的第二区块之间的相似度,作为区块匹配相似度;

针对所有第一区块和第一区块对应的第二区块,将所有区块匹配相似度加权平均值,作为本帧图像和对比帧图像之间的全局特征相似度。

在一种可能的实现方式中,采用如下公式,将预设相似度与关联特征点对集的相似度的加权平均值,确定为本帧图像和对比帧图像之间的全局特征相似度:

其中,S为本帧图像和对比帧图像之间的全局特征相似度,为映射函数,wb为图像的纵向划分个数,hb为图像的横向划分个数,1≤i≤wb,1≤j≤hb,sij表示第i行第j列的第一区块以及第一区块对应的第二区块的相似度。

参见图9,图9为本发明实施例的电子设备的第一结构示意图。本发明实施例还提供了一种电子设备,包括处理器51、通信接口52、存储器53和通信总线54,其中,处理器51,通信接口52,存储器53通过通信总线54完成相互间的通信,

存储器53,用于存放计算机程序;

处理器51,用于执行存储器53上所存放的程序时,实现如下步骤:

获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;

获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;

基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;

将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。

参见图10,图10为本发明实施例的电子设备的第二结构示意图。本发明实施例还提供了一种电子设备,包括处理器61、通信接口62、存储器63和通信总线64,其中,处理器61,通信接口62,存储器63通过通信总线64完成相互间的通信,

存储器63,用于存放计算机程序;

处理器61,用于执行存储器63上所存放的程序时,实现如下步骤:

获取视频数据中本帧图像的第一特征点集,与所述视频数据中对比帧图像的第二特征点集之间相匹配的特征点,并将所述第一特征点集与所述第二特征点集相匹配的特征点,作为关联特征点对集,所述对比帧图像与所述本帧图像属于不同帧的图像;

获取所述第一特征点集与所述第二特征点集之间不匹配的特征点的预设相似度,所述预设相似度为最小相似度;

基于所述关联特征点对集的总数和所述关联特征点对集的欧式距离,计算所述关联特征点对集的相似度,所述关联特征点对集的相似度与所述关联特征点对集的数量呈正相关,所述关联特征点对集的相似度与所述关联特征点对集的欧式距离呈负相关;

将所述预设相似度与所述关联特征点对集的相似度的加权平均值,确定为所述本帧图像和所述对比帧图像之间的全局特征相似度。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明实施例提供的方法可以应用于电子设备。进一步的,该电子设备可以为:台式计算机、便携式计算机、智能移动终端、服务器等。在此不作限定,任何可以实现本发明的电子设备,均属于本发明的保护范围。

相应于第一方面所示的方法,在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的确定图像相似度的方法。

相应于第二方面所示的方法,在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频场景切换识别方法。

相应于第一方面所示的方法,在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的确定图像相似度的方法。

相应于第二方面所示的方法,在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频场景切换识别方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置/电子设备/存储介质实施例/包含指令的计算机程序产品而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号