公开/公告号CN114821090A
专利类型发明专利
公开/公告日2022-07-29
原文格式PDF
申请/专利权人 南京可信区块链与算法经济研究院有限公司;
申请/专利号CN202210718212.8
申请日2022-06-24
分类号G06V10/40(2022.01);G06V10/30(2022.01);
代理机构北京弘权知识产权代理有限公司 11363;北京弘权知识产权代理有限公司 11363;
代理人李少丹;许伟群
地址 210031 江苏省南京市中国(江苏)自由贸易试验区南京片区研创园团结路99号孵鹰大厦1515室
入库时间 2023-06-19 16:11:11
法律状态公告日
法律状态信息
法律状态
2022-11-04
授权
发明专利权授予
2022-08-16
实质审查的生效 IPC(主分类):G06V10/40 专利申请号:2022107182128 申请日:20220624
实质审查的生效
技术领域
本发明涉及图像处理与计算机视觉技术领域,尤其涉及一种基于改造后的图像矩仿射不变量的图像特征提取方法。
背景技术
在计算机视觉领域中,图像的不变特征提取应用广泛。图像矩是描述图像形状全局特征的重要技术,并提供了大量的关于图像不同类型的几何特性信息,比如大小、位置、方向及形状等。图像矩的这种特征性描述能力被广泛的应用在各种图像处理、计算机视觉和机器人技术领域的目标识别与方位估计中。
在现有技术中,相关技术人员利用随机变量函数的性质提出了一系列构造仿射不变量的方法,这类方法可看作将原图像变换为仿射协变图像,利用低阶矩量对变换后的仿射协变图像进行仿射不变特征的提取。为了提高识别正确率,需要构造较多的仿射协变图像,这样一来计算量大大增加,计算速度慢,因此不能满足实时性要求较高的场合。
其次在传统方法中,还可以利用图像的几何矩构造仿射不变量,虽然可以提取图像的不变特征,但是存在高阶矩阵对噪声敏感的问题。由于高阶矩对噪声敏感,只能利用二阶或高于二阶的常规几何矩来构造仿射不变量,但这样会使图像的仿射不变量的鲁棒性能不佳。再者,由于零阶矩作为鲁棒性能最佳的矩量,却被用于规范化其他相对不变量,不能直接用于构造仿射不变量。
发明内容
本发明提供一种基于改造后的图像矩仿射不变量的图像特征提取方法,能够解决现有的图像不变特征提取方法中为克服高阶矩对噪声的敏感性,需要构造更多的仿射协变图像,使得计算量大大增加,以及图像的仿射不变量的鲁棒性差的问题。本申请在不增加计算量的基础上提高图像仿射不变量的鲁棒性能。
本申请实施例提供了一种基于改造后的图像矩仿射不变量的图像特征提取方法,所述方法包括:
将获取到的原图像执行平移变换,得到表示所述原图像的中心几何距;
对所述中心几何矩执行坐标系转换,得到极坐标系下的几何矩;
对所述几何矩执行线性变换,得到所述原图像的极半径矩的第一表达式;
将所述第一表达式执行推广操作,得到极半径矩的第二表达式;
将仿射不变量标准式中的几何矩替换为所述第二表达式,得到所述原图像的仿射不变量;
将所述仿射不变量中的参数取不同值,获取不同阶数的图像矩不变量,得到仿射不变特征。
进一步地,所述原图像的中心几何矩包括:
所述原图像
其中p,q为非负整数,
进一步地,所述极坐标系下的几何矩包括:
把所述原图像原点移至所述原图像质心,用极坐标表示笛卡尔坐标,半径r取原图 像上的点到质心的距离,角度θ取原图像上点到质心的反正切函数值,所述原图像
式(2)中第一重积分的范围定义为
进一步地,所述极半径距的第一表达式包括:
对所述几何矩执行线性变换,此时所述原图像在所述极坐标系下的几何矩为:
其中,
将上式(3)中的
其中
进一步地,所述极半径矩的第二表达式包括:
令
其中
进一步地,所述原图像的仿射不变量包括:
将仿射不变量标准式中的几何矩替换为所述第二表达式:
其中,取
进一步地,所述仿射不变特征包括:
一阶极半径矩是广义的零阶矩,可用于相对不变量的归一化,若取
利用三阶极半径矩构造仿射不变量,取
其中,
选择两个一阶极半径矩构造的所述仿射不变量和一个三阶极半径矩构造的所述仿射不变量,得到所述仿射不变特征:
其中,
进一步地,当式(4)中的
得出所述极半径矩的第一表达式等于所述极坐标系下的几何矩。
进一步地,所述极半径矩的第二表达式是所述原图像
进一步地,
本申请公开了一种基于改造后的图像矩仿射不变量的图像特征提取方法,所述方法包括:将获取到的原图像执行平移变换,得到表示所述原图像的中心几何距;对所述中心几何矩执行坐标系转换,得到极坐标系下的几何矩;对所述几何矩执行线性变换,得到所述原图像的极半径矩的第一表达式;将所述第一表达式执行推广操作,得到极半径矩的第二表达式;将仿射不变量标准式中的几何矩替换为所述第二表达式,得到所述原图像的仿射不变量;将所述仿射不变量中的参数取不同值,获取不同阶数的图像矩不变量,得到仿射不变特征。本申请可以解决原先仿射不变量对噪声敏感的问题,同时没有增加计算量,可以提高图像矩量的识别率并且对噪声的鲁棒性更佳。说明本申请提供的一种基于改造后的图像矩仿射不变量的图像特征提取方法,在不增加计算量的基础上提高图像仿射不变量的鲁棒性能。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于改造后的图像矩仿射不变量的图像特征提取方法的流程图;
图2为本申请实施例提供的一种基于改造后的图像矩仿射不变量的图像特征提取方法采用的四幅标准灰度图像;
图3为本申请实施例提供的图2中图像的一阶极半径矩不变量;
图4为本申请实施例提供的图2中图像的三阶极半径矩不变量;
图5为本申请实施例提供的一种基于改造后的图像矩仿射不变量的图像特征提取方法对字母库的抗噪性测试结果;
图6为本申请实施例提供的一种基于改造后的图像矩仿射不变量的图像特征提取方法对图像Coil-20的鲁棒性测试结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于理解本申请实施例的技术方案,在对本申请实施例的具体实施方式进行阐述说明之前,首先对本申请实施例所属技术领域的一些技术术语进行简单解释说明。
几何矩:矩是概率与统计中的一个概念,是随机变量的一种数字特征,从一幅数字图形中计算出来的矩集,通常描述了该图像形状的全局特征,并提供了大量关于该图像不同类型的几何特性信息,比如大小、位置、方向及形状等。图像的矩主要表征了图像区域的几何特征,又称为几何矩。
仿射变换:包括平移、伸缩、旋转和斜切,是描述同一目标在不同视点获取图像关系的近似模型。图像的仿射不变量具有平移、伸缩、旋转和斜切不变性,可以用于不变特性的目标识别与检测、目标成像跟踪、机器人视觉、模式识别与智能系统领域具有重要的意义。其中仿射不变量是经过平行射影不改变的性质和数量。
对本申请实施例所属技术领域的一些技术术语进行简单解释说明后,下面对本申请实施例提供的一种基于改造后的图像矩仿射不变量的图像特征提取方法进行详细描述。
在传统方法中,利用低阶矩量对变换后的仿射协变图像进行仿射不变特征的提取。为了提高识别正确率,需要构造较多的仿射协变图像,这样一来计算量大大增加,计算速度慢,因此不能满足实时性要求较高的场合。其次在传统方法中,还可以利用图像的几何矩构造仿射不变量,虽然可以提取图像的不变特征,但是存在高阶矩阵对噪声敏感的问题。由于高阶矩对噪声敏感,只能利用二阶或高于二阶的常规几何矩来构造仿射不变量,但这样会使图像的仿射不变量的鲁棒性能不佳。再者,由于零阶矩作为鲁棒性能最佳的矩量,却被用于规范化其他相对不变量,不能直接用于构造仿射不变量。因此本申请提供一种基于改造后的图像矩仿射不变量的图像特征提取方法用于解决上述问题。
参见图1为本申请实施例提供的一种基于改造后的图像矩仿射不变量的图像特征提取方法的流程图。
如图1所示,本申请实施例的一种基于改造后的图像矩量构造仿射不变量的方法包括以下步骤:
步骤S101:将获取到的原图像执行平移变换,得到表示所述原图像的中心几何矩。
具体的,所述原图像的中心几何矩包括:
所述原图像
其中p,q为非负整数,为保证所述图像仿射变换前后的平移不变形,由(12)得到表示所述原图像的中心几何矩为:
其中
从上述定义可以看出,几何矩本身具有明确的物理意义,如零阶矩表示物体的质量,一阶矩表示物体的质心,二阶矩表示物体的方向等。经过上述变换,图像的形状函数可以认为是由变换系数组成的无限集合,这些系数是由图像函数投影到一组二维多项式基函数所形成。
步骤S102:对所述中心几何矩执行坐标系转换,得到极坐标系下的几何矩。
具体的,通过将所述原图像原点移至所述原图像质心,用极坐标表示笛卡尔坐标, 半径r取原图像上的点到质心的距离,角度θ取原图像上点到质心的反正切函数值,在极坐 标系下,所述原图像用
进一步说明式(2)中第一重积分的范围定义为
由于正弦函数和余弦函数的最小正周期是2π,因此在同一个图像上(r,θ)和(r,θ+ 2π)表示的是同一个位置的点,所以
其中,
也就是说,所述极坐标系下的几何矩式中
其中
得出所述极半径矩的第一表达式等于所述极坐标系下的几何矩,也就是说所述极坐标系下的几何矩是所述极半径矩的第一表达式的特例。
步骤S104:将所述第一表达式执行推广操作,得到极半径矩的第二表达式。
所述极半径矩的第二表达式是原图像
其中p,q为非负整数,s表示极半径矩的阶数,
步骤S105:将仿射不变量标准式中的几何矩替换为所述第二表达式,得到所述原图像的仿射不变量。
仿射不变量是由相对不变量用归一化因子规范化得到的绝对不变量,其中归一化因子为零阶矩。将仿射不变量标准式中的几何矩替换为所述第二表达式:
其中,取
步骤S106:将所述仿射不变量中的参数取不同值,获取不同阶数的图像矩不变量,得到仿射不变特征。
一阶极半径矩是广义的零阶矩,可用于相对不变量的归一化。若取
传统矩量法中的零阶矩只能用于规范化,无法直接用于仿射不变量的构造。由于 一阶极半径矩中存在参数
三阶极半径矩是广义的二阶矩,可用于更多仿射不变量的构造。利用三阶极半径 矩构造仿射不变量,取
其中,
用于图像不变特征提取的仿射不变量是AMI1、AMI2、AMI3这三个矩量,因此本申请也用三个极半径矩构造的仿射不变量。三个极半径矩构造的仿射不变量可以有很多,本申请中最优的选择是取两个一阶极半径矩构造的仿射不变量和一个三阶极半径矩构造的仿射不变量构成所述仿射不变特征为:
其中,
现有的技术大部分采用基于不变矩方法的图像特征提取,在遇到需要对一个图像某个位置的物体进行判断时,一般想到的都是拿已经存储的图像去对比,对比的时候,由于噪声干扰以及多种冗余信息存在的原因,不可能按像素一个个对比,需要对图像特征进行提取,然后再比对。还会想到通过边缘检测找出其边缘点,将边缘点归入矩特征量的计算中,但这种方法计算量很大,复杂度比较高,时间效率低下。而本申请基于改造后的图像矩仿射不变特征提取方法对噪声的鲁棒性更佳,同时释放出用于归一化的零阶矩用于直接构造仿射不变量,能够提高图像矩量的识别率。
在实验中,针对图2里面的灰度图像本申请分别对原图像提取的不变量和变换后的图像分别进行一阶和三阶极半径矩不变量,图3为图2中图像的一阶极半径矩不变量,图4为图2中图像的三阶极半径矩不变量。
由图3和图4可以看出,变换后图像与原始图像的一阶和三阶极半径矩不变量都没有发生变化,说明式(7)所述原图像的仿射不变量矩量的仿射不变性。
本申请实施例将高斯噪声分别添加到图像Coil-20(Columbia University Image Library,哥伦比亚图像数据库,包含20个对象物体)中的灰度图像中,高斯噪声是指服从高 斯分布(正态分布)的一类噪声。噪声强度均值为0,方差分别设置为
表1:图像Coil-20的一阶极半径矩不变量对高斯噪声的平均相对误差
表2:图像Coil-20的三阶极半径矩不变量对高斯噪声的平均相对误差
表1和表2中AMI1-AMI3是目前常用的矩量。AMI1由二阶矩构成,AMI2、AMI3由三阶矩构成,所以一阶极半径矩与AMI1对比,三阶矩与AMI2、AMI3对比。从表1中可以看出本申请一阶矩构造仿射不变量的相对误差一般比利用AMI1、AMI2和AMI3构造的仿射不变量得到的相对误差小。也就是说,本申请利用整数低阶矩量可构造抗噪性较强的仿射不变量。
本申请实施例用灰度图像Coil-20,对每个图像进行仿射变换,变换后的图像添加 均值为0、强度为0、0.00005、
本申请实施例还可以对字母图库测试,在字母图库中,将椒盐噪声添加到二值图 像中。噪声强度分别设置为
表3:字母图库的一阶极半径矩不变量对椒盐噪声的平均相对误差
表4:字母图库的三阶极半径矩不变量对椒盐噪声的平均相对误差
对字母库中每个图像进行仿射变换。变换后的图像添加强度为0、0.0005、
本申请公开了一种基于改造后的图像矩量构造仿射不变量的方法,所述方法包括:将获取到的原图像执行平移变换,得到表示所述原图像的中心几何矩;对所述中心几何矩执行坐标系转换,得到极坐标系下的几何矩;对所述几何矩执行线性变换,得到所述原图像的极半径矩的第一表达式;将所述第一表达式执行推广操作,得到极半径矩的第二表达式;将仿射不变量标准式中的几何矩替换为所述第二表达式,得到所述原图像的仿射不变量;将所述仿射不变量中的参数取不同值,获取不同阶数的图像矩不变量,得到仿射不变特征。本申请可以解决原先仿射不变量对噪声敏感的问题,同时没有增加计算量,可以提高图像矩量的识别率并且对噪声的鲁棒性更佳。说明本申请提供的一种基于改造后的图像矩仿射不变量的图像特征提取方法,在不增加计算量的基础上提高图像仿射不变量的鲁棒性。
机译: 基于在图像编码系统中构造的仿射MVP候选基于仿射运动预测的图像解码方法和装置
机译: 图像编码系统中基于仿射MVP候选列表的仿射运动预测的图像解码方法及装置
机译: 在图像编码系统中使用仿射MVP候选列表的基于仿射运动预测的图像解码方法和装置