首页> 中国专利> 基于SuperPoint算法的铁路列车图像配准方法及设备

基于SuperPoint算法的铁路列车图像配准方法及设备

摘要

基于SuperPoint算法的铁路列车图像配准方法及设备,属于铁路列车图像处理技术领域。本发明为了解决现有的铁路列车图像配准方法存在不能兼顾配准效果、运行时间和占用内存的问题。本发明针对铁路列车图像配准的图像,采用SuperPoint网络进行处理,改进特征点提取网络中NMS策略中,增加局部区域判断,以及根据区域亮度及对比度自适应调整得分筛选阈值功能,从而提升网络在车头车尾区域和暗部区域的特征点提取密度,在特征点匹配的过程中,按照匹配得分依次进行不放回配对,并增加误匹配对过滤步骤;最后根据匹配点坐标信息进行全局变换进而实现图像配准。

著录项

  • 公开/公告号CN116664643A

    专利类型发明专利

  • 公开/公告日2023-08-29

    原文格式PDF

  • 申请/专利号CN202310773920.6

  • 发明设计人 陈雨萌;

    申请日2023-06-28

  • 分类号G06T7/33(2017.01);G06T7/11(2017.01);G06T7/136(2017.01);G06T3/00(2006.01);

  • 代理机构哈尔滨市松花江专利商标事务所 23109;

  • 代理人时起磊

  • 地址 150060 黑龙江省哈尔滨市经开区哈平路集中区潍坊路2号

  • 入库时间 2024-01-17 01:26:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-15

    实质审查的生效 IPC(主分类):G06T 7/33 专利申请号:2023107739206 申请日:20230628

    实质审查的生效

  • 2023-08-29

    公开

    发明专利申请公布

说明书

技术领域

本发明属于铁路列车图像处理技术领域,具体涉及一种铁路列车图像配准方法及设备。

背景技术

一些铁路列车自动检测等相关任务借助图像处理来完成。由于铁路过车因不同时间经过相机的列车运行速度不同、相机响应速度不同导致拍摄的车身照片中局部拉伸尺度不一致等原因,会对部件子图的切分及不同时间相同车辆的对比造成不便,这种情况下需要对图像进行配准,即根据标准车型分布图配准因过车速度变化导致局部拉伸参差的图像。常用的图像配准方法SIFT虽然已经被OpenCV封装好可直接调用,但配准效果、内存占用和运行时间均不理想,无法满足当前的性能指标需求。

SuperPoint深度学习算法常用于自然图像配准与视频逐帧追踪物体,其使用特征点提取的预训练权重以及描述符提取的自监督方法,提升特征提取能力与特征点检测的能力。基于SuperPoint的现有模型在铁路车身图片测试集上虽然在部分车身部件边缘上提取效果较好,但因输入图片宽高比过大,在车头车尾轮廓特征点提取效果不理想。

发明内容

本发明为了解决现有的铁路列车图像配准方法存在不能兼顾配准效果、运行时间的问题。

基于SuperPoint算法的铁路列车图像配准方法,包括以下步骤:

步骤一、针对铁路列车图像配准的图像A和B,采用SuperPoint网络提取特征点及描述符;

所述采用SuperPoint网络提取特征点及描述符的过程包括对采用改进NMS策略对特征点进行局部阈值筛选的步骤,具体包括以下步骤:

先采用像素横坐标进行判断,在车头车尾处NMS使用阈值K1,车体中部区域NMS使用阈值K2,K1<K2;区域处于车头车尾时,阈值K1半径范围内的备选特征点保留最大得分,其余删去;当区域处在车体中部区域时,K2根据区域图像亮度与对比度确定:首先设置一个NMS值,然后根据区域图像亮度与对比度确定所对应地区是否为过曝或过暗区域,如果是NMS范围取值增大;

步骤二、基于描述符译码器网络,进行特征点匹配;

返回待匹配的多幅图像中匹配特征点的绝对坐标矩阵,作为后续图像变换步骤的输入;

步骤三、根据匹配点坐标信息进行全局仿射变换,进而实现图像配准。

进一步地,采用SuperPoint网络提取特征点及描述符之前,对特征点提取模型的半监督训练及微调处理:

将SuperPoint特征点提取译码器作为预训练模型,采用直推式半监督算法在部分标记的铁路列车图像数据集上进一步迭代训练特征点提取模型,首先标记少量铁路车身图像上的特征点作为有标签样本集,同时利用有标签样本与无标签样本对模型进行训练,并在训练过程中预测无标签样本,多轮迭代后获取更适合铁路车身真实图像数据集的模型权重应用于特征点提取网络中。

进一步地,步骤二进行特征点匹配的过程利用改进的特征点匹配策略进行特征点匹配;所述的改进的特征点匹配策略如下:

(A)最近邻匹配策略优化:

SuperPoint算法中使用最近邻匹配算法根据描述符计算结果对特征点进行匹配,根据N×M维描述距离矩阵结果进行逐行遍历,矩阵的第i行向量对应前帧图像A上第i个特征点x

(B)不放回配对策略遍历:

基于步骤一提取特征点,比较M与N大小,以提取特征点点数少的图像特征点作为遍历对象,依照以上改进后的匹配策略进行不放回配对:假设N

进一步地,在步骤二进行特征点匹配的过程中,若局部特征点分布稠密且区域内存在重复性边角结构时,则采用误匹配对过滤对结果进行优化,否则,则直接采用特征点匹配结果。

进一步地,所述的进行误匹配对过滤的过程包括以下步骤:

通过单应性变换计算特征点对匹配的空间合理性,保留合理性分数高于空间合理性阈值的匹配点对,低于阈值则抛弃,并对特征点对进行横向排序,计算点的间隔信息再对特征点对进行取舍。

进一步地,所述空间合理性阈值利用RANSAC算法确定。

进一步地,根据匹配点坐标信息进行全局仿射变换的过程中,根据特征点横坐标的大小进行排序,并将图B中匹配点纵坐标替换为图A中对应点纵坐标,针对待处理图像从左至右取最边缘两点及位置处于横向坐标中位数的点作为仿射变换矩阵的计算输入,使用仿射变换方法对待配准图像进行变换。

进一步地,使用仿射变换方法对待配准图像进行变换的过程中,对图像进行横向分段,分段使用仿射变换方法对待配准图像进行变换;对图像进行横向分段的依据为特征点横坐标。

一种计算机存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现所述的基于SuperPoint算法的铁路列车图像配准方法。

一种基于SuperPoint算法的铁路列车图像配准设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现所述的基于SuperPoint算法的铁路列车图像配准方法。

有益效果:

1、本发明采用的模型是在计算机渲染生成的模拟图形数据集上进行预训练,并结合铁路真实图片半监督训练而得,对边、角等物体轮廓边缘上灰度值变化剧烈的特征点提取数量充分,较SuperPoint原模型更适合处理铁路列车灰度图像,对车头车尾轮廓特征点具有良好的提取效果,且配准效果较SIFT、SURF等传统图像配准算法更好,运行速度更快。

3、改进特征点匹配策略,并利用空间透视逆变换对配准得到的特征点进行合理性推断,对SuperPoint初步匹配得到的特征点对进行空间过滤,在降低计算量大小的同时可以提升配准效果。

3、本领域现使用的经典图像配准算法为SIFT(Scale Invariant FeatureTransform)、SURF(Speeded Up Robust Features)等精度高但计算占用内存及所需时间过高。而本发明采用了基于SuperPoint深度学习算法的改进算法,不仅减少了内存占用,而且此种方式使用特征点提取的预训练权重以及描述符提取的自监督方法,提升特征提取能力与特征点检测的能力,在对于存在噪声点的真实图片的特征点提取上表现更稳健,即抗干扰能力更强。

4、针对铁路车身图像特点及尺寸大小,采用分段抽取特征点对的方法,对车身进行特征点稠密区域定义划分,采用不同的阈值标准进行筛选以提高车身图像配准的精确度,并且对车身横向采用改进后单维度仿射变换,避免纵向行差的横向扩散导致的配准后车身歪斜情况。

附图说明

图1为SuperPoint网络结构示意图。

图2为直推式半监督学习过程示意图。

图3为特征点匹配的过程示意图。

图4为基于改进SuperPoint算法的图像配准流程示意图。

图5为不放回配对策略遍历示例图。

图6为应用本发明的铁路列车车身局部配准效果示例图。

图7为应用本发明的铁路列车车身整体配准效果缩略图。

具体实施方式

本发明基于SuperPoint算法做出如下方面的改进:

1、对特征点提取模型权重在铁路车身图片集上进行预训练及微调,提升模型在车头车尾及车身轮廓处的特征点提取效果。

2、改进特征点提取网络中非极大值抑制(Non-Maximum Suppression,NMS)策略:增加局部区域判断,以及根据区域亮度及对比度自适应调整得分筛选阈值功能,从而提升网络在车头车尾区域和暗部区域的特征点提取密度。

3、优化特征点策略:计算匹配得分引入已配对点相对位置参考,并按照匹配得分依次进行不放回配对,即每个特征点仅进行一次配对。

4、增加误匹配对过滤步骤:针对算法配对结果进行空间透视逆变换计算合理性得分,去除误匹配对。

5、依据返回匹配点的坐标信息计算图片变换矩阵:SuperPoint算法源码仅返回特征点配对后在图片上的相对运动轨迹,本发明增加了图像变换步骤以便后续统一尺度识别处理,根据车身图片特点采用横向分段仿射变换。

本发明可以有效的解决现有的铁路列车图像配准方法存在不能兼顾配准效果、运行时间和占用内存的问题。

下面结合具体实施方式对本发明做进一步说明。

具体实施方式一:

本实施方式为基于SuperPoint算法的铁路列车图像配准方法,包括以下步骤:

步骤一、针对铁路列车图像配准的图像A和B,采用改进SuperPoint网络提取特征点及描述符:

SuperPoint网络中的特征点提取译码器与描述符译码器结构如图1所示,输入全尺寸图像,编码器进行降尺寸特征图提取,将获得的特征图分别输入特征点检测译码器与描述符译码器,特征点检测译码器计算全尺寸图像像素特征点概率,在推断阶段使用NMS获取特征点检测结果,描述符译码器用于产生对特征点进行全局描述的多维描述符。应用改进后网络,从输入图像中提取特征点及应用描述符匹配的基本流程如图3所示。

1、特征点提取模型半监督训练及微调:

半监督学习方法是将SuperPoint特征点提取译码器作为预训练模型,在部分标记的铁路列车图像数据集上进一步迭代训练特征点提取模型,提升模型在真实数据集上的泛化能力。本发明中应用的是直推式半监督(transductive learning)算法(如图2所示),标记少量铁路车身图像上的特征点作为有标签样本集,同时利用有标签样本与无标签样本对模型进行训练,并在训练过程中预测无标签样本,多轮迭代后获取更适合铁路车身真实图像数据集的模型权重应用于特征点提取网络中。

2、NMS策略改进:

在目标检测领域中非极大值抑制策略用于消除多余的检测框,在图像局部区域中寻找分类得分的极大值并保留,以便找到最佳的物体检测位置。常规NMS是将所有特征点进行局部阈值筛选,本发明采用自适应方法,加入目标系数参量:像素的横向坐标、区域图像亮度及对比度。

目标系数参量中先采用像素横坐标进行判断,在车头车尾处NMS使用小阈值(车头车尾处NMS范围取小值),车体中部区域NMS使用大阈值,来提升车头车尾的特征点选取密度。本实施方式中,区域处于车头车尾时,NMS取2,即2x2半径范围内的备选特征点保留最大得分,其余删去;当区域处在其他位置时,NMS值根据区域图像亮度与对比度确定:首先设置一个NMS值,然后根据区域图像亮度与对比度确定所对应地区是否为过曝或过暗区域,如果是NMS范围取值增大,或者取大值。根据区域图像亮度与对比度确定所对应地区是否为过曝或过暗区域的过程中需要将区域图像亮度与对比度归一化到0到1之间。

本发明整体的改进还包括其他改进,这些改进及处理过程结合其他步骤进行说明。

步骤二、基于描述符译码器网络,进行特征点匹配,并对并过滤误匹配对;进行特征点匹配的过程利用改进的特征点匹配策略进行特征点匹配;

SuperPoint的描述符译码器网络:通过提取SuperPoint特征点提取译码器获得的N个特征点,则有3×N维特征向量描述,包含每个特征点的横纵坐标及置信度,并按照置信度得分降序排列,作为描述符译码器(description decoder)的输入,描述符译码器网返回的是根据所有特征点在全局图像上的相对距离计算出的256×N维正则化描述向量。该向量会应用于后续多幅图像上的特征点匹配阶段,采用最近邻匹配(Nearest NeighborMatching)方法计算:假设前帧图像A上提取到N个特征点,后一帧图像B上提取到M个特征点,计算得出它们之间相对距离得到N×M维描述距离矩阵,根据距离大小升序排列,并手动设定距离阈值,保留距离小于阈值的特征点对,大于阈值的点对则删去。因为计算得到的距离值越大,证明两特征点在对应图像上空间相对分布的差异度越大。

步骤一从特征点提取译码器中得到的是两个列表,图像A与B中所提取到的特征点及其置信度,步骤二开始简单说明描述符译码器的工作原理,描述符译码器如图1在原算法中是与特征点提取并列的网络,该网络返回下面步骤(A)中的输入N×M维度描述距离矩阵。

步骤(A)是匹配顺序(特征点置信度降序,逐行)、最近邻范围的划分(每行保留k个最近邻)与最优判定原则。

步骤(B)是遍历过程中的不放回原则(每匹配成功一对,待遍历矩阵自动行列维度-1)以及进一步在操作层面上解读(A)中提到的最优判定原则(行单谷极小值,及判定为非行单谷极小值时扩大遍历范围,进行m列二维遍历。

(B)是对(A)的下一层执行逻辑。

改进特征点匹配,并过滤误匹配对的过程包括以下步骤:

S201、利用改进的特征点匹配策略进行特征点匹配;所述的改进的特征点匹配策略如下:

(A)最近邻匹配策略优化:

SuperPoint算法中使用最近邻匹配算法(k-Nearest Neighbour)根据描述符计算结果对特征点进行匹配,该算法的原则是根据N×M维描述距离矩阵结果(descriptordistance,矩阵中的元素为图像A中提取的N个特征点对应的256×N维描述符与图像B中提取的256×M维描述符之间的欧氏距离,即描述距离)进行逐行遍历,矩阵的第i行向量对应前帧图像A上第i个特征点x

描述符计算图像上点对间的描述距离是对图像A上的特征点相对位置关系与图像B上特征点相对位置关系进行对比,判断图像A上的特征点相对位置关系与图像B上特征点相对位置关系是否满足旋转不变性和尺度不变性,不满足则放弃该点对,满足则保留,按照该原则遍历N个特征点。

上述过程中,降序排列的是特征点的置信度,置信度越高意味着特征点“越显著”,如果只先确定最“显著”特征点的最佳匹配结果,这样会导致图像特征点富集区域误配率较高,因此本发明优先处理“显著”特征点配对,然后找该点对应行上最小的元素值。

(B)不放回配对策略遍历:

为减小运算量并找到全局相对最优匹配结果,基于步骤一提取特征点,比较M与N大小,以提取特征点点数少的图像特征点作为遍历对象,依照以上改进后的匹配策略进行不放回配对:假设图像A中提取的特征点个数少于图像B中提取的特征点个数,即N

(N-i+1)代表当前矩阵剩余待遍历行数,也就是图A中未匹配点个数,m为设定的在[x,2x]范围内的前m个最小值,实际是列数。

以图5为例简单说明(B)遍历过程:取N=3,M=4,k=3,m=2情况,即图像A中提取到3个特征点,图像B中提取到4个特征点,因N

针对待遍历列表待遍过程,相当于双循环,若行数<列数,先遍历行,再遍历列,匹配成功的列不参与接下来的循环,所以待处理矩阵每经过一轮迭代行数与列数均-1,近最优匹配的同时减少计算量。

改进后的特征点匹配结果与原SuperPoint匹配算法进行定性对比,发现车身图像特征点误匹配率得到有效抑制,改进后特征点全局误配率下降达6%。

S202、进行误匹配对过滤:

在Superpoint实际车身配准应用情景中,位于车身上重复部件区域的特征点易出现误匹配现象,如栅格、车门等,进而会导致全局变换出错。且因铁路列车身图片通常较宽,会出现车身图片宽高比例远大于20,使得传入检测网络后无输出或计算超时。此外,部分车身边角信息丰富区域(如格栅、车身水渍等区域)特征点富集,会加长计算配准时间,实际应用中也需要根据车身长度分区域进行特征点对抽样选取对车身进行分段配准及变换。

本发明加入特征点匹配对过滤步骤,通过单应性变换计算特征点对匹配的空间合理性,设置空间合理性阈值(空间合理性阈值利用RANSAC算法确定),保留合理性分数高于阈值的匹配点对,低于阈值则抛弃,并对特征点对进行横向排序,计算点的间隔信息再对特征点对进行取舍,再根据过滤后的配准特征点对进行下一步图像变换。改进后的整体图像处理流程如图4。计算点的间隔信息再对特征点对进行取舍的过程利用现有技术根据实际需要进行取舍即可,在本实施方式中,车头尾处特征点每隔图像宽度0.0014倍取,车中段每隔图像宽度的0.0043倍取,其他舍掉。

在匹配过程中,若局部特征点分布较稠密,且区域内存在重复性边角结构(如格栅)时,则采用该空间误匹配对过滤方案对结果进行优化,而对于区域内不存在重复性边角结构的情况,则直接采用SuperPoint深度学习算法处理后返回的结果。

此外,本发明改动SuperPoint的返回结果,使SuperPoint算法返回待匹配的多幅图像中匹配特征点的绝对坐标矩阵;

原SuperPoint算法定义了特征点追踪类用于计算特征点在连续图像帧上得分及描述符,返回的结果为匹配后特征点相对位移轨迹矩阵,本发明改动SuperPoint算法使其返回待匹配的多幅图像中匹配特征点的绝对坐标矩阵,作为后续图像变换步骤的输入。

步骤三、根据匹配点坐标信息进行全局变换:

经对比仿射变换及透视变换直接应用后的配准效果,常出现车身偏移歪斜等情况,且透视变换为三维空间变换,对特征点的匹配精度及坐标关系要求较高,当输入存在误匹配点对时会导致图像在另个维度上的偏移。假设一对待处理的两张包含相同物体但存在相对位移及尺度变换的图像分别为图A与图B,深度学习的特征点提取及匹配算法在处理特征点富集区域图像时常出现图A中一点匹配至图B目标点邻域点的误匹配情况,会导致变换后车体图像完全不可视。虽然在调整算法的特征点置信度阈值及匹配半径阈值后匹配准确度提升,但车身配准任务中需要车头车尾处的特征点充足,修改阈值后会导致车尾处无特征点匹配对从而车尾部分完全失配。

在结合车体配准需求总结了误匹配现象的规律后,本发明改进仿射变换应用,提升了配准结果对邻域误匹配现象的包容度,即邻域误配不影响对应段车体的配准效果。

因改进SuperPoint算法返回的备选特征点较多,仿射变换仅需三点坐标计算即可求出全局变换矩阵,故在匹配特征点的选取上需要谨慎选取,一旦选中误匹配点或三点无法涵盖全局尺度位移信息,会导致图像失配。因此在剔除误匹配(不满足逆透视变换原理)及匹配准确度低于阈值的特征点对后,根据特征点横坐标的大小进行排序,并将图B中匹配点纵坐标替换为图A中对应点纵坐标,针对待处理图像(图A或图B,可以选择以图A为参考,拉伸图B使得变换后布局与A相同,也可以以B为参考拉伸A使得变换后布局与B相同)从左至右取最边缘两点及位置处于横向坐标中位数的点作为仿射变换矩阵的计算输入。这样相当于仅对车身进行横向拉伸,纵向因行车高度及摄影设备相对高度无变化,因此纵向往往无需配准。邻域误配现象往往发生在特征点富集区域,一般是图A中特征点匹配至图B中目标点上或下方特征点,误匹配点与目标点的横向坐标差异很小,因此该策略可消除该误配现象带来的影响。

本发明中使用仿射变换方法对待配准图像进行变换,结合改进后SuperPoint算法及实际列车车身配准的任务需求,对图像进行横向分段处理,降低了误匹配点对带来的全局变换影响。

对图像进行横向分段处理是依据上一步过滤后保留的特征点横坐标分的段。例如从最左侧到第三个特征点横坐标段就按前三对特征点坐标变换进行分段,最右端同理。由于这里是按特征点匹配结果对图像分段的,匹配后的特征点是成对的,在图A上有α个,图B上也是α个,所以分得的段数是一致的,需要变换的区域也是对应的。

仿射变换原理为对原图(待处理图像)中所有坐标点进行线性变换及平移,设原始坐标为(x,y),经仿射变换后的坐标为(x’,y’),m

根据上式可定义仿射变换矩阵M为:

图像中点坐标变换关系为:

因本发明实际应用中不涉及面内过度旋转的场景,采用改进后的SuperPoint在铁路列车车身配准的效果很好,对比同一待配准图像对的处理结果上,对比以往常用的SIFT算法,改进后的SuperPoint配准方法运行时间提升至0.7秒,计算占用的内存更少,且提取到的特征点更为均匀丰富。

图6为铁路列车车身局部配准效果示例图,其中第一行为历史待配准图像,第二行为经过配准及仿射变换后的历史图像,第三行为当前参考图像,可见待配准的两图不仅在尺度上存在差异,水平方向上也存在相对位移,图中灰点为过滤后的匹配特征点对,其连线的倾斜程度可以体现车身的相对位移,图中相邻位置匹配点连线均相互平行,体现空间合理性过滤步骤对提升剩余特征点配准效果的作用。利用本发明对同一车身图像局部配准的结果如表1所示

表1同一车身图像局部配准定性对比

图7为应用本发明的铁路列车车身整体配准效果缩略图,由左至右分别为:历史车身图像、当前车身图像、配准后历史车身图像。

具体实施方式二:

本实施方式为一种计算机存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现所述的基于SuperPoint算法的铁路列车图像配准方法。

应当理解,指令包括本发明描述的任何方法对应的计算机程序产品、软件或计算机化方法;所述指令可以用于编程计算机系统,或其他电子装置。计算机存储介质可以包括其上存储有指令的可读介质,可以包括但不限于磁存储介质,光存储介质;磁光存储介质包括只读存储器ROM、随机存取存储器RAM、可擦除可编程存储器(例如,EPROM和EEPROM)以及闪存层,或者适合于存储电子指令的其他类型的介质。

具体实施方式三:

本实施方式为基于SuperPoint算法的铁路列车图像配准设备,所述设备包括处理器和存储器,应当理解,包括本发明描述的任何包括处理器和存储器的设备,设备还可以包括其他通过信号或指令进行显示、交互、处理、控制等以及其他功能的单元、模块;

所述存储器中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现所述的基于SuperPoint算法的铁路列车图像配准方法。

本发明的上述算例仅为详细地说明本发明的计算模型和计算流程,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号