公开/公告号CN113095187A
专利类型发明专利
公开/公告日2021-07-09
原文格式PDF
申请/专利权人 杭州云梯科技有限公司;
申请/专利号CN202110354541.4
申请日2021-04-01
分类号G06K9/00(20060101);G06K9/46(20060101);G06K9/62(20060101);
代理机构34147 合肥律众知识产权代理有限公司;
代理人侯克邦
地址 310000 浙江省杭州市余杭区仓前街道龙园路88号2幢301室
入库时间 2023-06-19 11:45:49
技术领域
本发明涉及图像处理技术领域,尤其涉及是一种基于图像特征匹配对齐的试卷批改方法。
背景技术
随着2020年疫情的出现,在线教育发展迅速,很多企业开始开发在线AI作业批改等软件,完善在线教育链条,为用户提供便利。这种在线批改试卷的方式大大提高了工作效率。
现有技术中,常见的试卷批改都是直接基于用户拍摄的图像进行题目检测,然后分别对每一个题目进行OCR识别,包括题目的识别和手写答案的检测识别,再在题库中去检索最相似的题目,并匹配答案的正确与否。
然而,基于OCR识别的在线试卷批改方式,并不关心答案位置是否正确,有时会因为随意拍照导致出现搜不到相似题的情况。并且容易出现基于模型预测的题目切割不准确的问题。
发明内容
针对现有的试卷在线批改的技术问题,本发明提出的一种基于图像特征匹配对齐的试卷批改方法能够使得在线批改准确无误。
一种基于图像特征匹配对齐的试卷批改方法,该方法包括如下步骤S1至S6:
S1,获取待识别的原始试卷图像和目标试卷图像;
进一步地,所述原始试卷图像通过相机采集,所述目标试卷图像为试卷模板PDF页。
S2,利用图像提取算法,提取原始试卷图像和目标试卷图像的图像特征;
进一步地,所述图像提取算法采用SIFT算法,所述SIFT算法具有对图像的旋转和尺度变化具有不变性,对三维视角变化和光照变化具有很强的适应性,并且能够在海量的信息中进行快速、准确地提取特征。
更进一步地,具体特征提取过程为:首先,搜索所有尺度上的图像位置,通过高斯微分函数来识别潜在的对于尺度和旋转不变的候选关键点;然后,在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度,同时关键点的选择依据于它们的稳定程度;接着,基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向,所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换;之后,在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度;最后,输出特征向量。
S3,对匹配点数设置一定的阈值,利用匹配算法,对提取到的图像特征进行匹配,若低于阈值,输出两张图像不对应,否则输出相匹配的图像特征;
进一步地,所述匹配算法采用暴力匹配算法,所述暴力匹配算法通过一一匹配的方式,保证匹配结果的准确性,匹配的标准是根据描述特征点的128维向量之间的欧氏距离来计算,通过比较两个图像特征的关键点描述符,并找到所述两个图像特征的共同之处。
S4,通过相匹配的图像特征,利用迭代算法得到转换的单应性矩阵,通过对拍摄图像按照单应性矩阵进行变换,输出原始试卷图像到目标试卷图像的一个对齐图像;
进一步地,所述迭代算法采用RANSAC算法,所述RANSAC算法通过采用多次随机采样的方法,能鲁棒的估计模型参数。
S5,由于图像对齐变换的过程会增加部分图像,所述部分图像是按计算得到的一个固定像素值填充的,根据该像素值,将所述部分图像抠掉,达到对齐图像只保留采集的原始试卷图像的效果;
S6,在得到上述对齐图像之后,利用每个答案在目标试卷图像中的区域位置,在原始试卷图像上定位,将对应位置区域的手写字进行识别,最后与各个区域对应的标准答案进行匹配批改。
本发明的有益效果:1、和市面上的AI试卷批改相比,本发明能够使得批改准确无误,避免出现搜不到相似题的问题;2、本发明避免出现出现基于原始试卷题目切割不准确的问题,也避免了对于答题区域不精确定位的问题;3、本发明能够允许用户随意拍照试卷的某一部分,只对这一部分进行批改。
附图说明
图1为基于图像特征匹配对齐的试卷批改方法的流程图;
图2为拍摄的原始试卷示例图;
图3为目标试卷PDF页示例图;
图4为原始试卷与目标试卷特征匹配图;
图5为原始试卷与目标试卷对齐图;
图6为对齐图像只保留采集的原始试卷图;
图7为原始试卷和目标试卷匹配批改图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。本发明的实施例是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显而易见的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
实施例1
一种基于图像特征匹配对齐的试卷批改方法,如图1所示,该方法包括如下步骤S1至S6:
S1,获取待识别的原始试卷图像和目标试卷图像;
其中,所述原始试卷图像通过相机采集,所述目标试卷图像为试卷模板PDF页。
S2,利用图像提取算法,提取原始试卷图像和目标试卷图像的图像特征;
优选地,所述图像提取算法采用SIFT算法,所述SIFT算法具有对图像的旋转和尺度变化具有不变性,对三维视角变化和光照变化具有很强的适应性,并且能够在海量的信息中进行快速、准确地提取特征。
其中,具体特征提取过程为:首先,搜索所有尺度上的图像位置,通过高斯微分函数来识别潜在的对于尺度和旋转不变的候选关键点;然后,在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度,同时关键点的选择依据于它们的稳定程度;接着,基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向,所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换;之后,在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度;最后,输出特征向量。
S3,对匹配点数设置一定的阈值,利用匹配算法,对提取到的图像特征进行匹配,若低于阈值,输出两张图像不对应,否则输出相匹配的图像特征;
优选地,所述匹配算法采用暴力匹配算法,所述暴力匹配算法通过一一匹配的方式,保证匹配结果的准确性,匹配的标准是根据描述特征点的128维向量之间的欧氏距离来计算,通过比较两个图像特征的关键点描述符,并找到所述两个图像特征的共同之处。
S4,通过相匹配的图像特征,利用迭代算法得到转换的单应性矩阵,通过对拍摄图像按照单应性矩阵进行变换,输出原始试卷图像到目标试卷图像的一个对齐图像;
优选地,所述迭代算法采用RANSAC算法,所述RANSAC算法通过采用多次随机采样的方法,能鲁棒的估计模型参数。
S5,由于图像对齐变换的过程会增加部分图像,所述部分图像是按计算得到的一个固定像素值填充的,根据该像素值,将所述部分图像抠掉,达到对齐图像只保留采集的原始试卷图像的效果;
S6,在得到上述对齐图像之后,利用每个答案在目标试卷图像中的区域位置,在原始试卷图像上定位,将对应位置区域的手写字进行识别,最后与各个区域对应的标准答案进行匹配批改。
实施例2
以一张试卷的一页为例,说明基于图像特征匹配对齐的试卷批改方法的具体过程。
步骤1:通过相机采集原始试卷图像,目标试卷图像使用试卷模板PDF页;参见图2和图3。
步骤2:采用SIFT算法,提取原始试卷图像和目标试卷图像的图像特征;所述SIFT算法具有对图像的旋转和尺度变化具有不变性,对三维视角变化和光照变化具有很强的适应性,并且能够在海量的信息中进行快速、准确地提取特征。
步骤3:对匹配点数设置一定的阈值,利用暴力匹配算法,对提取到的图像特征进行匹配,若低于阈值,输出两张图像不对应,否则输出相匹配的图像特征;参见图4。
步骤4:通过相匹配的图像特征,利用RANSAC算法得到转换的单应性矩阵,通过对拍摄图像按照单应性矩阵进行变换,输出原始试卷图像到目标试卷图像的一个对齐图像;参见图5。
步骤5:根据该像素值,将增加的部分图像抠掉,达到对齐图像只保留采集的原始试卷图像的效果;参见图6。
步骤6:在得到上述对齐图像之后,利用每个答案在目标试卷图像中的区域位置,在原始试卷图像上定位,将对应位置区域的手写字进行识别,最后与各个区域对应的标准答案进行匹配批改;参见图7。
显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域及相关领域的普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域及相关领域的普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
机译: 使用线特征匹配进行基于图像的导航的系统和方法
机译: 使用线特征匹配进行基于图像的导航的系统和方法
机译: 基于图像中分割区域之间的特征匹配来提取对象的装置和方法