法律状态公告日
法律状态信息
法律状态
2017-01-04
授权
授权
2015-02-04
专利申请权的转移 IPC(主分类):G06K9/20 变更前: 变更后: 登记生效日:20150114 申请日:20131011
专利申请权、专利权的转移
2014-03-12
实质审查的生效 IPC(主分类):G06K9/20 申请日:20131011
实质审查的生效
2014-02-05
公开
公开
技术领域
本发明一般涉及计算机模式识别与图像处理领域,具体涉及基于二值图像连 通域统计的答题卡自动评分方法。
背景技术
随着信息技术的发展,计算机处理的数据量越来越大,在很多领域里,亟需 解决海量数据的采集、识别和录入的问题。目前,在高考、成人高考、全国大学 英语等级考试等大型考试已经使用OMR(光学标记阅读机)解决该问题。虽然 OMR技术解决了一些答题卡数据录入的问题,但是由于其自身技术是基于光电 识别技术的,存在许多目前难以解决的问题:(1)设备专用:光电识别机只能 在审阅客观题中使用,主观题仍需使用扫描仪扫描,价格昂贵;(2)答题卡格 式固定:受限于光电头安装位置和排列密度相对固定,对于不同格式的答题卡调 整难度很大,甚至无法满足要求;(3)答题卡制造成本高:OMR答题卡必须为 含铅铜版纸进行彩色印刷且对答题卡裁切精度有严格要求,经济成本、环境成本 高,对于大多数中小学无力承担该费用;(4)纠错流程复杂:OMR技术中,若 在识别的过程中发生异常,必须停机,人工分拣出出错答题卡,逐张人工重新填 涂,才能重新开机识别,大大影响阅卷效率。(5)图像不能保存待查:不能保 存识别过的答题卡图像,判题透明性差,若要查对必须人工从纸质答题卡中重新 分拣出来。
利用图像处理技术对经过扫描的答题卡的数据进行识别和录入是一项新技 术。它除了可以克服上述OMR技术存在的缺陷外,还具有设备、纸张成本低, 识别率及速度可随计算机软、硬件发展不断优化、提升,改卷结果可直接显示在 扫描图像上,判卷透明性高,校对方便等特点。该技术将在计算机阅卷、电子政 务、社会调查数据采集、生产和流通领域的过程管理及其它领域中显示出其良好 的应用前景。
发明内容
本发明针对答题卡识别技术的不足,提供了基于二值图像连通域统计的答题 卡自动评分方法。本发明的目的在于使用计算机图像处理技术解决高准确率的答 题卡自动识别问题,克服现有的OMR技术的缺陷,提供一个成本低、使用简单 的、可靠的答题卡识别方案,具体技术方案如下。
基于二值图像连通域统计的答题卡自动评分方法,包括以下步骤:
(a)从本地磁盘读入一个扫描得到的答题卡图像文件;
(b)对答题卡图像进行倾斜检测及校正;
(c)对步骤(b)中校正后的图像进行校准点检测及定位;
(d)根据步骤(c)中得到的校准点位置以及答题卡描述文件,计算每一个填涂点在 本张图像中的绝对位置;
(e)根据步骤(d)得到的每个填涂点进行识别,判断其是否填涂。
上述基于二值图像连通域统计的答题卡自动评分方法中,步骤(b)包括以下 步骤:
(b-1)将扫描得到的图像转化为灰度图像;
(b-2)读取答题卡描述文件中校准点的类型以及扫描图像的分辨率,生成矩形 的结构元素并使用它对扫描图像进行灰度级形态学闭操作;
(b-3)对步骤(b-2)得到的图像进行二值化,二值化阈值为100,即灰度值大于 100的像素点设为1,否则设为0;
(b-4)计算二值图像中各个连通域的位置并判断数量是否与答题卡描述文件中 的校准点数量一致,如不一致则利用该类型校准点的宽高比以及面积去 除干扰块;
(b-5)分别计算图像上方、下方校准点构成直线的斜率,若上下斜率差值过大, 则认为发生褶皱并提示,否则取两者均值作为倾斜度数,对图像进行倾 斜校正。
上述基于二值图像连通域统计的答题卡自动评分方法中,步骤(c)包括以下 步骤:
(c-1)读取答题卡描述文件中关于水平方向校准点与竖直方向校准点的区域描 述,并根据相对于校准点的位置裁剪出整个水平方向以及竖直方向区域;
(c-2)分别读取答题卡描述文件中水平方向、竖直方向校准点的类型以及扫描 图像的分辨率,生成相对应的矩形结构元素并分别对水平校准点区域、 竖直校准点区域进行灰度级形态学闭操作;
(c-3)对图像进行二值化操作,判断二值图像中连通域数量是否与答题卡描述 文件中的校准点数量一致,如不一致则利用该类型校准点的宽高比以及 面积去除干扰连通域。
上述基于二值图像连通域统计的答题卡自动评分方法中,步骤(d)使用步骤 (c)得到的各个连通域的最小外接矩形,计算校准点边界,并根据答题卡描述文 件,计算出各题中各个选项的在本图像中的绝对位置。
上述基于二值图像连通域统计的答题卡自动评分方法中,计算边界时加入了 边界缓冲区,其上、下、左、右边界计算方法为:top=y-h×edge_rate, buttom=y+h×(1+edge_rate),left=x-w×edge_rate, right=x+w×(1+edge_rate),其中x、y、w、h、edge_rate分别表示连通 域最小外接矩形的左上角横、纵坐标,矩形的宽、高以及边缘缓冲率,边缘缓冲 率设为0.3。
上述基于二值图像连通域统计的答题卡自动评分方法中,步骤(d)包括以下 步骤:
(e-1)根据步骤(d)得到的填涂点位置,将同一题的所有填涂点区域提取出来。
(e-2)对每一题区域计算自适应阈值并进行二值化
(e-3)根据步骤(c)中得到的校准点的大小计算填涂面积阈值:
threshold=s×0.15。
(e-4)对每个填涂点区域,若二值图像值为1的区域大于填涂面积阈值,则认 为填涂,否则认为没有填涂。
上述基于二值图像连通域统计的答题卡自动评分方法中,步骤(e-2)中使用 最大类间方差法计算自适应二值化阈值,类间方差法计算方法如下: g=ω0ω1(μ0-μ1)2,其中g为类间方差,ω0、ω1分别为灰度值小于、大于阈 值T的像素点占整幅图像的比例,μ0、μ1分别为灰度值小于、大于阈值T的像 素点的平均灰度;最大类间方差法阈值计算方法为分别计算T从0到255对应 的类间方差法g的大小,取g最大的时候对应的T即为所求。
上述基于二值图像连通域统计的答题卡自动评分方法中,步骤(e-2)中,把 自适应阈值计算结果用于区分未作答与扫描仪噪声,对于自适应二值化阈值大于 230的情况,认为该题未作答。
本发明采用常用的扫描仪作为输入设备;识别答题卡中的校准点是识别答题 卡的关键操作,本发明通过灰度级形态学闭操作的方式去除非校准点外的其他因 素的影响;通过答题卡中的校准点的位置,对扫描图像进行精确的倾斜校正,并 计算出各题选项在这张答题卡中的绝对位置;通过一定的数据格式将答题卡各题 的选项的上、下、左、右边界记录下来,达到快速提取各题选项区域的目的;将 同一道题的区域提取出来,计算出自适应二值化阈值并对该区域二值化,然后根 据连通域面积对该题每个选项逐一识别是否填涂,最后输出结果。
与现有技术相比,本发明具有如下优点和技术效果:
相对于OMR(光学标记阅读机)技术本发明克服了设备专用、答题卡格式 固定、答题卡制造成本高、纠错流程复杂、图像不能保存待查等缺点,并具有识 别率及速度可随计算机软、硬件发展不断优化、提升,改卷结果可直接显示在扫 描图像上,判卷透明性高,校对方便等特点。相对于其他基于图像处理的技术, 本发明具有对答题卡扫描时的倾斜、移位、轻微褶皱不敏感的优点,用户不必再 因为扫描时的轻微异常而重新扫描答题卡,大大减少了重复劳动。本发明采用自 适应阈值的方法判断填涂与否,对于不同的填涂深浅均可有效检测,兼容单选、 多选题,并能有效区分擦除不净、未作答及多选的情况;对扫描设备的宽容度高, 能适应不同分辨率的扫描以及不同扫描仪带来的噪声。用户不用再担心因为扫描 仪更换、扫描分辨率改变而更换新的识别技术。
附图说明
图1为实施方式中基于二值图像连通域统计的答题卡自动评分方法的流程 图。
具体实施方式
以下结合附图对本发明的实施方式作进一步说明,但本发明的实施不限于 此。
如图1,基于二值图像连通域统计的答题卡自动评分方法的主要流程包括 以下步骤:
(a)从本地磁盘读入一个扫描得到的答题卡图像文件;
(b)对答题卡图像进行倾斜检测及精确校正。
(c)对步骤(b)中校正后的图像进行校准点检测及定位;
(d)根据步骤(c)中得到的校准点位置以及答题卡描述文件,计算每一个填涂点在 本张图像中的绝对位置;
(e)根据步骤(d)得到的每个填涂点进行识别,判断其是否填涂。
步骤(a)允许用户通过文件选择窗口从本地硬盘选择多个图像文件或一个文 件夹作为答题卡图像数据源,图像文件要求是jpg格式文件。
步骤(b)灰度级形态学闭操作去除与校准点无关的因素的影响,灰度级形态 学闭操作是图像处理的常用操作,其主要原理是:将图像先进行灰度级腐蚀操作 再进行灰度级膨胀操作。灰度级腐蚀操作将结构元素中心对应的图像像素点的灰 度值设为结构元素覆盖的图像区域中所有像素中最小的灰度值,而灰度级膨胀操 作将结构元素中心对应的图像像素点的灰度值设为结构元素覆盖的图像区域中 所有像素中最大的灰度值。
步骤(b)包括以下步骤:
(b-1)将扫描得到的图像转化为灰度图像;
(b-2)读取答题卡描述文件中校准点的类型以及扫描图像的分辨率,生成矩形 的结构元素并使用它对扫描图像进行灰度级形态学闭操作;
(b-3)对步骤(b-2)得到的图像进行二值化;
(b-4)计算二值图像中各个连通域的位置并判断数量是否与答题卡描述文件中 的校准点数量一致,如不一致则利用该类型校准点的宽高比以及面积去 除干扰块;
(b-5)分别计算图像上方、下方校准点构成直线的斜率,若上下斜率差值过大, 则认为发生褶皱并提示,否则取两者均值作为倾斜度数,对图像进行倾 斜校正;
步骤(c)灰度级形态学闭操作去除与校准点无关的因素的影响,其原理与步 骤(b)中的一致。
步骤(c)包括以下步骤:
(c-1)读取答题卡描述文件中关于水平方向校准点与竖直方向校准点的区域描 述,并根据相对于校准点的位置裁剪出整个水平方向以及竖直方向区域;
(c-2)分别读取答题卡描述文件中水平方向、竖直方向校准点的类型以及扫描 图像的分辨率,生成相对应的矩形结构元素并分别对水平校准点区域、 竖直校准点区域进行灰度级形态学闭操作;
(c-3)对图像进行二值化操作,判断二值图像中连通域数量是否与答题卡描述 文件中的校准点数量一致,如不一致则利用该类型校准点的宽高比以及 面积去除干扰连通域;
步骤(d)将步骤(c)所识别到的校准点用特定数据格式将校准点的边界存储下 来。特定数据格式具体如表1所示。这里是通过记录校准点在答题卡图像数据中 的位置,用以快速定位答题卡中各道题目的选项对应的位置。
表1保存校准点边界的数据格式
步骤(e)采用最大类间方差法对每道题对应区域图像计算自适应二值化阈 值,并二值化。最大类间方差法是一种自适应的阈值确定的方法,它是按图像的 灰度特性,将图像分成背景和目标两部分。背景和目标之间的类间方差越大,说 明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标 都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。 类间方差法计算方法如下:g=ω0ω1(μ0-μ1)2,其中g为类间方差,ω0、ω1分 别为灰度值小于、大于阈值T的像素点占整幅图像的比例,μ0、μ1分别为灰度 值小于、大于阈值T的像素点的平均灰度;最大类间方差法阈值计算方法为分别 计算T从0到255对应的类间方差法g的大小,取g最大的时候对应的T即为所 求。
步骤(e)包括以下步骤:
(e-1)根据步骤(d)得到的填涂点位置,将同一题的所有填涂点区域提取出来。
(e-2)对每一题区域计算自适应阈值并进行二值化
(e-3)根据步骤(c)中得到的校准点的大小计算填涂面积阈值:
threshold=s×0.15。
(e-4)对每个填涂点区域,若二值图像值为1的区域大于填涂面积阈值,则认 为填涂,否则认为没有填涂。
步骤(e-4)中,对于自适应二值化阈值大于230的情况,认为该题未作答,以区 分未作答与扫描仪噪声。其原理是:考生为作答时,理想图像中应该是纯白的, 所有像素灰度值均为255,全为背景,没有前景,但实际扫描图像存在噪声,存 在噪声不为255的点,使得最大类间方差法错误把噪声以为是前景。
机译: 基于N-GRAM统计量的文档自动分类训练装置及其基于N-GRAM统计量的文档自动分类训练方法
机译: 基于N-gram统计信息的文档训练和分类的自动装置及其基于N-gram统计信息的文档训练和分类的自动方法
机译: 基于审美的照片自动评分方法