首页> 中国专利> 基于二值图像连通域统计的答题卡自动评分方法

基于二值图像连通域统计的答题卡自动评分方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供基于二值图像连通域统计的答题卡自动评分方法，用户扫描一个答题卡，检测出定位点后，对作答区域进行二值化，然后采用基于二值图像连通域统计的答题卡自动评分方法对图像中各选择题的答案进行识别并评分，然后输出各题目的答案以及成绩。本发明以填涂点相对于标记点的位置来定位填涂点，对于答题卡扫描时的倾斜、移位、轻微褶皱不敏感；采用自适应阈值的方法判断填涂与否，对于不同填涂的深浅均可有效检测，兼容单选、多选题，能有效区分擦除不净及多选的情况。用户不必再因为扫描时的轻微异常而重新扫描答题卡，大大减少了重复劳动。

著录项

公开/公告号CN103559490A

专利类型发明专利
公开/公告日2014-02-05

原文格式PDF
申请/专利权人华南理工大学;
展开▼

申请/专利号CN201310473334.6
发明设计人黄翰;梁椅辉;
展开▼

申请日2013-10-11
分类号G06K9/20(20060101);G06K9/32(20060101);
代理机构44102 广州粤高专利商标代理有限公司;
代理人何淑珍
地址 511458 广东省广州市南沙区环市大道南25号华工大广州产研院
入库时间 2024-02-19 22:23:04

法律信息

法律状态公告日

法律状态信息

法律状态
2017-01-04

授权

授权
2015-02-04

专利申请权的转移 IPC(主分类):G06K9/20 变更前: 变更后: 登记生效日:20150114 申请日:20131011

专利申请权、专利权的转移
2014-03-12

实质审查的生效 IPC(主分类):G06K9/20 申请日:20131011

实质审查的生效
2014-02-05

公开

公开

说明书

技术领域

本发明一般涉及计算机模式识别与图像处理领域，具体涉及基于二值图像连通域统计的答题卡自动评分方法。

背景技术

随着信息技术的发展，计算机处理的数据量越来越大,在很多领域里,亟需解决海量数据的采集、识别和录入的问题。目前，在高考、成人高考、全国大学英语等级考试等大型考试已经使用OMR（光学标记阅读机）解决该问题。虽然 OMR技术解决了一些答题卡数据录入的问题,但是由于其自身技术是基于光电识别技术的，存在许多目前难以解决的问题：（1）设备专用：光电识别机只能在审阅客观题中使用，主观题仍需使用扫描仪扫描，价格昂贵；（2）答题卡格式固定：受限于光电头安装位置和排列密度相对固定，对于不同格式的答题卡调整难度很大，甚至无法满足要求；（3）答题卡制造成本高：OMR答题卡必须为含铅铜版纸进行彩色印刷且对答题卡裁切精度有严格要求，经济成本、环境成本高，对于大多数中小学无力承担该费用；（4）纠错流程复杂：OMR技术中，若在识别的过程中发生异常，必须停机，人工分拣出出错答题卡，逐张人工重新填涂，才能重新开机识别，大大影响阅卷效率。（5）图像不能保存待查：不能保存识别过的答题卡图像，判题透明性差，若要查对必须人工从纸质答题卡中重新分拣出来。

利用图像处理技术对经过扫描的答题卡的数据进行识别和录入是一项新技术。它除了可以克服上述OMR技术存在的缺陷外,还具有设备、纸张成本低，识别率及速度可随计算机软、硬件发展不断优化、提升，改卷结果可直接显示在扫描图像上，判卷透明性高，校对方便等特点。该技术将在计算机阅卷、电子政务、社会调查数据采集、生产和流通领域的过程管理及其它领域中显示出其良好的应用前景。

发明内容

本发明针对答题卡识别技术的不足，提供了基于二值图像连通域统计的答题卡自动评分方法。本发明的目的在于使用计算机图像处理技术解决高准确率的答题卡自动识别问题，克服现有的OMR技术的缺陷，提供一个成本低、使用简单的、可靠的答题卡识别方案，具体技术方案如下。

基于二值图像连通域统计的答题卡自动评分方法，包括以下步骤：

(a)从本地磁盘读入一个扫描得到的答题卡图像文件；

(b)对答题卡图像进行倾斜检测及校正；

(c)对步骤(b)中校正后的图像进行校准点检测及定位；

(d)根据步骤(c)中得到的校准点位置以及答题卡描述文件，计算每一个填涂点在本张图像中的绝对位置；

(e)根据步骤(d)得到的每个填涂点进行识别，判断其是否填涂。

上述基于二值图像连通域统计的答题卡自动评分方法中，步骤(b)包括以下步骤：

(b-1)将扫描得到的图像转化为灰度图像；

(b-2)读取答题卡描述文件中校准点的类型以及扫描图像的分辨率，生成矩形的结构元素并使用它对扫描图像进行灰度级形态学闭操作；

(b-3)对步骤(b-2)得到的图像进行二值化，二值化阈值为100，即灰度值大于 100的像素点设为1，否则设为0；

(b-4)计算二值图像中各个连通域的位置并判断数量是否与答题卡描述文件中的校准点数量一致，如不一致则利用该类型校准点的宽高比以及面积去除干扰块；

(b-5)分别计算图像上方、下方校准点构成直线的斜率，若上下斜率差值过大，则认为发生褶皱并提示，否则取两者均值作为倾斜度数，对图像进行倾斜校正。

上述基于二值图像连通域统计的答题卡自动评分方法中，步骤(c)包括以下步骤：

(c-1)读取答题卡描述文件中关于水平方向校准点与竖直方向校准点的区域描述，并根据相对于校准点的位置裁剪出整个水平方向以及竖直方向区域；

(c-2)分别读取答题卡描述文件中水平方向、竖直方向校准点的类型以及扫描图像的分辨率，生成相对应的矩形结构元素并分别对水平校准点区域、竖直校准点区域进行灰度级形态学闭操作；

(c-3)对图像进行二值化操作，判断二值图像中连通域数量是否与答题卡描述文件中的校准点数量一致，如不一致则利用该类型校准点的宽高比以及面积去除干扰连通域。

上述基于二值图像连通域统计的答题卡自动评分方法中，步骤(d)使用步骤 (c)得到的各个连通域的最小外接矩形，计算校准点边界，并根据答题卡描述文件，计算出各题中各个选项的在本图像中的绝对位置。

上述基于二值图像连通域统计的答题卡自动评分方法中，计算边界时加入了边界缓冲区，其上、下、左、右边界计算方法为：top=y-h×edge_rate， buttom=y+h×(1+edge_rate)，left=x-w×edge_rate， right=x+w×(1+edge_rate)，其中x、y、w、h、edge_rate分别表示连通域最小外接矩形的左上角横、纵坐标，矩形的宽、高以及边缘缓冲率，边缘缓冲率设为0.3。

上述基于二值图像连通域统计的答题卡自动评分方法中，步骤(d)包括以下步骤：

(e-1)根据步骤(d)得到的填涂点位置，将同一题的所有填涂点区域提取出来。

(e-2)对每一题区域计算自适应阈值并进行二值化

(e-3)根据步骤(c)中得到的校准点的大小计算填涂面积阈值：

threshold=s×0.15。

(e-4)对每个填涂点区域，若二值图像值为1的区域大于填涂面积阈值，则认为填涂，否则认为没有填涂。

上述基于二值图像连通域统计的答题卡自动评分方法中，步骤(e-2)中使用最大类间方差法计算自适应二值化阈值，类间方差法计算方法如下： g=ω₀ω₁(μ₀-μ₁)²，其中g为类间方差，ω₀、ω₁分别为灰度值小于、大于阈值T的像素点占整幅图像的比例，μ₀、μ₁分别为灰度值小于、大于阈值T的像素点的平均灰度；最大类间方差法阈值计算方法为分别计算T从0到255对应的类间方差法g的大小，取g最大的时候对应的T即为所求。

上述基于二值图像连通域统计的答题卡自动评分方法中，步骤(e-2)中，把自适应阈值计算结果用于区分未作答与扫描仪噪声，对于自适应二值化阈值大于 230的情况，认为该题未作答。

本发明采用常用的扫描仪作为输入设备；识别答题卡中的校准点是识别答题卡的关键操作，本发明通过灰度级形态学闭操作的方式去除非校准点外的其他因素的影响；通过答题卡中的校准点的位置，对扫描图像进行精确的倾斜校正，并计算出各题选项在这张答题卡中的绝对位置；通过一定的数据格式将答题卡各题的选项的上、下、左、右边界记录下来，达到快速提取各题选项区域的目的；将同一道题的区域提取出来，计算出自适应二值化阈值并对该区域二值化，然后根据连通域面积对该题每个选项逐一识别是否填涂，最后输出结果。

与现有技术相比，本发明具有如下优点和技术效果：

相对于OMR（光学标记阅读机）技术本发明克服了设备专用、答题卡格式固定、答题卡制造成本高、纠错流程复杂、图像不能保存待查等缺点，并具有识别率及速度可随计算机软、硬件发展不断优化、提升，改卷结果可直接显示在扫描图像上，判卷透明性高，校对方便等特点。相对于其他基于图像处理的技术，本发明具有对答题卡扫描时的倾斜、移位、轻微褶皱不敏感的优点，用户不必再因为扫描时的轻微异常而重新扫描答题卡，大大减少了重复劳动。本发明采用自适应阈值的方法判断填涂与否，对于不同的填涂深浅均可有效检测，兼容单选、多选题，并能有效区分擦除不净、未作答及多选的情况；对扫描设备的宽容度高，能适应不同分辨率的扫描以及不同扫描仪带来的噪声。用户不用再担心因为扫描仪更换、扫描分辨率改变而更换新的识别技术。

附图说明

图1为实施方式中基于二值图像连通域统计的答题卡自动评分方法的流程图。

具体实施方式

以下结合附图对本发明的实施方式作进一步说明，但本发明的实施不限于此。

如图1，基于二值图像连通域统计的答题卡自动评分方法的主要流程包括以下步骤：

(a)从本地磁盘读入一个扫描得到的答题卡图像文件；

(b)对答题卡图像进行倾斜检测及精确校正。

(c)对步骤(b)中校正后的图像进行校准点检测及定位；

(d)根据步骤(c)中得到的校准点位置以及答题卡描述文件，计算每一个填涂点在本张图像中的绝对位置；

(e)根据步骤(d)得到的每个填涂点进行识别，判断其是否填涂。

步骤(a)允许用户通过文件选择窗口从本地硬盘选择多个图像文件或一个文件夹作为答题卡图像数据源，图像文件要求是jpg格式文件。

步骤(b)灰度级形态学闭操作去除与校准点无关的因素的影响，灰度级形态学闭操作是图像处理的常用操作，其主要原理是：将图像先进行灰度级腐蚀操作再进行灰度级膨胀操作。灰度级腐蚀操作将结构元素中心对应的图像像素点的灰度值设为结构元素覆盖的图像区域中所有像素中最小的灰度值，而灰度级膨胀操作将结构元素中心对应的图像像素点的灰度值设为结构元素覆盖的图像区域中所有像素中最大的灰度值。

步骤(b)包括以下步骤：

(b-1)将扫描得到的图像转化为灰度图像；

(b-2)读取答题卡描述文件中校准点的类型以及扫描图像的分辨率，生成矩形的结构元素并使用它对扫描图像进行灰度级形态学闭操作；

(b-3)对步骤(b-2)得到的图像进行二值化；

(b-5)分别计算图像上方、下方校准点构成直线的斜率，若上下斜率差值过大，则认为发生褶皱并提示，否则取两者均值作为倾斜度数，对图像进行倾斜校正；

步骤(c)灰度级形态学闭操作去除与校准点无关的因素的影响，其原理与步骤(b)中的一致。

步骤(c)包括以下步骤：

(c-1)读取答题卡描述文件中关于水平方向校准点与竖直方向校准点的区域描述，并根据相对于校准点的位置裁剪出整个水平方向以及竖直方向区域；

(c-3)对图像进行二值化操作，判断二值图像中连通域数量是否与答题卡描述文件中的校准点数量一致，如不一致则利用该类型校准点的宽高比以及面积去除干扰连通域；

步骤(d)将步骤(c)所识别到的校准点用特定数据格式将校准点的边界存储下来。特定数据格式具体如表1所示。这里是通过记录校准点在答题卡图像数据中的位置，用以快速定位答题卡中各道题目的选项对应的位置。

表1保存校准点边界的数据格式

属性名属性的意义属性类型 type 用于区分水平、竖直方向的校准点 short id 第几个校准点 unsigned int left 校准点左边界 unsigned int right 校准点右边界 unsigned int top 校准点上边界 unsigned int buttom 校准点下边界 unsigned int

步骤(e)采用最大类间方差法对每道题对应区域图像计算自适应二值化阈值，并二值化。最大类间方差法是一种自适应的阈值确定的方法，它是按图像的灰度特性，将图像分成背景和目标两部分。背景和目标之间的类间方差越大，说明构成图像的两部分的差别越大，当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因此，使类间方差最大的分割意味着错分概率最小。类间方差法计算方法如下：g=ω₀ω₁(μ₀-μ₁)²，其中g为类间方差，ω₀、ω₁分别为灰度值小于、大于阈值T的像素点占整幅图像的比例，μ₀、μ₁分别为灰度值小于、大于阈值T的像素点的平均灰度；最大类间方差法阈值计算方法为分别计算T从0到255对应的类间方差法g的大小，取g最大的时候对应的T即为所求。

步骤(e)包括以下步骤：

(e-1)根据步骤(d)得到的填涂点位置，将同一题的所有填涂点区域提取出来。

(e-2)对每一题区域计算自适应阈值并进行二值化

(e-3)根据步骤(c)中得到的校准点的大小计算填涂面积阈值：

threshold=s×0.15。

(e-4)对每个填涂点区域，若二值图像值为1的区域大于填涂面积阈值，则认为填涂，否则认为没有填涂。

步骤(e-4)中，对于自适应二值化阈值大于230的情况，认为该题未作答，以区分未作答与扫描仪噪声。其原理是：考生为作答时，理想图像中应该是纯白的，所有像素灰度值均为255，全为背景，没有前景，但实际扫描图像存在噪声，存在噪声不为255的点，使得最大类间方差法错误把噪声以为是前景。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于二值图像连通域统计的答题卡自动评分方法 [P] . 中国专利： CN103559490B . 2017.01.04
2. 基于二值图像连通域统计的答题卡自动评分方法 [P] . 中国专利： CN103559490A . 2014-02-05
3. AN AUTOMATIC DEVICE FOR TRAINING AND CLASSIFYING DOCUMENTS BASED ON N-GRAM STATISTICS AND AN AUTOMATIC METHOD FOR TRAINING AND CLASSIFYING DOCUMENTS BASED ON N-GRAM STATISTICS THEREFOR [P] . 韩国专利： KR20140049659A . 2014-04-28

机译：基于N-GRAM统计量的文档自动分类训练装置及其基于N-GRAM统计量的文档自动分类训练方法
4. An automatic device for training and classifying documents based on N-gram statistics and An automatic method for training and classifying documents based on N-gram statistics therefor [P] . 韩国专利： KR101400548B1 . 2014-05-27

机译：基于N-gram统计信息的文档训练和分类的自动装置及其基于N-gram统计信息的文档训练和分类的自动方法
5. AUTOMATIC SCORING METHOD FOR PHOTO BASED ON AESTHETIC ASSESSMENT [P] . 世界知识产权组织专利： WO2018192245A1 . 2018-10-25

机译：基于审美的照片自动评分方法