首页> 中国专利> 一种基于图像分析的成绩自动录入方法

一种基于图像分析的成绩自动录入方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及一种基于图像分析的成绩自动录入方法，包括：利用扫描仪扫描空白试卷样本，并对空白试卷样本进行OCR识别；对OCR识别结果进行文字拆解，以分解出空白试卷样本中每个题目的题目区域坐标、题型和分值；利用自动扫描仪批量扫描所有考生的答卷，得到答卷图像；从答卷图像中提取老师的有效的阅卷笔迹的轮廓体；将有效的阅卷笔迹的轮廓体输入到Tensorflow进行识别；根据识别结果、识别结果所对应的题目区域坐标及该题目区域坐标对应的题目分值，统计每道题目的实际得分；按照每道题目的序号，将每道题目的实际得分录入到数据库中。通过本发明的技术方案，能够实现考生答卷成绩的自动采集、识别、统计和录入。

著录项

公开/公告号CN107506762A

专利类型发明专利
公开/公告日2017-12-22

原文格式PDF
申请/专利权人昆山中骏博研互联网科技有限公司;
展开▼

申请/专利号CN201710779908.0
发明设计人凌易中;刘明丽;
展开▼

申请日2017-09-01
分类号
代理机构北京细软智谷知识产权代理有限责任公司;
代理人李艳霞
地址 215300 江苏省苏州市昆山市开发区前进东路科技广场1602室
入库时间 2023-06-19 04:06:43

法律信息

法律状态公告日

法律状态信息

法律状态
2020-03-20

授权

授权
2018-01-19

实质审查的生效 IPC(主分类):G06K9/32 申请日:20170901

实质审查的生效
2017-12-22

公开

公开

说明书

技术领域

本发明涉及图像分析处理技术领域，具体涉及一种基于图像分析的成绩自动录入方法。

背景技术

当前，考试完后的试卷，只有客观题的成绩计算机是有数据的(还必须使用答题卡来进行答题)，但是占分比例更高、对成绩的观察更为有效的主观题，却无法进入计算机——除非人工将成绩抄录进去。这就遇到了工作量大，抄录时人工可能存在疏漏、错误，录完一次还需要有一个人来进行校验的巨大开销的问题。

本发明采用了人工智能和图像分析、图像识别相关的技术。只需要使用全自动扫描仪将试卷扫描到计算机，然后由程序分析试卷结构，并分析老师的阅卷笔迹，即可自动的录入考生的全部成绩，无需人员参与。

CNN人工智能神经网络：该技术用于识别手写的符号和数字。一般采用Google公司开源的Tensorflow引擎。使用之前，需要先采集大量的样本，在本发明中，我们仅需要采集：√、×、－、+、以及带点的√这五种符号，和数字0～60的手写样本。每种样本一般至少需要6000个样例，这6000样例可以采集自300个人的手写图像。基于这样每样本6000个样例共3万个样例的采集库，使用Tensorflow的LeNet5网络模型进行训练，得到识别模型，即可识别所有书写上符合要求的任何人手写的这些符号及数字。

OCR技术：OCR是光学字符识别技术的简称，这是一项已经十分成熟的技术，国内外很多公司都在开发，免费的开源的商业的各种模块都有。对于扫描的图像来说，当今的OCR识别率已经非常不错，识别结果和可信度都已经很高、其准确度足够使用了。

发明内容

有鉴于此，本发明的目的在于克服现有技术的不足，提供一种基于图像分析的成绩自动录入方法，实现考生答卷成绩的自动采集、识别、统计和录入。

为实现以上目的，本发明采用如下技术方案：

一种基于图像分析的成绩自动录入方法，包括：

步骤S1、利用扫描仪扫描空白试卷样本，并对所述空白试卷样本进行OCR识别，得到OCR识别结果；

步骤S2、对所述OCR识别结果进行文字拆解，以分解出所述空白试卷样本中每个题目的题目区域坐标、题型和分值；其中，所述题目区域坐标包括题目的序号和开始结束范围；

步骤S3、利用自动扫描仪批量扫描所有考生的答卷，得到答卷图像；其中，所述答卷图像上有考生的作答结果及老师在指定区域内的红色阅卷笔迹；

步骤S4、从所述答卷图像中提取老师的有效的阅卷笔迹的轮廓体；

步骤S5、将有效的阅卷笔迹的轮廓体输入到Tensorflow进行识别，得到对、错、部分对、加分、减分这5种符号，以及0～60，一共66种可能的识别结果；

步骤S6、根据识别结果、识别结果所对应的题目区域坐标及该题目区域坐标对应的题目分值，统计每道题目的实际得分；

步骤S7、按照每道题目的序号，将每道题目的实际得分录入到数据库中。

优选地，所述步骤S4包括：

步骤S41、将所述答卷图像从RGB色彩格式转换为HSL色彩格式，并将答卷图像上的红色域的像素全部提取，得到老师的阅卷笔迹图像；其中，所述红色域包括淡红色域和深红色域；

步骤S42、对所述阅卷笔迹图像进行二值化，得到二值图像；

步骤S43、在所述二值图像上提取老师的有效的阅卷笔迹的轮廓体。

优选地，所述步骤S43包括：

步骤S431、提取二值图像上阅卷笔迹的轮廓体，并将阅卷笔迹的轮廓体X轴横向上的所有像素做Y轴竖向方向的投影，若有大于预设截面积的相交投影，则将该相交投影对应的阅卷笔迹的轮廓体归类为同一行轮廓体；

步骤S432、将同一题目区域坐标内的行轮廓体归类在一起，且按预设剔除方法剔除无效的行轮廓体。

优选地，所述预设截面积默认值为20％截面积，所述预设截面积可根据实际样本统计后得出的数值进行设定。

优选地，所述步骤S432中的预设剔除方法包括：

若任一所述题目区域坐标内出现多行轮廓体，则仅保留像素数量最小的行轮廓体，剔除其他行轮廓体，以保证任一所述题目区域坐标内仅有一行轮廓体。

优选地，所述步骤S432中的预设剔除方法还包括：

若任一行轮廓体跨越了多个题目区域坐标，则用该行轮廓体跨越的每一题目区域坐标内的像素数量，分别除以该行轮廓体的总像素数量，得到多个(0，1)范围内的比例值，取最大比例值对应的题目区域坐标作为该行轮廓体的实际题目区域坐标。

优选地，所述步骤S432中的预设剔除方法还包括：

若某一行轮廓体不属于步骤S2中分解出的任一题目区域坐标，判定该轮廓体在答卷图像的边缘区域，剔除该行轮廓体。

优选地，所述步骤S432中的预设剔除方法还包括：

将每一行轮廓体分解为N个相互独立的子轮廓体，并计算每个子轮廓体的宽度与高度的比值，若该比值大于宽高比阈值，则判定该子轮廓体为老师手写批阅的文字，剔除该子轮廓体。

优选地，所述宽高比阈值默认值为2.5，所述宽高比阈值可根据实际样本统计后得出的数值进行设定。

优选地，所述步骤S6中，若任一题目区域坐标内没有对应的识别结果，则判定该题目区域坐标对应的题目得满分。

本发明采用以上技术方案，至少具备以下有益效果：

由上述技术方案可知，本发明提供的这种基于图像分析的成绩自动录入方法，使用空白试卷样本和OCR技术分解出试卷的题目区域坐标、题型和分值，然后提取老师的红色阅卷笔迹迹，并对笔迹进行预处理、剔除无效的阅卷笔迹的轮廓体，然后使用CNN工具Tensorflow进行识别，相比现有技术，实现了考生答卷成绩的自动采集、识别、统计和录入，减轻了考务人员的成绩统计工作量；同时，由于减少了人工参与成绩统计和录入的过程，降低了由于人工差错带来的成绩录入差错率，能够提高成绩统计和录入的效率和准确率。

现有技术完全使用人力，工作量太大，因此实际上几乎没有学校愿意这样做。使用本发明提供的技术方案后，考卷成绩的录入变成了全自动化，可实现对学生考试成绩的数字化管理，为老师教学成果评估及考生能力水平鉴定奠定了数据基础。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的一种基于图像分析的成绩自动录入方法的流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将对本发明的技术方案进行详细的描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式，都属于本发明所保护的范围。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

参见图1，本发明一实施例提供的一种基于图像分析的成绩自动录入方法，包括：

步骤S1、利用扫描仪扫描空白试卷样本，并对所述空白试卷样本进行OCR识别，得到OCR识别结果；

步骤S3、利用自动扫描仪批量扫描所有考生的答卷，得到答卷图像；其中，所述答卷图像上有考生的作答结果及老师在指定区域内的红色阅卷笔迹；

步骤S4、从所述答卷图像中提取老师的有效的阅卷笔迹的轮廓体；

步骤S5、将有效的阅卷笔迹的轮廓体输入到Tensorflow进行识别，得到对、错、部分对、加分、减分这5种符号，以及0～60，一共66种可能的识别结果；

步骤S6、根据识别结果、识别结果所对应的题目区域坐标及该题目区域坐标对应的题目分值，统计每道题目的实际得分；

步骤S7、按照每道题目的序号，将每道题目的实际得分录入到数据库中。

需要说明的是，本发明提供的这种基于图像分析的成绩自动录入方法，要求老师阅卷时遵守以下规则：

1、清晰的阅卷笔记，尤其是写得分符号和分值的时候，应尽量避免严重潦草的写法；阅卷时尽量不要在题目区域内随意的书写大量的批改文字，理论上只写和得失分有关的符号及得失分数字；

2、正确的题目可以打勾或不做任何标记，错误的题目需要有明确的标记，如打叉，或+5、-3这样明确的得失分；不允许对连续正确的N道题目打一个大勾或一个大叉，禁止随意地在任何一个位置写得失分；

3、错误或部分正确的题目要有每一道题目的打叉或扣分(也可以写得分，扣分必须要写减号，无减号则会被认为是得分)；禁止一个标记覆盖多道题；

4、批阅试卷的文字或提醒学生的文字必须写在题目范围之外，即试卷的边缘空白区内。

优选地，所述步骤S4包括：

步骤S42、对所述阅卷笔迹图像进行二值化，得到二值图像；

步骤S43、在所述二值图像上提取老师的有效的阅卷笔迹的轮廓体。

优选地，所述步骤S43包括：

步骤S432、将同一题目区域坐标内的行轮廓体归类在一起，且按预设剔除方法剔除无效的行轮廓体。

可以理解的是，老师在阅卷过程中，为了使考生醒目地看到分数，字体一般是较大，有的字体甚至是较为分散的。例如：老师在某个题目上打了一个√号，并在旁边写了一个+5，表示这道题目考生答对了，得到5分。若这个+号和这个5紧挨，√号所在的列和+5所在的列有预设截面积相交，则本发明提供的这种基于图像分析的成绩自动录入方法，自动将√号和+5归为一个行轮廓体；若这个√号和这个+5分开较大距离，√号所在的列和+5所在的列在预设截面积内不相交，则本发明提供的这种基于图像分析的成绩自动录入方法，自动将√号和+5归为两个行轮廓体。此时，由于√号和+5对应同一个题目区域坐标，我们将√号和+5分别对应的行轮廓体归为一类。

优选地，所述预设截面积默认值为20％截面积，所述预设截面积可根据实际样本统计后得出的数值进行设定。

优选地，所述步骤S432中的预设剔除方法包括：

可以理解的是，老师在阅卷过程中，可能会加一些文字类的批阅，例如：“好！”、“很好！”或者“请参阅××页例题进行学习！”，这些文字类的批阅通常像素很大，但不属于我们需要提取的有效的阅卷笔迹的轮廓体。这时我们可以通过判断每行轮廓体的像素数量进行剔除，只保留像素数量最小的行轮廓体，例如：+3或者√号。

优选地，所述步骤S432中的预设剔除方法还包括：

可以理解的是，老师在阅卷的过程中，批阅风格有可能是很豪放的，例如一个分数轮廓体占了两道题目对应的题目区域坐标，这时，如何判断这个分数轮廓体归属哪个题目区域坐标呢？本发明采用该行轮廓体跨越的每一题目区域坐标内的像素数量，分别除以该行轮廓体的总像素数量，得到多个(0，1)范围内的比例值，取最大比例值对应的题目区域坐标作为该行轮廓体的实际题目区域坐标的方法进行判断，以确保一个分数轮廓体对应一个题目区域坐标。

优选地，所述步骤S432中的预设剔除方法还包括：

若某一行轮廓体不属于步骤S2中分解出的任一题目区域坐标，判定该轮廓体在答卷图像的边缘区域，剔除该行轮廓体。

可以理解的是，会有一些行轮廓体，计算之后不属于任何题目区域坐标，这是因为这些行轮廓体在考卷文字外的边缘区域。这一类的行轮廓体全部抛弃，无须参与后续处理。

优选地，所述步骤S432中的预设剔除方法还包括：

优选地，所述宽高比阈值默认值为2.5，所述宽高比阈值可根据实际样本统计后得出的数值进行设定。

可以理解的是，对每一行轮廓体，分解为单个独立(即互相不相连)的N个子轮廓体，并对子轮廓体的宽度比(即宽度除以高度的比值)进行计算，如果该值大于2.5，即可认为该子轮廓体不是需要识别的子轮廓体(如老师手写批阅文字)，因为正常书写的符号和数字，其宽高比都不会超过2.5(这是基于大量实际样本统计后得来的数值)。这里2.5的比值是一个阀值。

优选地，所述步骤S6中，若任一题目区域坐标内没有对应的识别结果，则判定该题目区域坐标对应的题目得满分。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上，除非另有明确的限定。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于图像分析的成绩自动录入方法 [P] . 中国专利： CN107506762B . 2020.03.20
2. 一种基于机器视觉技术的快速录入试卷成绩的试卷及方法 [P] . 中国专利： CN112215192A . 2021-01-12
3. ADMISSION SYSTEM USING CELLULAR TELEPHONE AND METHOD THEREFOR, CELLULAR TELEPHONE TERMINAL TO BE USED FOR THE METHOD, AUTOMATIC TICKET EXAMINATION DEVICE AND AUTOMATIC TICKET EXAMINER ON TRAIN [P] . 日本专利： JP2002352282A . 2002-12-06

机译：一种使用电话电话的录入系统及其方法，用于该方法的电话电话终端，自动票务检查装置以及火车上的自动票务检查员
4. A virtual reality interface implementation method based on a three-dimensional image analysis based on a single camera, a virtual reality interface implementation device based on a three-dimensional image analysis based on a single camera [P] . 韩国专利： KR20180053416A . 2018-05-21

机译：基于基于单个摄像头的三维图像分析的虚拟现实界面实现方法，基于基于单个摄像头的三维图像分析的虚拟现实界面实现设备
5. METHOD FOR THE SPORT PERFORMANCE ANALYSIS FOR QUANTIFYING AND QUALIFYING THE WORKLOAD OF ONE OR MORE ATHLETES BASED ON KEY PERFORMANCE INDICATORS [P] . 世界知识产权组织专利： WO2019016590A1 . 2019-01-24

机译：一种基于关键绩效指标的体育成绩分析方法用于量化和合格一名或多名运动员的工作量