首页> 中国专利> 基于试卷图像的试题拆解方法、系统、存储介质及设备

基于试卷图像的试题拆解方法、系统、存储介质及设备

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于试卷图像的试题拆解方法、系统、存储介质及设备，该基于试卷图像的试题拆解方法包括接收输入的试卷图像；对所述试卷图像进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素；将所述非文字元素进行切除，并通过对所述文字元素进行识别，以将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合；将定位信息对应的文字元素集合和所述图表元素进行融合，得到所述每道试题的题目信息。本发明解决了现有技术中对图片类试卷中的试题进行电子化存档时操作繁琐且效率低下的问题。

著录项

公开/公告号CN113610068B

专利类型发明专利
公开/公告日2022-07-08

原文格式PDF
申请/专利权人江西风向标教育科技有限公司;
展开▼

申请/专利号CN202111178939.3
发明设计人李巧艳;
展开▼

申请日2021-10-11
分类号G06V30/413(2022.01);G06V30/416(2022.01);
代理机构南昌旭瑞知识产权代理事务所(普通合伙) 36150;
代理人彭琰
地址 330000 江西省南昌市经济技术开发区麦园路1栋
入库时间 2022-08-23 14:00:10

法律信息

法律状态公告日

法律状态信息

法律状态
2022-07-08

授权

发明专利权授予

说明书

技术领域

本发明涉及图像处理与文本结构化处理相结合的技术领域，特别涉及一种基于试卷图像的试题拆解方法、系统、存储介质及设备。

背景技术

随着深度学习技术的发展，结合深度学习的自然语言处理与图像处理在各个经典项目上的表现均有突破性提高。其中，预训练技术让小样本数据也能有出色的表现；transformer等模型结构让特征提取更充分；深度学习结合领域内先验知识做具体场景下的模型落地思想在各行各业也越来越受到认可。

并且随着教育信息化的发展，类似于上述的各种信息化技术在教育行业也得到广泛的运用，导致教育方式发生了很大改变，例如由之前的通过纸质化试卷进行答题转变为利用计算机设备建立题库通过线上的方式进行答题，一般的在进行题库的建立时，主要通过人工输入的方式对题目进行入库。

现有技术中，图片类试卷在现实场景中很常见，人们将图片类试卷中的试题进行电子化存档过程中，大多采用人工打字方式，效率低下，特别对于理科类试卷，存在大量公式和图表，低效的同时录入也非常麻烦。

发明内容

有鉴于此，本发明的目的在于提供一种基于试卷图像的试题拆解方法、系统、存储介质及设备，旨在解决现有技术中对图片类试卷中的试题进行电子化存档时操作繁琐且效率低下的问题。

本发明实施例是这样实现的：一种基于试卷图像的试题拆解方法，所述方法包括：

接收输入的试卷图像；

对所述试卷图像进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素；

将所述非文字元素进行切除，并通过对所述文字元素进行识别，以将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合；

将定位信息对应的文字元素集合和所述图表元素进行融合，得到所述每道试题的题目信息。

进一步的，上述基于试卷图像的试题拆解方法，其中，所述接收输入的试卷图像的步骤之前还包括：

获取试卷文件，识别所述试卷文件的文件格式；

判断所述文件格式是否为图片格式；

若否，则将所述试卷文件的文件格式转换为图片格式。

进一步的，上述基于试卷图像的试题拆解方法，其中，所述对所述试卷图像进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素的步骤之前包括：

对所述试卷图像进行膨胀处理，检测膨胀后的试卷图像中的直线及直线对应的角度；

统计计算所述直线的平均角度，得到所述试卷图像的倾斜角度，根据所述倾斜角度将所述试卷图像置于水平状态。

进一步的，上述基于试卷图像的试题拆解方法，其中，所述对所述试卷图像进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素的步骤包括：

利用预训练的版面分析模型对所述试卷图像进行检测，以识别出所述试卷图像中的可信文字区域和可信图表区域；

判断所述可信图表区域的可信度是否满足可信度阈值；

若是，对所述可信文字区域和所述可信图表区域进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素；

若否，则对所述可信图表区域进行连通域检测，直至所述可信图表区域的可信度满足所述可信度阈值，并在所述可信图表区域的可信度满足所述可信度阈值时，对所述可信文字区域和所述可信图表区域进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素。

进一步的，上述基于试卷图像的试题拆解方法，其中，所述利用预训练的版面分析模型对所述试卷图像进行检测，以识别出所述试卷图像中的可信文字区域和可信图表区域的步骤之后还包括：

以预设类别数分别对所述可信文字区域做区域坐标聚类，获取聚类中心的欧几里得距离，得到最佳分类数；

计算所述最佳分类数对应的区域坐标聚类的左右边界区域值，得到分栏线，并通过所述分栏线对所述试卷图像进行切割。

进一步的，上述基于试卷图像的试题拆解方法，其中，所述通过对所述文字元素进行识别，以将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合的步骤包括：

利用中文预训练模型将所述文字元素进行向量化，并对向量化后文字元素进行特征提取，以通过序列标注对所述文字元素进行标签分类；

根据分类标签将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合。

其中，所述分类标签至少包括题号行、题干起始行、题干结束行、答案行以及解析行。

进一步的，上述基于试卷图像的试题拆解方法，其中，所述利用中文预训练模型将所述文字元素进行向量化，并对向量化后文字元素进行特征提取，以通过序列标注对所述文字元素进行标签分类的步骤之后还包括：

将每道题对应的分类标签的排布顺序与预设分类标签排布顺序进行比对，若所述分类标签的排布顺序与预设分类标签排布顺序不符，则按所述预设分类标签排布顺序对所述分类标签进行重新排布。

本发明的另一个目的在于提供一种基于试卷图像的试题拆解方法的系统，所述系统包括：

图像接收模块，用于接收输入的试卷图像；

元素分析模块，用于对所述试卷图像进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素；

拆分模块，用于将所述非文字元素进行切除，并通过对所述文字元素进行识别，以将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合；

融合模块，用于将定位信息对应的文字元素集合和所述图表元素进行融合，得到所述每道试题的题目信息。

本发明的另一个目的是提供一种存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述的方法的步骤。

本发明的另一个目的是提供一种电子设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述的方法的步骤。

本发明通过对接收到的试卷图像进行元素识别，以识别出文字元素和非文字元素以及文字元素与非文字元素的定位信息，并通过将文字元素拆分成与试卷图像当中的每道试题对应的文字元素集合，再将图表融合至对应的文字元素集合中，从而组成每道完整的题目，该方法能对现有技术中不能直接识别文本内容的试卷类型进行识别，并将试卷图像中每道试题拆分出来，拆分出的试题可以进行保存或者录入，解决了现有技术中对图片类试卷中的试题进行电子化存档时操作繁琐且效率低下的问题。

附图说明

图1为本发明第一实施例中基于试卷图像的试题拆解方法的流程图；

图2为本发明第二实施例中基于试卷图像的试题拆解方法的流程图；

图3为本发明第三实施例中基于试卷图像的试题拆解系统的结构框图；

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使对本发明的公开内容更加透彻全面。

需要说明的是，当元件被称为“固设于”另一个元件，它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件，它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“及／或”包括一个或多个相关的所列项目的任意的和所有的组合。

以下将结合具体实施例和附图来详细说明如何解决现有技术中对图片类试卷中的试题进行电子化存档时操作繁琐且效率低下的问题。

实施例一

请参阅图1，所示为本发明第一实施例中的提出的基于试卷图像的试题拆解方法，所述方法包括步骤S10~S13。

步骤S10，接收输入的试卷图像。

其中，试卷图像由从输入的试卷图片中进行获取，通过获取试卷图片从而得到试卷图像，试卷图片包括但不限于png、jpg、jpeg等格式。

另外，本方法是对不可直接提取文本内容的试卷类型进行试卷文本内容的提取，其中，不可直接提取文本内容的试卷类型主要包括试卷图片、pdf以及包含图片的Word，而本发明中的试卷图像主要由试卷图片中进行获取，为了增加该方法能处理的试卷的试卷类型，需要对试卷类型进行统一的转换。

有鉴于此，在本发明一些可选的实施例当中，获取试卷文件，识别所述试卷文件的文件格式；判断所述文件格式是否为图片格式，当判断到所述文件格式不是图片格式时，将所述试卷文件的文件格式转换为图片格式，通过对试卷的文件类型的转换成可供处理的图片格式，有效的增加了本方法能处理的试卷的试卷类型，例如，当试卷文件为pdf时，可以将pdf直接转换为图片，当试卷文件为Word时，也可以对Word进行处理以使得试卷转换成可进行处理的文件类型，即图片，具体的，在实际中，存在试题均以图片的格式插入在Word里面，即Word中全是图片或者试题一部分以图片形式插入在Word里面，另一部分以文字形式提现在word中的情况，在具体实施时，当试题均以图片的格式插入在Word里面，可以通过提取的方式将试题图片进行提取，当试题一部分以图片形式插入在Word里面，另一部分以文字形式提现在word中时，可以通过将Word转换成图片以得到试题图片。

步骤S11，对所述试卷图像进行元素分析，以识别出文字元素和非文字元素以及文字元素和图表元素的定位信息，所述非文字元素包括侧边栏元素和图表元素。

其中，文字元素包括组成每道题目的汉字与公式，定位信息包括坐标信息和题号信息，一般的，一道完整的题目一般包括题干信息、题目分值信息，答案信息以及解析信息，文字元素包含组成每道试题的题干信息、题目分值信息，答案信息以及解析信息的文字和公式，非文字元素包括图表元素以及侧边栏元素，通过元素分析检测出侧边栏元素以及图表元素后，可以分别对侧边栏元素和图表元素进行切除或提取。

步骤S12，将所述非文字元素进行切除，并通过对所述文字元素进行识别，以将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合。

其中，文字元素包含试卷题目中所需要的所有的文字及公式，为了实现对每道试题的录入，需要将文字元素拆分成试卷图像中每道试题对应的文字元素集合，具体的，文字元素集合应该包括每道题目中完整的题干信息、题目分值信息、答案信息以及解析信息。

进一步的，试卷的种类一般分为两种，一种为答案、解析紧跟在试题后面，习惯称为“教师用卷”，另一种为答案、解析与试题分离，习惯称为“学生用卷”，对于“教师用卷”在文字元素拆分后，包含答案、解析信息的文字元素可以直接通过坐标信息确定对应的代表题干信息的文字元素，并与该代表题干信息的文字元素组成文字元素集合，而对于“学生用卷”在文字元素拆分后，包含答案、解析信息的文字元素可以通过题号确定对应的代表题干信息的文字元素，并与该代表题干信息的文字元素组成文字元素集合。

更进一步的，“学生用卷”中的答案形式多种多样，为提高答案提取率，在本发明一些可选的实施例当中，增加图表类选项答案检测与识别；单行多答案类型识别与答案分割。

具体的，在本实施例实施时，通过OCR（Optical Character Recognition，光学字符识别）对试卷图像中的文字元素进行识别，需要说明的是，由于OCR的识别特性，为了增加OCR识别的准确性，在对文字元素进行识别时，会对试卷图像中的侧边栏元素以及图表元素进行切除，以保证在进行元素识别时其他元素对识别效果造成的干扰。

在本发明一些可选的实施例当中，在进行OCR识别之前会对试卷图像进行对比度增强、椒盐点抹除等预处理，以进一步的增加文字元素的识别效果。

进一步的，在本发明一些可选的实施例当中，对于“学生用卷”在进行答案检测识别时，如果识别到的答案第一题题号大于1且该答案起初区域在图像指定行以下，此时判断第一页排头答案漏检，可以切出答案漏检区域，再进行局部OCR识别，针对识别的元素信息再进行一次答案提取。

步骤S13，将定位信息对应的文字元素集合和所述图表元素进行融合，得到所述每道试题的题目信息。

其中，为了保证每道试题的完整性，需要对有配图的试题进行图表与试题的融合，具体的，通过定位信息可以查找出相对应的文字元素集合与图表，以此进行文字元素集合与图表的融合。

此外，在本发明一些可选的实施例当中，可以通过配图与试题之间的不同的关系来对图表与试题进行不同的融合，其中，主要通过计算题目区域与配图的相关面积对图表与试题进行不同的融合。

当图表完全在题目区域内，不做图表融合，直接在原图切割，保持原有文档的排版；当图表完全在题目区域内，但不完全在题干区域内，将图表的区域在原图上抹除，即像素点置为255。并将图片分别与文本类题干，图片类题干融合；当图表与题目区域部分重合，判断题目区域与图表面积重合是否大于图表面积的设定阈值，例如80%，若是，将原图中部分图片区域抹除，再将图片与题目融合；若否，则不需要融合，给出错误提示，提示用户检查题目是否缺少图表。

综上，本发明上述实施例当中的基于试卷图像的试题拆解方法，通过对接收到的试卷图像进行元素识别，以识别出文字元素和非文字元素以及文字元素与非文字元素的定位信息，并通过将文字元素拆分成与试卷图像当中的每道试题对应的文字元素集合，再将图表融合至对应的文字元素集合中，从而组成每道完整的题目，该方法能对现有技术中不能直接识别文本内容的试卷类型进行识别，并将试卷图像中每道试题拆分出来，拆分出的试题可以进行保存或者录入，解决了现有技术中对图片类试卷中的试题进行电子化存档时操作繁琐且效率低下的问题。

实施例二

请参阅图2，所示为本发明第二实施例中的基于试卷图像的试题拆解方法，所述方法包括步骤S20~步骤S30。

步骤S20，接收输入的试卷图像。

步骤S21，对所述试卷图像进行膨胀处理，检测膨胀后的试卷图像中的直线及直线对应的角度；

其中，根据试卷文档的先验规则，试卷中的文本都是横排，且水平，为了保证识别的准确性，在进行识别时一般需要保持试卷中的文本处于水平状态，可以理解的，文本中的行与行之间有行距间隔，可以利用膨胀原理，设置宽检测核，将试卷文本膨胀为行矩形，再利用霍夫直线检测与仿射的方法，检测文档的直线以及直线对应的角度。

步骤S22，统计计算所述直线的平均角度，得到所述试卷图像的倾斜角度，根据所述倾斜角度将所述试卷图像置于水平状态。

通过统计计算直线的平均角度，可以得到试卷图像的倾斜角度。在根据试卷图像的倾斜角度，将试卷图像旋转与倾斜角度对应的角度后，试卷图像为水平状态，其中，当倾斜角度为0时，表示试卷图像处于水平状态，此时只需要保持当前试卷图像的状态即可，当倾斜角度不为0时，表示试卷图像处于倾斜状态，此时需要将试卷图像进行旋转以保证试卷图像处于水平状态。。

需要说明的时，在现实生活中，输入的用于试题拆解的试卷图像可能会存在倾斜的问题，为了提升试题拆解的准确性，可以对试卷图像的倾斜角度进行获取，并根据倾斜角度的具体数值对试卷图像进行相应的处理，从而保证试卷图像处于水平状态。

步骤S23，利用预训练的版面分析模型对所述试卷图像进行检测，以识别出所述试卷图像中的可信文字区域和可信图表区域；

具体的，在预训练的版面分析模型中，利用DocBank+PubLayNet数据集做预训练。再标注预设数量的试卷文档，做模型fituning，例如500+左右。

步骤S24，判断所述可信图表区域的可信度是否满足可信度阈值；若是，执行步骤S25，若否，执行步骤S26。

一般的，由于版面分析模型在文字区域时的检测表现较佳，检测出的可信文字区域可信度较高，然而，在检测可信图表区域时版面分析模型的表现可能会存在误差的情况，因此需要对检测出的可信图表区域的可信度进行判断，当可信图表区域的可信度满足可信度阈值时，说明当前检测出的可信图表区域的可信度较高，可以对该可信图表区域做后续的切割或识别。

步骤S25，对所述可信文字区域和可信图表区域进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素。

具体的，连通域检测的box大小符合图表、侧边栏常识设置，即可为可信度高的可信图表区域。

步骤S26，对所述可信图表区域进行连通域检测，直至所述可信图表区域的可信度满足所述可信度阈值，并在所述可信图表区域的可信度满足所述可信度阈值时，对所述可信文字区域和可信图表区域进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素。

可以理解的，试卷内容是分块的，割裂且独立的模块元素构成；侧边栏、图表都具有连通性，因此，可以通过连通域检测的方式对试卷图像中的侧边栏和图表进行检测，其中，在具体实施时，侧边栏用竖形检测核（1x10），图表用常规检测核(3x3)。

另外，由于某些特定原因会导致图表以及侧边栏在某些区域是不连通的，而不连通的区域在进行连通域检测时会影响连通域的检测效果，此时，可以在进行连通域检测前对需要检测的区域进行膨胀以提升检测出的区域的准确性。

进一步的，在试卷图像中进行文字元素的识别时，由于OCR识别的特性，会对同一行的文字元素进行识别，并且在同一行的文字元素识别完成后，再转为对下一行的文字元素进行识别，而在现实生活中，试卷的排版会存在多栏的情况，例如双栏、三栏或者更多栏，以双栏为例，即在一张试卷图像上，划分有两个题目区域，而在进行文字元素识别时，容易造成多道试题的文字元素混合在一起对识别结果造成影响。

有鉴于此，在本发明一些可选的实施例当中，可以对试卷进行分栏处理，将试卷图像分成单栏，以保证每次识别的每一行上的文字元素仅仅包含一道试题的信息。

具体的，以预设类别数分别对所述可信文字区域做区域坐标聚类，获取聚类中心的欧几里得距离，得到最佳分类数；

计算所述最佳分类数对应的区域坐标聚类的左右边界区域值，得到分栏线，并通过所述分栏线对所述试卷图像进行切割。

其中，通过对试卷图像进行切割保证切割后的试卷图像中每一行仅仅包含一道试题的文字元素，从而避免在进行OCR识别时，同时识别多道试题的文字元素导致识别出的题目信息混乱的问题。

步骤S27，利用中文预训练模型将所述文字元素进行向量化，并对向量化后文字元素进行特征提取，以通过序列标注对所述文字元素进行分类；

具体的，利用bert的中文预训练模型将文字元素向量化，用transformer的encoder部分做特征提取，后接crf层做序列标注。

步骤S28，将每道题对应的分类标签的排布顺序与预设分类标签排布顺序进行比对，若所述分类标签的排布顺序与预设分类标签排布顺序不符，则按所述预设分类标签排布顺序对所述分类标签进行重新排布。

其中，以选择题为例，可以对文字元素分类，类别为N：题号行，A(BCD)：选项行，S:题干结束行，a:ans：答案行，P：parse：解析行,其他：O(others)。对分类标签进行确认与推理纠错，利用强特征规则，对分类标签纠正，对纠正后的分类标签，根据上下文逻辑，进行推理再修正，例如，AOCD修改为ABCD，SOBC修改为SABC等。

此外，在本发明一些可选的实施例当中，还可以对题型信息进行修正，通过分类标签对每道试题的题型进行识别，并根据题号对每道试题的题型进行排布，例如当识别到的题型依次为选择题、填空题、选择题，而根据试卷的排布规则，题型相同的试题应该为一起排布，此时，便可对题型信息修正为选择题、选择题、选择题。

步骤S29，根据分类标签将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合；

其中，所述分类标签至少包括题号行、题干起始行、题干结束行、答案行、解析行。

通过对文字元素进行标签分类将文字元素拆分成与每道试题对应文字元素集合，其中，以选择题的拆分为例，根据分类标签将文字元素分类为题干、选项、答案、解析各部分，后根据每道题对应的题干、选项、答案、解析将文字元素拆分成文字元素合集。

需要说明的是，在本发明的一些可选的实施例当中，选择题中的选项还可以通过直接切割的方式进行获取，即把各选项切割出来。结合定位信息，逐行切割，并融合至对应的位置，其中，如果识别到的选项区域为一行，则判断当前选项分布在同一行，利用连通域方法，设置多个kernel，循环检测box，直到检测出预设选项数量的box为止，例如，一般的，选择题都包括四个选项，此时可以设置多个kernel，循环检测box，直到检测出4个box为止。

步骤S30，将定位信息对应的文字元素集合和所述图表元素进行融合，得到所述每道试题的题目信息。

综上，本发明实施例，通过对接收到的试卷图像进行元素识别，以识别出文字元素和非文字元素以及文字元素与非文字元素的定位信息，并通过将文字元素拆分成与试卷图像当中的每道试题对应的文字元素集合，再将图表融合至对应的文字元素集合中，从而组成每道完整的题目，该方法能对现有技术中不能直接识别文本内容的试卷类型进行识别，并将试卷图像中每道试题拆分出来，拆分出的试题可以进行保存或者录入，解决了现有技术中对图片类试卷中的试题进行电子化存档时操作繁琐且效率低下的问题。

实施例三

请参阅图3，所示为本发明第三实施例中提出的基于试卷图像的试题拆解系统，所述系统包括：

图像接收模块100，用于接收输入的试卷图像；

元素分析模块200，用于对所述试卷图像进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素；

拆分模块300，用于将所述非文字元素进行切除，并通过对所述文字元素进行识别，以将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合；

融合模块400，用于将定位信息对应的文字元素集合和所述图表元素进行融合，得到所述每道试题的题目信息。

进一步地，在本发明的一些可选的实施例当中，所述系统还包括：

获取模块，用于获取试卷文件，识别所述试卷文件的文件格式；

判断模块，用于判断所述文件格式是否为图片格式；

转换模块，用于当判断到所述文件格式不为图片格式时，将所述试卷文件的文件格式转换为图片格式。

进一步地，在本发明的一些可选的实施例当中，所述系统还包括：

检测模块，用于对所述试卷图像进行膨胀处理，检测膨胀后的试卷图像中的直线及直线对应的角度；

统计模块，用于统计计算所述直线的平均角度，得到所述试卷图像的倾斜角度，根据所述倾斜角度将所述试卷图像置于水平状态。

进一步地，在本发明的一些可选的实施例当中，所述元素分析模块还包括：

识别单元，用于利用预训练的版面分析模型对所述试卷图像进行检测，以识别出所述试卷图像中的可信文字区域和可信图表区域；

可信度判断单元，用于判断所述可信图表区域的可信度是否满足可信度阈值；

第一元素分析单元，用于当判断到所述可信图表区域的可信度满足可信度阈值时，对所述可信文字区域和所述可信图表区域进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素；

第二元素分析单元，用于当判断到所述可信图表区域的可信度不满足可信度阈值时，则对所述可信图表区域进行连通域检测，直至所述可信图表区域的可信度满足所述可信度阈值，并在所述可信图表区域的可信度满足所述可信度阈值时，对所述可信文字区域和所述可信图表区域进行元素分析，以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息，所述非文字元素包括侧边栏元素和图表元素。

进一步地，上述基于试卷图像的试题拆解系统，其中，所述元素分析模块还包括：

切割单元，用于以预设类别数分别对所述可信文字区域做区域坐标聚类，获取聚类中心的欧几里得距离，得到最佳分类数；

计算所述最佳分类数对应的区域坐标聚类的左右边界区域值，得到分栏线，并通过所述分栏线对所述试卷图像进行切割。

进一步地，在本发明的一些可选的实施例当中，所述拆分模块包括：

标签分类单元，用于利用中文预训练模型将所述文字元素进行向量化，并对向量化后文字元素进行特征提取，以通过序列标注对所述文字元素进行标签分类；

拆分单元，用于根据分类标签将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合；

其中，所述分类标签至少包括题号行、题干起始行、题干结束行、答案行以及解析行。

进一步地，上述基于试卷图像的试题拆解系统，其中，所述拆分模块还包括：

排布单元，用于将每道题对应的分类标签的排布顺序与预设分类标签排布顺序进行比对，若所述分类标签的排布顺序与预设分类标签排布顺序不符，则按所述预设分类标签排布顺序对所述分类标签进行重新排布。

上述各模块被执行时所实现的功能或操作步骤与上述方法实施例大体相同，在此不再赘述。

实施例四

本发明另一方面还提供一种存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述实施例一至二中任意一个所述的方法的步骤。

实施例五

本发明另一方面还提供一种电子设备，所述设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述实施例一至二中任意一个所述的方法的步骤。

以上各个实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

本领域技术人员可以理解，在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机存储介质中，以供指令执行系统、装置或设备（如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统）使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机存储介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机存储介质的更具体的示例（非穷尽性列表）包括以下：具有一个或多个布线的电连接部（电子装置），便携式计算机盘盒（磁装置），随机存取存储器（RAM），只读存储器（ROM），可擦除可编辑只读存储器（EPROM或闪速存储器），光纤装置，以及便携式光盘只读存储器（CDROM）。另外，计算机存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或它们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于试卷图像的试题拆解方法、系统、存储介质及设备 [P] . 中国专利： CN113610068A . 2021-11-05
2. 测试题构建方法和设备、使用该方法制作的试卷以及存储用于执行该方法的测试题构建程序的计算机可读记录介质 [P] . 中国专利： CN101107601A . 2008-01-16
3. Test Question Constructing Method And Apparatus, Test Sheet Fabricated Using The Method, And Computer-Readable Recording Medium Storing Test Question Constructing Program For Executing The Method [P] . 美国专利： US2009130644A1 . 2009-05-21

机译：试题构建方法和装置，使用该方法制作的试卷以及用于执行该方法的计算机可读记录介质存储试题构建程序
4. Test Question Constructing Method and Apparatus, Test Sheet Fabricated Using the Method, and Computer-Readable Recording Medium Storing Test Question Constructing Program for Executing the Method [P] . 美国专利： US2008145832A1 . 2008-06-19

机译：试题构建方法和装置，使用该方法制作的试卷以及存储用于执行该方法的试题构建程序的计算机可读记录介质
5. Image content providing method, image content providing system, image content providing apparatus, program storage medium stored with program providing image content, advertisement image providing apparatus, program storage medium stored with program providing advertisement image, image content reproducing apparatus, program storage medium stored with program reproducing image content, advertisement charge totalizing system, advertisement charge totalizing method and program storage medium stored with program totalizing advertisemtnt charge [P] . 美国专利： US2002059591A1 . 2002-05-16

机译：图像内容提供方法，图像内容提供系统，图像内容提供设备，与程序提供图像内容一起存储的程序存储介质，广告图像提供设备，与程序提供广告图像一起存储的程序存储介质，图像内容再现设备，与程序提供存储的程序存储介质再现图像内容的程序，广告费用总计系统，广告费用总计方法以及存储有该节目费用的程序存储介质