首页> 中国专利> 一种题目录入方法、题目录入装置、电子设备及计算机可读存储介质

一种题目录入方法、题目录入装置、电子设备及计算机可读存储介质

摘要

本发明提供的题目录入方法包括以下步骤:S1,获取初始图片;S2,获取第一图片中的题目位置信息,得到题目图片;S3,获得题目字符信息;S4,判断题库中是否有匹配题目字符信息的题目;S5,对题目文本进行结构化文本解析以获得题型描述特征,对所述题目图片进行识别以获得排版格式特征与试题特征,所述题型描述特征、所述排版格式特征与所述试题特征为所述题目结构化数据;S6,发送题目结构化数据至智能终端以使其录入题目结构化数据。老师或学生均可在发现优质题目时通过对其拍摄以获得初始图片,上传初始图片至服务器以进行题目录入,无需通过打字而逐步输入题型、题干等内容,便于随时进行录题。

著录项

  • 公开/公告号CN112861864A

    专利类型发明专利

  • 公开/公告日2021-05-28

    原文格式PDF

  • 申请/专利权人 广东国粒教育技术有限公司;

    申请/专利号CN202110122288.X

  • 发明设计人 孙永毫;徐强;

    申请日2021-01-28

  • 分类号G06K9/34(20060101);G06K9/20(20060101);G06K9/40(20060101);G06K9/46(20060101);G06K9/62(20060101);

  • 代理机构44202 广州三环专利商标代理有限公司;

  • 代理人卢泽明;李宇亮

  • 地址 519000 广东省珠海市横琴新区宝华路6号105室-40499(集中办公区)

  • 入库时间 2023-06-19 11:08:20

说明书

技术领域

本发明属于人工智能技术领域,具体涉及一种题目录入方法、题目录入装置、电子设备及计算机可读存储介质。

背景技术

目前,PC端试题库系统已得到广泛应用,其令老师、学生从繁重的学习工作中解放出来,提高了学习工作效率,但由于老师或学生无法随时带着电脑办公,当发现优质的题目时,不能随时录题。

发明内容

本发明的第一目的是提供一种便于随时录题的题目录入方法。

本发明的第二目的是提供一种应用上述题目录入方法的题目录入装置。

本发明的第三目的是提供一种实现上述题目录入方法的电子设备。

本发明的第四目的是提供一种实现上述题目录入方法的计算机可读存储介质。

为实现上述的第一目的,本发明提供的题目录入方法包括以下步骤:S1,获取初始图片,对初始图片进行改质处理而得到第一图片;S2,获取第一图片中的题目位置信息,得到对应题目位置信息的题目图片;S3,对题目图片进行文字识别以获得题目字符信息;S4,判断题库中是否有匹配题目字符信息的题目,若否,则去除题目图片中的手写内容以获得题目文本;S5,对题目文本进行结构化文本解析以获得题型描述特征,对所述题目图片进行识别以获得排版格式特征与试题特征,所述题型描述特征、所述排版格式特征与所述试题特征为所述题目结构化数据;S6,发送题目结构化数据至智能终端以使其录入题目结构化数据。

由上述方案可见,老师或学生均可在发现优质题目时通过对其拍摄以获得初始图片,上传初始图片至服务器以进行题目录入,无需通过打字而逐步输入题型、题干等内容,便于随时进行录题。

优选的,步骤S4包括S41,对题目字符信息进行预处理。

进一步的,步骤S4包括S42,将题目字符信息输入至BERT预训练中文模型,BERT预训练中文模型识取题目字符信息而将其转换为题目句特征向量。

进一步的,步骤S4包括S43,将句特征向量遍历题库,将题库中的题目文本转换为题库句特征向量,根据题目句特征向量与题库句特征向量而判断题库中是否有匹配题目字符信息的题目。

进一步的,在步骤S43中,若题目句特征向量与题目句特征向量的相似度不小于预设阈值,则判断结果为是,确认题目句特征向量对应的题目为目标文本,发送目标文本至智能终端。

进一步的,步骤S4包括S44,智能终端确认录入确认目标文本。

进一步的,在步骤S43中,若判断结果为否,则执行作为步骤S45的去除题目图片中的手写内容以获得题目文本。

进一步的,步骤S45包括,S451,通过区域识别模型而识别第一图片中的手写区域与印刷区域,通过像素识别模型而对手写区域进行像素识别以确定在手写区域中的手写内容所对应的手写内容像素;S452,获取替换像素值,利用替换像素值替换手写内容像素的像素值以去除手写内容,替换像素值是手写区域中除了手写内容像素之外的任意一个像素的像素值,或者,替换像素值为手写区域中除了手写内容像素之外的所有像素的像素值的平均值:S453,从去除手写内容后的第一图片输出中间图像,对中间图像进行二值化处理以获得输出图像,识取输出图像中的文字以获得题目文本。

进一步的,步骤S5包括,S51,将题目文本转化为纯文本格式,并做分词处理;S52,根据各分词,在预先构建的题型索引词库中检索出若干个与分词相似的候选题型描述信息;S53,基于预设的过滤策略,从候选题型描述信息中确定出题型描述特征。

进一步的,题型索引词库的构建方法包括:从大量试卷数据中提取纯文本化的题型描述样本;对题型描述样本进行分词;将全部分词在领域词典中进行甄别,获取其中属于题型描述信息的目标分词;其中题型描述信息包括题型学科、题型名称以及题型备注;由目标分词构建出题型索引词库。

进一步的,在所述步骤S5中,将所述题目图片输入排版分析识别模型进行识别以获得排版格式特征,所述排版分析识别模型的训练过程如下:收集样本题目图像,并通过人工标注所述样本题目图像中各子部分的位置信息、类别信息和文本序列,子部分包括题干区域、答案区域,各子部分的位置信息可以通过多边形表示,类别信息包括文字题、图片题、表格题,文本序列即子栏目中包含的文本;基于样本题目图像,以及样本题目图像中各个子部分的位置信息、类别信息和文本序列对初始模型进行训练,从而得到排版分析识别模型,初始模型由一个神经网络或者多个神经网络构成。

进一步的,在所述步骤S5中,将所述题目图片输入试题分析模型进行识别以获得试题特征,所述试题分析模型的训练过程如下:设置初始迭代次数变量n=0,最大迭代次数为N,从训练集中随机采样一张图像以得到文档图像X,随机初始化图像编码层E、版面分析层A、文字解码层D的所有待优化的网络参数θ

进一步的,改质处理包括高斯滤波去躁、锐化去雾与动态直方图均衡化处理光照平衡。

进一步的,获取第一图片中的题目位置信息的方法为,通过选取框而框选题目,以选取框的坐标作为题目位置信息。

进一步的,获取第一图片中的题目位置信息的方法为,通过滑动而选取题目,从题目区域的初始位置开始滑动至结束位置,初始位置与结束位置的坐标为题目位置信息。

为实现上述的第二目的,本发明提供的应用上述题目录入方法的题目录入装置包括图片获取模块,用于获取初始图片,对所述初始图片进行改质处理以获得第一图片并发送所述第一图片至服务器,其中,所述第一图片记载有题目;图片识别模块,用于对所述第一图片进行文字识别以得到题目字符信息;搜索模块,用于利用所述题目字符信息搜索题库,得到与所述题目字符信息相匹配的题目文本;存储模块,用于非暂时性存储计算机可读指令;处理模块,用于运行所述计算机可读指令,用于处理手写内容去除;发送单元,用于将所述题目文本发送至客户端,以使所述客户端保存所述目标文本;保存单元,用于保存所述题目文本,并建立所述题目文本和所述第一图片的关联。

由上述方案可见,老师或学生均可在发现优质题目时通过对其拍摄以获得初始图片,上传初始图片至服务器以实现题目录入,无需通过打字而逐步输入题型、题干等内容,便于随时进行录题。

为实现上述的第三目的,本发明提供的电子设备包括处理器、通信接口、存储器与通信总线,处理器、通信接口与存储器通过通信总线进行相互信息传输;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述题目录入方法的方法步骤。

由上述方案可见,老师或学生均可在发现优质题目时通过对其拍摄以获得初始图片,上传初始图片至服务器以进行题目录入,无需通过打字而逐步输入题型、题干等内容,便于随时进行录题。

为实现上述的第四目的,本发明提供的计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述题目录入方法的方法步骤。

由上述方案可见,老师或学生均可在发现优质题目时通过对其拍摄以获得初始图片,上传初始图片至服务器以进行题目录入,无需通过打字而逐步输入题型、题干等内容,便于随时进行录题。

附图说明

利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。

图1是本发明所述的一种题目录入方法实施例的流程示意图。

图2是本发明所述的一种应用上述题目录入方法的题目录入装置实施例的结构示意图。

图3是本发明所述的一种实现上述题目录入方法的电子设备实施例的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

本发明的题目录入方法应用于本发明的题目录入装置,该题目录入装置可集成于电子设备,电子设备可以是智能终端,该智能终端可以是设置有操作系统的硬件设备如手机。

算题批改方法实施例:

参见图1,本实施例的算题批改方法包括:

步骤S1,获取初始图片,对初始图片进行改质处理而得到第一图片,具体的,智能终端拍摄题目图片作为初始图片并将其发送至服务器;

步骤S2,获取第一图片中的题目位置信息,得到对应题目位置信息的题目图片;

步骤S3,对题目图片进行文字识别以获得题目字符信息;

步骤S4,判断题库中是否有匹配题目字符信息的题目,若否,则去除题目图片中的手写内容以获得题目文本,具体的,步骤S4包括:

步骤S41,对题目字符信息进行预处理,预处理包括去除字符信息中的题目编号及转换题目字符信息中的特殊字符,字符信息包括数学公式、化学式以及标点符号等,可以将特殊字符转换成LaTex格式,

步骤S42,将题目字符信息输入至BERT预训练中文模型,BERT预训练中文模型识取题目字符信息而将其转换为题目句特征向量,

步骤S43,将句特征向量遍历题库,题库可以是云平台上已有的题库,由专职的题库老师结合题目爬虫工具组建的题库,包含各年级、科目、版本、章节的题目需要自己组建的题目数据资源库,题库还可以是学校自建的题库,由该学校老师创建和共享题目,将题库中的题目文本转换为题库句特征向量,根据题目句特征向量与题库句特征向量而判断题库中是否有匹配题目字符信息的题目,遍历题库的时间可以进行预设,当在预设时间内未发现目标文本,则向智能终端发送反馈信息,在步骤S43中,若题目句特征向量与题目句特征向量的相似度不小于预设阈值,则判断结果为是,确认题目句特征向量对应的题目为目标文本,发送目标文本至智能终端,若目标文本有多个,则将相似度最大的目标文本发送至智能终端,或者,若目标文本有多个,则将目标文本按相似度大小依次排列后发送至智能终端,

步骤S44,智能终端确认录入确认目标文本。

在步骤S43中,若判断结果为否,则执行步骤S45,步骤S45为去除题目图片中的手写内容以获得题目文本,

步骤S45包括,

步骤S451,通过区域识别模型而识别第一图片中的手写区域与印刷区域,通过像素识别模型而对手写区域进行像素识别以确定在手写区域中的手写内容所对应的手写内容像素;

步骤S452,获取替换像素值,利用替换像素值替换手写内容像素的像素值以去除手写内容,替换像素值是手写区域中除了手写内容像素之外的任意一个像素的像素值,或者,替换像素值为手写区域中除了手写内容像素之外的所有像素的像素值的平均值:

步骤S453,从去除手写内容后的第一图片输出中间图像,对中间图像进行二值化处理以获得输出图像,识取输出图像中的文字以获得题目文本;

步骤S5,对题目文本进行结构化文本解析以获得题型描述特征,对所述题目图片进行识别以获得排版格式特征与试题特征,所述题型描述特征、所述排版格式特征与所述试题特征为所述题目结构化数据,具体的,步骤S5包括,

步骤S51,将题目文本转化为纯文本格式,并做分词处理,

步骤S52,根据各分词的词义,在预先构建的题型索引词库中检索出若干个与分词相似的候选题型描述信息,

步骤S53,基于预设的过滤策略,从候选题型描述信息中确定出题型描述特征;

S6,发送题目结构化数据至智能终端以使其录入题目结构化数据,用户可于智能终端根据题目而调整题目结构化数据中的题型与题干内容。

BERT预训练中文模型是Google开发的NLP(自然语言处理)预训练技术,为无监督数据训练模型。BERT预训练中文模型本质上是一个两阶段式的NLP模型,第一个阶段为Pre-training(预训练),是利用现有无标记的语料训练一个语言模型,第二个阶段为Fine-tuning(微调),利用预训练好的语言模型,完成具体的NLP下游任务。

BERT预训练中文模型已经经过训练,可以直接输出句特征向量,但是如果需要特殊转化,则需要预先通过标注数据对其进行训练。

字符信息在输入BERT预训练中文模型之前,需要进行预处理,预处理主要包括去除字符信息中的题目编号。如果字符信息中含有数学公式、化学式以及标点符号等特殊字符,则需要先对其进行转换,比如,可以将这些特殊转换成LaTex格式

题型索引词库的构建方法包括:从大量试卷数据中提取纯文本化的题型描述样本;对题型描述样本进行分词;将全部分词在领域词典中进行甄别,获取其中属于题型描述信息的目标分词;其中题型描述信息包括题型学科、题型名称以及题型备注;由目标分词构建出题型索引词库。

在所述步骤S5中,将所述题目图片输入排版分析识别模型进行识别以获得排版格式特征,所述排版分析识别模型的训练过程如下:

收集样本题目图像,并通过人工标注所述样本题目图像中各子部分的位置信息、类别信息和文本序列,子部分包括题干区域、答案区域,各子部分的位置信息可以通过多边形表示,类别信息包括文字题、图片题、表格题,文本序列即子栏目中包含的文本;

基于样本题目图像,以及样本题目图像中各个子部分的位置信息、类别信息和文本序列对初始模型进行训练,从而得到排版分析识别模型,初始模型可以由一个神经网络或者多个神经网络构成。

在所述步骤S5中,将所述题目图片输入试题分析模型进行识别以获得试题特征,所述试题分析模型的训练过程如下:

设置初始迭代次数变量n=0,最大迭代次数为N,从训练集中随机采样一张图像以得到文档图像X,随机初始化图像编码层E、版面分析层A、文字解码层D的所有待优化的网络参数θ

将X输入图像编码层E中,获得侧重大尺度的第一图像特征和语言特征的融合特征F

将F

将L

更新迭代次数n=n+1,判断n是否等于N,如果是,停止迭代,如果否,转回1继续迭代。

题型描述特征是指主要用于辨识出试卷中与题目类型信息相关的特征。

试题特征是指主要用于辨识出试卷中与试题内容相关的特征,例如但不限于:(1)序号特征:通常以数字+标点开头,多出现于题干或题目注释;(2)选项特征:通常以ABCD等字母+标点开头,多出现于选择题首;(3)文字特征:例如字体字号;(4)图片特征。

排版格式特征是指主要用于辨识出题目的文字版面布局的特征。

改质处理包括高斯滤波去躁、锐化去雾与动态直方图均衡化处理光照平衡。

获取第一图片中的题目位置信息的第一方法为,通过选取框而框选题目,以选取框的坐标作为题目位置信息。

获取第一图片中的题目位置信息的第二方法为,通过滑动而选取题目,从题目区域的初始位置开始滑动至结束位置,初始位置与结束位置的坐标为题目位置信息。

本实施例中的预设阈值为90%,适用于OCR识别率较高的情况,当OCR识别率在95%以上时,可使用固定值的预设阈值。

题目文本转换为题库句特征向量的方法与题目字符信息转换为题目句特征向量的方法一致。

老师或学生均可在发现优质题目时对其拍摄以获得初始图片,上传初始图片至服务器以实现题目录入,无需通过打字而逐步输入题型、题干等内容,便于随时进行录题,提高录题效率。

题目录入装置实施例:

参见图2,应用上述题目录入方法的题目录入装置包括图片获取模块,用于获取初始图片,对所述初始图片进行改质处理以获得第一图片并发送所述第一图片至服务器,其中,所述第一图片记载有题目;图片识别模块,用于对所述第一图片进行文字识别以得到题目字符信息;搜索模块,用于利用所述题目字符信息搜索题库,得到与所述题目字符信息相匹配的题目文本;存储模块,用于非暂时性存储计算机可读指令;处理模块,用于运行所述计算机可读指令,用于处理手写内容去除;发送单元,用于将所述题目文本发送至客户端,以使所述客户端保存所述目标文本;保存单元,用于保存所述题目文本,并建立所述题目文本和所述第一图片的关联。

老师或学生均可在发现优质题目时通过对其拍摄以获得初始图片,上传初始图片至服务器以进行题目录入,无需通过打字而逐步输入题型、题干等内容,便于随时进行录题,提高录题效率。

电子设备实施例:

参见图3,电子设备包括处理器、通信接口、存储器与通信总线100,处理器、通信接口与存储器通过通信总线100进行相互信息传输;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述题目录入方法的方法步骤。

例如,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明的各个模块。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在终端设备中的执行过程。

本发明所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。

存储器可用于存储计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

通信总线100可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用线条表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

老师或学生均可在发现优质题目时通过对其拍摄以获得初始图片,上传初始图片至服务器以进行题目录入,无需通过打字而逐步输入题型、题干等内容,便于随时进行录题,提高录题效率。

计算机可读存储介质实施例:

计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述题目录入方法的方法步骤。

实现上述题目录入方法的电子设备的存储器所存储的计算机程序如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述题目录入方法的各个步骤。

其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

老师或学生均可在发现优质题目时通过对其拍摄以获得初始图片,上传初始图片至服务器以进行题目录入,无需通过打字而逐步输入题型、题干等内容,便于随时进行录题,提高录题效率。

最后需要强调的是,本发明不限于上述实施方式,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号