首页> 中国专利> 一种获得数学对象标注模型、数学对象标注的方法和装置

一种获得数学对象标注模型、数学对象标注的方法和装置

页面导航

摘要
著录项
说明书
相似文献

摘要

本申请公开了一种获得数学对象标注模型、数学对象标注的方法和装置，获得数学对象标注模型的方法包括：利用第一数学对象图像和标注信息训练深度神经网络获得数学对象标注模型；该第一数学对象图像的数量小于预设数量；将第二数学对象图像输入对应的数学对象标注模型，获得第二数学对象图像的初始标注信息；根据初始标注信息和初始标注信息的修正信息，获得第二数学对象图像的修正标注信息；利用第二数学对象图像和修正标注信息，训练数学对象标注模型获得目标数学对象标注模型。数学对象标注的方法包括：在上述基础上，确定待标注数学对象图像；将待标注数学对象图像输入对应的目标数学对象标注模型，获得待标注数学对象图像的标注信息。

著录项

公开/公告号CN112699887A

专利类型发明专利
公开/公告日2021-04-23

原文格式PDF
申请/专利权人科大讯飞股份有限公司;
展开▼

申请/专利号CN202011621526.3
发明设计人牛雪静;章继东;何春江;陈明军;
展开▼

申请日2020-12-30
分类号G06K9/34(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构11227 北京集佳知识产权代理有限公司;
代理人柳欣
地址 230088 安徽省合肥市高新区望江西路666号
入库时间 2023-06-19 10:43:23

说明书

技术领域

本申请涉及图像处理技术领域，尤其涉及一种获得数学对象标注模型、数学对象标注的方法和装置。

背景技术

随着深度神经网络的快速发展，基于深度神经网络的相关技术取得了突破性的成果，达到超越人类的水平。在字符识别领域中，深度神经网络也得到广泛的应用。

虽然基于深度神经网络的字符识别技术超越了传统的光学字符识别技术；但是深度神经网络的参数量大、更复杂，需要大量的训练样本以防止训练得到的模型过拟合，而大量的训练样本通常需要人工标注。尤其是在数学对象标注领域中，为了得到较为准确的基于深度神经网络的数学对象标注模型，通常需要对大量的数学对象图像中数学对象进行人工标注得到标注信息，以形成大量的训练样本。

发明人经过研究发现，大量的人工标注需要耗费大量的人力；大量的人工标注使得标注过程中存在很多重复的操作，且有些数学对象的标注操作本身较为繁琐、复杂，导致人工标注的标注信息容易出现各种各样的错误；该错误无法被及时发现，导致标注信息的质量下降；从而导致后续使用该训练样本中该标注信息得到的数学对象标注模型不够准确，容易出现不可预测的问题。

发明内容

有鉴于此，本申请实施例提供一种获得数学对象标注模型、数学对象标注的方法和装置，能够节省大量的人力，有效减少人工标注过程中存在的重复操作；有效提高标注信息的质量；从而使得数学对象标注模型更加准确，尽量避免出现不可预测的问题，以便提高数学对象标注准确率。

第一方面，本申请实施例提供了一种获得数学对象标注模型的方法，所述方法包括：

基于第一数学对象图像和标注信息，对深度神经网络进行训练获得数学对象标注模型；所述第一数学对象图像的数量小于预设数量；

将第二数学对象图像输入对应的数学对象标注模型，获得所述第二数学对象图像的初始标注信息；

根据所述初始标注信息和所述初始标注信息的修正信息，获得所述第二数学对象图像的修正标注信息；

基于所述第二数学对象图像和所述修正标注信息，对所述数学对象标注模型进行训练获得目标数学对象标注模型。

可选的，所述第一数学对象图像包括第一完整实例图像，所述标注信息包括完整实例包围框位置信息和实例类别标签，所述数学对象标注模型包括完整实例检测模型；和/或，

所述第一数学对象图像包括第一完整实例包围框图像，所述标注信息包括单个实例包围框位置信息和单个实例掩码信息，所述数学对象标注模型包括单个实例检测分割模型，所述单个实例检测分割模型包括单个实例检测子模型和单个实例分割子模型；和/或，

所述第一数学对象图像包括第二单个实例包围框图像，所述第二单个实例包围框图像是基于所述单个实例掩码信息处理后的第一单个实例包围框图像，所述标注信息包括各行掩码信息，所述数学对象标注模型包括行检测分割模型；和/或，

所述第一数学对象图像包括所述行掩码信息对应的第一行内容图像，所述标注信息包括行内容中各个字符信息，所述数学对象标注模型包括行内容识别模型；

其中，所述实例包括数学题干或数学作答。

可选的，所述将第二数学对象图像输入对应的数学对象标注模型，获得所述第二数学对象图像的初始标注信息，包括：

将第二完整实例图像输入所述完整实例检测模型，获得所述第二完整实例图像的完整实例包围框预测位置信息和实例类别预测标签；