摘要:
近年来,随着教育智能化的发展,互联网教育模式成为了教育教学的重要载体.各类在线教育系统拥有海量试题资源,为学习者提供了便捷的学习途径.然而,试题来源繁多、收集方式不统一等因素,使得互联网中所积累的试题资源存在重复率高、质量较低的现象.因此,准确、高效地监测试题,是精炼网络资源、提高网络试题质量的重要方式.在这样的背景下,文中着重研究了针对理科试题资源中图片公式的重复检测问题,通过精准的公式识别检测,能够排除试题语义的干扰,进而加强试题资源监测.传统的公式重复检测方法,往往因为基于人工定义的各类规则,识别步骤繁琐,准确率和效率较低,难以应用于大规模的公式数据检测.据此,提出一种基于深度卷积神经网络的公式重复检测方法.首先,使用一种多通道卷积机制实现了公式图片特征提取和处理的自动化,使之适用于大规模的公式数据检测.然后,使用端到端的输出模式,避免了传统方法中间步骤过多可能导致误差累计的弊端.最后,为了验证模型的准确率以及实用性,在标准测试数据集以及模拟扫描图噪声的数据集上进行了充分的实验,实验结果表明此方法能够有效处理不同质量的公式图片,在检测精度和效率上取得了良好的结果.