首页> 中国专利> 一种基于卷积神经网络的英语作文评分方法

一种基于卷积神经网络的英语作文评分方法

摘要

本发明公开了一种基于卷积神经网络的英语作文评分方法,包括如下步骤:步骤一、对待评分的英语作文进行预处理获得待处理数据;步骤二、对所述待处理数据进行特征提取;步骤三、将所述特征分别输入卷积神经网络模型中,获得特征的比重矩阵,将所述特征的比重矩阵合并获得所述英语作文的评分。本发明对英语作文进行特征提取,并通过特征结合卷积神经网络模型,实现了对英语作文的客观评分,保证了评分的准确性和一致性,消除了人为主观因素影响;并能够使学生针对薄弱部分进行特定的学习和强化。

著录项

  • 公开/公告号CN113869035A

    专利类型发明专利

  • 公开/公告日2021-12-31

    原文格式PDF

  • 申请/专利权人 锦州医科大学;

    申请/专利号CN202111209124.7

  • 发明设计人 刘曲;杨天地;马丽娣;

    申请日2021-10-18

  • 分类号G06F40/211(20200101);G06F40/216(20200101);G06F40/253(20200101);G06F40/284(20200101);G06F16/33(20190101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11369 北京远大卓悦知识产权代理有限公司;

  • 代理人王雪娇

  • 地址 121001 辽宁省锦州市凌河区松坡路三段40号

  • 入库时间 2023-06-19 13:29:16

说明书

技术领域

本发明涉及英语技术领域,更具体的是,本发明涉及一种基于卷积神经 网络的英语作文评分方法。

背景技术

英语作文是大规模英语考试中的一种必备题型,在学生英语水平考核中 占有相当大的比重,无论是在我国的高考、研究生考试还是在国外的TOEFL、 GRE、IELTS中,英语作文都是检测英语学习者语言综合运用能力考核的一 项重要指标。

但是,目前在我国,随着教育的发展,英语学习者的人数越来越多,作 文批阅数量激增,而由于教师数量却相当有限,教师在作文批阅方面显得有 些力不从心,并且,在我国大规模的英语考试当中,由于考生数量众多,需 要多名评分人员对考生的作文进行评分,而不同评分人员受个人喜好、习惯、 评阅时的心理状态等因素的影响,导致学生成绩存在一定的误差。

面对上述问题,如果能够开发一种实用的英语作文自动评分系统,实现 客观、公平而且能够及时反馈作文写作信息的作文自动评分技术的同时,可 以大大减轻教师的工作量,使教师有更多的心力倾注到其他教学任务上去。 因此,研究开发一款针对国内英语学习者的英语作文自动评分系统具有重大 的现实意义。

发明内容

本发明的目的是设计开发了一种基于卷积神经网络的英语作文评分方法, 利用英语作文的特征,结合卷积神经网络模型,实现了对英语作文的客观评 分,保证了评分的准确性和一致性。

本发明提供的技术方案为:

一种基于卷积神经网络的英语作文评分方法,包括如下步骤:

步骤一、对待评分的英语作文进行预处理获得待处理数据;

步骤二、对所述待处理数据进行特征提取;

步骤三、将所述特征分别输入卷积神经网络模型中,获得特征的比重矩 阵,将所述特征的比重矩阵合并获得所述英语作文的评分:

式中,g

优选的是,所述预处理包括对所述待评分的英语作文进行分段处理、分 句处理、分词处理和词性标注。

优选的是,所述特征包括:词法特征、句法特征和结构性特征。

优选的是,所述词法特征包括:形符数、类符数、形符比、平均词长、 长度大于N的单词、拼写错误、形容词个数、基数词个数、限定词个数、 介词个数、形容词个数、情态动词个数、物质名词和语法错误;

所述句法特征包括:简单陈述句个数、形容词短语个数、副词短语个数、 连词短语个数、片段数、名词短语数、介词短语数、句子数和平均句长;

所述结构性特征包括:符号类型数、文中符号数、作文字符长度、逗号 频数、句号频数、篇章连词数、段落数、平均每段包括的句数、第一段的句 子占整个作文的比例、最后一段的句子占整个作文的比例。

优选的是,所述卷积神经网络模型包括一个卷积层、一个池化层、一个 全连接层和一个输出层,所述卷积神经网络模型的构建过程包括如下步骤:

步骤1、在卷积层中,以所述特征分别作为所述卷积层的输入数据进行 卷积操作,所述卷积层的输出矩阵满足:

式中,f为卷积层的激活函数,W

步骤2、在所述池化层中,提取所述卷积层的输出矩阵的最大值,并进 行抹零处理,获得池化层的输出矩阵;

步骤3、在所述全连接层中,将所述池化层的输出矩阵转换为1×n的矩阵 形式后进行归一化处理,获得全连接层的输出矩阵;

步骤4、在所述输出层中,将所述全连接层的输出矩阵通过输出层输出 多个特征的比重矩阵,同时调整模型内部参数,优化预测精度,直至模型内 部参数收敛,得到训练完成的卷积神经网络模型。

优选的是,所述各个特征的评分满足:

式中,ξ

优选的是,所述词法特征的评分比重为25%,所述句法特征的评分比重 为15%,所述结构性特征60%。

优选的是,所述步骤4具体包括:

在所述输出层中,将所述全连接层的输出矩阵通过输出层输出多个特征 的比重矩阵,计算出各个特征的评分,将所述特征的比重矩阵合并获得所述 英语作文的预测评分,将所述预测评分与人工评分进行误差计算,对卷积神 经网络进行更新至损失函数收敛,获得卷积神经网络模型。

优选的是,所述抹零处理为ReLU函数。

优选的是,所述归一化处理的归一域为[-1,1]。

本发明所述的有益效果:

本发明设计开发的一种基于卷积神经网络的英语作文评分方法,通过对 英语作文进行特征提取,并使特征与卷积神经网络模型相结合,实现了对英 语作文的客观评分,保证了评分的准确性和一致性,消除了人为主观因素影 响;并能够凸显出各个英语作文中的薄弱部分,使学生针对薄弱部分进行特 定的学习和强化,进一步提高英语成绩。

附图说明

图1为本发明所述基于卷积神经网络的英语作文评分方法的流程示意图。

具体实施方式

下面结合对本发明做进一步的详细说明,以令本领域技术人员参照说明 书文字能够据以实施。

如图1所示,本发明提供的一种基于卷积神经网络的英语作文评分方法, 包括如下步骤:

步骤一、对待评分的英语作文进行预处理获得待处理数据:

所述预处理包括对所述待评分的英语作文进行分段处理、分句处理、分 词处理,得到作文的段落、句子、标点以及单词,以便于通过得到的段落、 句子、标点、单词等对词法特征以及结构特征进行统计分析;

同时,采用自然语言处理技术对文章进行词性标注,以便于对句法特征 的统计分析以及对单词错误和语法错误的检查。

步骤二、对所述待处理数据进行特征提取:

所述特征包括:词法特征、句法特征和结构性特征;

所述词法特征包括:形符数、类符数、形符比、平均词长、长度大于N 的单词、拼写错误、形容词个数、基数词个数、限定词个数、介词个数、形 容词个数、情态动词个数、物质名词和语法错误,单词的数量反映了作文的 长度,作文的形符数反映了学生对单词时态、语态的掌握,作文类符数反映 了学生的词汇量,平均词长则反映了作文的单词复杂度,作文单词丰富度的 数量显示了学生对不同词汇的掌握情况;

所述句法特征包括:简单陈述句个数、形容词短语个数、副词短语个数、 连词短语个数、片段数、名词短语数、介词短语数、句子数和平均句长,所 述句法特征反映了作文句子的复杂程度;

所述结构性特征包括:符号类型数、文中符号数、作文字符长度、逗号 频数、句号频数、篇章连词数、段落数、平均每段包括的句数、第一段的句 子占整个作文的比例和最后一段的句子占整个作文的比例,文中的符号类型 数能够反映作文结构的复杂程度,文章段落数、平均每段包括的句子数、平 均每段包含的片段数、第一段的句子占整个作文的比例、最后一段的句子占 整个作文的比例显示了学生对作文整体结构的掌握情况,作文中符号的类型 数、逗号、句号、冠词的数量反映了作文结构的复杂程度;

步骤三、将所述特征分别输入卷积神经网络模型中,获得特征的比重矩 阵,将所述特征的比重矩阵合并获得所述英语作文的评分:

式中,g

所述词法特征的评分比重为25%,所述句法特征的评分比重为15%,所 述结构性特征60%;

3个特征中的任意一个特征的评分均满足:

式中,ξ

步骤三具体包括:

所述卷积神经网络模型分为四层,分别为卷积层、池化层、全连接层和 输出层,经过前馈运算和反馈运算交替迭代完成模型训练:

1、前馈运算:

(1)卷积层:原始特征数据以m维矩阵的方式输入到输入层,然后将输 入层的数据在卷积层通过与卷积核W

式中,f为卷积层的激活函数,W

其中,所述卷积层的特征输入数据满足:

式中,T

(2)池化层:提取所述卷积层的输出矩阵的最大值,在池化层中进一步 提取特征数据,从而缩小输出矩阵中的数据数量,降低拟合化,然后通过编 程,引用ReLU函数,去掉不期望出现的特征数据,即进行抹零处理,提高 训练速度;

所述ReLU函数满足:

ReLU(x)=max(0,x);

式中,x为特征数据;

(3)全连接层:将所述池化层的输出矩阵转换为1×n的矩阵形式后进行 归一化处理,获得全连接层的输出矩阵;

其中,所述归一化处理的归一域为[-1,1];

(4)在所述输出层中,将所述全连接层的输出矩阵通过输出层输出多个 特征的比重矩阵;

2、反馈运算:

以多个特征数据为样本集,随机选出n个样本集,将样本集进行上述的 前馈运算,从而得出输出的特征的比重矩阵,输出的特征的比重矩阵即为通 过前馈运算进行计算从而得出的数据,通过计算得出的数据计算出各个特征 的评分,将所述特征的比重矩阵合并获得所述英语作文的预测评分,将所述 预测评分与人工评分进行误差计算,利用随机梯度下降法,对卷积核进行计 算并校正,即对卷积核进行训练,从后往前逐层计算,直至损失函数降至最 低时,即损失函数收敛,所训练出的卷积核即为卷积神经网络处理数据所需 的卷积核。

所述损失函数满足:

式中,J(θ)为损失函数,y为人工评分数据,x为预测评分数据。

通过训练好的模型参数获得卷积神经网络模型,即可实现对预测评分数 据的处理与矫正,实现了对英语作文的客观评分,保证了评分的准确性和一 致性,消除了人为主观因素影响;并能够凸显出各个英语作文中的薄弱部分, 使学生针对薄弱部分进行特定的学习和强化,进一步提高英语成绩。

尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方 式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领 域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范 围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的实 施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号