首页> 中国专利> 课程质量分析方法、装置及系统

课程质量分析方法、装置及系统

摘要

本申请公开了一种课程质量分析方法、装置及系统,涉及人工智能技术领域,该方法包括:获取第一课程的评论文本数据;基于属性分类模型,对所述评论文本数据进行属性分类;基于情感计算模型,确定所述评论文本数据的情感极性;根据所述情感极性和分类结果,计算所述第一课程的评分。本申请的方案实现了对线上课程的智能评估,便于后期线上课程的改进和持久发展。

著录项

  • 公开/公告号CN113254647A

    专利类型发明专利

  • 公开/公告日2021-08-13

    原文格式PDF

  • 申请/专利权人 大唐融合通信股份有限公司;

    申请/专利号CN202110655979.6

  • 发明设计人 李座磊;郭琦;樊劲松;

    申请日2021-06-11

  • 分类号G06F16/35(20190101);G06F40/205(20200101);G06Q10/06(20120101);G06Q50/20(20120101);

  • 代理机构11243 北京银龙知识产权代理有限公司;

  • 代理人许静;曹娜

  • 地址 100029 北京市海淀区学院路40号26幢十层1004房间

  • 入库时间 2023-06-19 12:13:22

说明书

技术领域

本申请涉及人工智能技术领域,尤其是涉及一种课程质量分析方法、装置及系统。

背景技术

随着互联网的快速发展,线上教育行业的迅速崛起,用户在线上的学习越来越频繁,在学习的过程种与线上老师的交流越来越多,但是线上学习的反馈却很少。对学习者在学习过程中的学习效果以及学习者对平台和教学者的反馈却没有一个很好的判定体系,不利于线上课程的改进和持续发展。

发明内容

本申请的目的在于提供一种课程质量分析方法、装置及系统,从而解决现有技术中对学习者的学习效果以及对平台和教学者的反馈没有很好的判定提议,不利于线上课程的改进和持续发展的问题。

第一方面,本申请实施例提供一种课程质量分析方法,包括:

获取第一课程的评论文本数据;

基于属性分类模型,对所述评论文本数据进行属性分类;

基于情感计算模型,确定所述评论文本数据的情感极性;

根据所述情感极性和分类结果,计算所述第一课程的评分。

可选地,根据所述情感极性和分类结果,计算所述第一课程的评分,包括:

根据每一类属性的不同情感极性的评价文本比例以及对应的极性计算正确率,确定每一类属性的得分;

根据各类属性的得分以及各类属性的权重,确定第一课程的评分;

其中,所述情感极性包括:正向情感和/或负向情感。

可选地,所述第一课程的评分包括下述至少一项:

教育者角度对应的第一评分;

学习者角度对应的第二评分;

平台角度对应的第三评分。

可选地,各类属性在不同角度中所占的权重不同。

可选地,所述属性分类模型的训练过程包括:

获取用于训练所述属性分类模型的语料信息;

将所述语料信息输入至预先搭建的文本分类模型,对所述文本分类模型进行训练;

根据所述文本分类模型输出的分类结果和信息熵,调整所述文本分类模型的模型参数。

可选地,将所述语料信息输入至预先搭建的文本分类模型,对所述文本分类模型进行训练之前,所述方法还包括:

对所述语料信息进行预处理;

基于预先训练的词-向量转化模型,将预处理后的语料信息转化为词向量;

将所述语料信息输入至预先搭建的文本分类模型,对所述文本分类模型进行训练,包括:

将所述词向量输入至预先搭建的文本分类模型,对所述文本分类模型进行训练。

可选地,基于情感计算模型,确定所述评论文本数据的情感极性,包括:

遍历所述评论文本数据,将所述评论文本数据与预先构建的基础词典进行匹配,计算所述评论文本数据的正向情感词的分数、正向情感词的个数、负向情感词的分数和负向情感词的个数;

根据所述正向情感词的分数、所述正向情感词的个数、所述负向情感词的分数和所述负向情感词的个数,计算所述评论文本数据的情感分数;

根据所述情感分数,确定所述评论文本数据的情感极性。

可选地,计算所述评论文本数据的正向情感词的分数包括:

判断所述正向情感词的前N个词内是否存在否定词和程度副词,若都不存在,则确定所述正向情感词的分数为根据与所述基础词典匹配的结果计算的第一分数;若都存在,则确定所述正向情感词的分数为所述第一分数与预设值和所述程度副词的程度值的乘积;若仅存在所述否定词,则确定所述正向情感词的分数为所述第一分数与预设值的乘积;若仅存在所述程度副词,则确定所述正向情感词的分数为所述第一分数与所述程度副词的程度值的乘积;其中,N为正整数。

可选地,计算所述评论文本数据的负向情感词的分数包括:

判断所述负向情感词的前N个词内是否存在否定词和程度副词,若都不存在,则确定所述负向情感词的分数为根据与所述基础词典匹配的结果计算的第二分数;若都存在,则确定所述负向情感词的分数为所述第二分数与预设值和所述程度副词的程度值的乘积;若仅存在所述否定词,则确定所述负向情感词的分数为所述第二分数与预设值的乘积;若仅存在所述程度副词,则确定所述负向情感词的分数为所述第二分数与所述程度副词的程度值的乘积;其中,N为正整数。

可选地,根据所述正向情感词的分数、所述正向情感词的个数、所述负向情感词的分数和所述负向情感词的个数,计算所述评论文本数据的情感分数,包括:

在所述正向情感词的个数等于所述负向情感词的个数的情况下,确定所述情感分数为第一情感分数,所述第一情感分数为所述正向情感词的分数与所述负向情感词的分数的和,与,所述正向情感词的个数与所述负向情感词的个数的和的比值;

在所述正向情感词的个数大于所述负向情感词的个数的情况下,确定所述情感分数为第二情感分数,所述第二情感分数为所述正向情感词的分数与所述正向情感词的个数的比值,与,所述第一情感分数的平均值;

在所述正向情感词的个数小于所述负向情感词的个数的情况下,确定所述情感分数为第三情感分数,所述第三情感分数为所述负向情感词的分数与所述负向情感词的个数的比值,与,所述第一情感分数的平均值。

第二方面,本申请实施例还提供一种课程质量分析系统,包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的课程质量分析方法的步骤。

第三方面,本申请实施例还提供一种课程质量分析装置,包括:

获取模块,用于获取第一课程的评论文本数据;

分类模块,用于基于属性分类模型,对所述评论文本数据进行属性分类;

确定模块,用于基于情感计算模型,确定所述评论文本数据的情感极性;

计算模块,用于根据所述情感极性和分类结果,计算所述第一课程的评分。

第四方面,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的课程质量分析方法的步骤。

本申请的上述技术方案至少具有如下有益效果:

本申请实施例的课程质量分析方法,首先,获取第一课程的评论文本数据;其次,基于属性分类模型,对所述评论文本数据进行属性分类;再次,基于情感计算模型,确定所述评论文本数据的情感极性;最后,根据所述情感极性和分类结果,计算所述第一课程的评分。如此,实现了依靠人工智能、自然语言处理技术对智能线上学习者发送的评论进行属性分类和情感计算,将学习者的每一种属性话术进行情感计算,最终根据不同属性的评论文本数据的得分对第一课程进行智能评估,便于根据评估结果对课程进行改进,以利于平台的持久发展。

附图说明

图1为本申请实施例的课程质量分析方法的流程示意图;

图2为本申请实施例的课程质量分析装置的结构示意图。

具体实施方式

为使本申请要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。在下面的描述中,提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本申请的实施例。因此,本领域技术人员应该清楚,可以对这里描述的实施例进行各种改变和修改而不脱离本申请的范围和精神。另外,为了清楚和简洁,省略了对已知功能和构造的描述。

应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。

在本申请的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

在本申请所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。

在进行本申请实施例的说明时,首先对与本申请实施例相关的技术进行解释说明。

情绪分析,目标是从评论文本中分析出用户对于实体及其属性所表达的观点、情感、评价、态度和情绪。如今,情续分析被广泛应用于旅游、金融服务、消费产品、医院、社会舆情监控,客户反馈跟踪,选举预测、股票市场预测和健康医疗等社会事件。

情感计算经常使用的方法有监督学习、半监督学习、无监督学习。基于监督的学习方法通常是使用机器学习算法进行分类,例如:支持向量机,基于训练样本,通过一系列规则或者在目标函数的指导下自动构建一个模型。半监督学习可以减少大量样本数据的标注工作,从而节省时间和人力成本,在一定程度上还能保证实验的性能。无监督学习一般包括用户信息计算相似度,构建词典以及使用句法模板和网页检索。对一个新业务或者新领域的初期研究来讲,基于词典的方法可以快速、准确地对业务进行推进,不需要花费太多的人力成本和时间成本去整理大规模地语料。

目前对文本进行情感分析的研究也很多,其中有利用Bert微调模型对评论文本进行情感分析。该方案的研究点是对条件随机场(Conditional Random Field,CRF)抽取的评论目标利用Bert模型进行情感分析,得到的最终结果是反馈该条评论的评价目标的情感倾向。另外基于文本情感分析的大型开放式网络课程(Massive Open Online Courses,MOOC)评论分析系统及方法,旨在通过用户模块、课程数据管理模块、评论分析模块、概率分析模块实现对MOOC上的评论进行逐条分析。最终的效果也是实现对单条评论的一个情感分析。

现有的技术,基于机器学习的方法,对短文本的特征提取有局限性。如果只是使用正负情感辞典与短文本的匹配进行情感词的确定,会忽略双重否定、程度修饰的问题,导致句子的情感倾向单纯由情感词个数决定。

基于上述内容,如图1所示,本申请实施例提供一种课程质量分析方法,该方法包括:

步骤101,获取第一课程的评论文本数据;

这里,需要说明的是,本申请实施例中的第一课程可以是MOOC上的已经上线的具体某一门课程,评论文本数据为该课程的全部评论。

步骤102,基于属性分类模型,对所述评论文本数据进行属性分类;

本步骤中,评论文本的属性可以包括但不限于下述内容:教学者的语速、教学者的授课方式、课件、视频、学习者和平台等。

步骤103,基于情感计算模型,确定所述评论文本数据的情感极性;

本步骤中,将倾向积极、肯定和赞扬等正面的文本看作正例,将倾向消极、否定和批评等负面的文本看作负例,如果一个评论文本中不含情感倾向的词语,则为中性文本,表示客观句,不属于情感倾向分析的对象。

步骤104,根据所述情感极性和分类结果,计算所述第一课程的评分。

本申请实施例的课程质量分析方法,首先,获取第一课程的评论文本数据;其次,基于属性分类模型,对所述评论文本数据进行属性分类;再次,基于情感计算模型,确定所述评论文本数据的情感极性;最后,根据所述情感极性和分类结果,计算所述第一课程的评分。如此,实现了依靠人工智能、自然语言处理技术对智能线上学习者发送的评论进行属性分类和情感计算,将学习者的每一种属性话术进行情感计算,最终根据不同属性的评论文本数据的得分对第一课程进行智能评估,便于根据评估结果对课程进行改进,以利于平台的持久发展。

作为一个可选的实现方式,步骤103,根据所述情感极性和分类结果,计算所述第一课程的评分,包括:

步骤一:根据每一类属性的不同情感极性的评价文本比例以及对应的极性计算正确率,确定每一类属性的得分;其中,所述情感极性包括:正向情感和/或负向情感;

这里,需要说明的是,极性计算的正确率为预先确定的正确率,具体的,可以根据之前搜集的课程评论中,人工挑选出M条正向评论和M条负向评论,对M条正向评论和M条负向评论分别进行记性计算,根据计算结果确定正向评论的正确率和负向评论的正确率;如:M为1000,正向评论的正确率为89.1%,负向评论的正确率为88.4%;

换一种方式说,每一类属性的评论文本数据的得分可以按照如下公式进行计算:

Score=Positive×acc_pos+(-negative×acc_neg)

其中,Score为同一类属性的评论文本数据的得分,Positive为该类属性中的正向评论文本比例,negative为该类属性中的负向评论文本比例,acc_pos为正向评论的正确率,acc_neg为负向评论的正确率。

步骤二:根据各类属性的得分以及各类属性的权重,确定第一课程的评分;其中,该评分可以为各类属性与其对应的权重的乘积的和。

这里,需要说明的是,本步骤中的权重为预先确定好的权重,具体的权重确定方式为:基于微软新推出的搜索引擎Bing,通过限定领域构造术语的联合检索式,检索课程评论分别与语速、视频、授课方式、学习者、平台和课件等属性在MOOCs领域的检索的命中数。权重取决于各属性与课程评论在Bing网页中关于MOOCs领域所检索出来的命中数与几个属性检索出的总命中数之比。各属性的检索式为(“课程评论”NEAR“属性”)AND(MOOCs)。

作为一个可选的实现方式,所述第一课程的评分包括下述至少一项:

教育者角度对应的第一评分;具体的,从教育者角度,课程评分与视频、授课方式、学习者和课件四个属性相关,因此,第一评分的计算公式可以为:

Score_edu=a

其中,a

学习者角度对应的第二评分;具体的,从学习者角度,课程评分与视频、授课方式和课件三个属性相关,因此,第二评分的计算公式可以为:

Score_learner=b

其中,b

平台角度对应的第三评分;具体的,从平台角度,课程评分仅与平台属性相关,因此,第三评分的计算公式可以为:

Score_plat=Positive1×acc_pos+(-negative1×acc_neg)

其中,Positive1为平台属性中的正向评论文本比例,negative1为平台属性中的负向评论文本比例,acc_pos为正向评论的正确率,acc_neg为负向评论的正确率,Score_plat为第三评分。

具体的,这里需要说明的是,各类属性在不同角度中所占的权重不同。

本申请实施例对第一课程的全部评论进行属性分类、情感计算并基于不同角度进行统计打分,最终得到的是关于第一课程在平台、学习者和教学者三个角度的三个评分,根据这三个评分更好地帮助平台了解用户的学习效果和平台上的课程质量,从而实现线上课程的智能评估,有利于后期平台课程的改进和平台的持久发展。

作为一个可选的实现方式,所述属性分类模型的训练过程包括:

步骤一:获取用于训练所述属性分类模型的语料信息;

这里,需要说明的是,在该步骤之前,还需要根据前期调研,划分出适合平台、客服和客户的评估属性,如此,该步骤则针对划分的各个评估属性准备一定数量的语料信息。

步骤二:将所述语料信息输入至预先搭建的文本分类模型,对所述文本分类模型进行训练;

本步骤中,文本分类模型可以为文本卷积神经网络(Text Convolutional NeuralNetworks,TextCNN)模型,这样,能更好的捕获局部语义特征。比如:“老师的授课方式非常有趣”,“非常”是修饰“有趣”的程度的,对于短文本,口语化比较多,表达方式相对随意的对话来说,对文本的特征获取相对更有挑战,获取局部特征比较好的算法会对语句中的关键词捕捉的更好,更好地表达语义。

另外,由于TextCNN的输入是矩阵多维向量,因此需要对训练评论文本进行建模,定义每个评论文本为

步骤三:根据所述文本分类模型输出的分类结果和信息熵,调整所述文本分类模型的模型参数。

这里,需要说明的是,信息熵为信息中排除了冗余后的平均信息量,其是用来描述信源的不确定度。

本步骤中,通过将文本分类模型输出的分类结果和信息熵,与,人工检测部分分类结果和对应的信息熵进行比对,一者,根据比对结果对文本分类模型的模型参数进行调整,使得文本分类模型的输出结果满足用户需求;二者,这种比对表明利用信息熵作为分类的参考依据是合理的。

进一步地,作为一个可选的实现方式,将所述语料信息输入至预先搭建的文本分类模型,对所述文本分类模型进行训练之前,所述方法还包括:

步骤一:对所述语料信息进行预处理;

本步骤中,预处理可以是对评论文本数据进行清洗、分词处理,去停用词处理等,其中,清洗包括采用正则表达式去除网页链接和表情符号;分词处理优选采用基于python的结巴分词进行。

步骤二:基于预先训练的词-向量转化模型,将预处理后的语料信息转化为词向量;

本步骤中,词-向量转化模型可以为word2vec模型,word2vec模型是一群用来产生词向量的相关模型,这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。word2vec模型可以根据给定的语料库,通过优化后的训练模型快速有效地将一个词语表达成向量形式,如此,实现了在转化过程中考虑词的语义的问题。

步骤三:将所述语料信息输入至预先搭建的文本分类模型,对所述文本分类模型进行训练,包括:

将所述词向量输入至预先搭建的文本分类模型,对所述文本分类模型进行训练。

作为一个可选的实现方式,步骤103,基于情感计算模型,确定所述评论文本数据的情感极性,包括:

步骤一:遍历所述评论文本数据,将所述评论文本数据与预先构建的基础词典进行匹配,计算所述评论文本数据的正向情感词的分数、正向情感词的个数、负向情感词的分数和负向情感词的个数;

这里,需要说明的是,基础词典可以包括否定词词典、副词词典、正向情感词典和负向情感词典。

步骤二:根据所述正向情感词的分数、所述正向情感词的个数、所述负向情感词的分数和所述负向情感词的个数,计算所述评论文本数据的情感分数;

步骤三:根据所述情感分数,确定所述评论文本数据的情感极性。

这里,需要说明的是,在情感分数大于预设值的情况下,确定该评论文本数据的情感极性为正向情感,在情感分数小于预设值的情况下,确定该评论文本数据的情感极性为负向情感,在情感分数为预设值的情况下,确定该评论文本数据的情感极性为中性。

作为一个具体的实现方式,计算所述评论文本数据的正向情感词的分数包括:

首先,判断所述正向情感词的前N个词内是否存在否定词和程度副词;其中,N为正整数,如N可以选为3。

其次,根据判断结果,按照不同的情况计算正向情感词的分数,具体包括如下四种情况:

情况一:正向情感词的前N个词内不存在否定词和程度副词,确定所述正向情感词的分数为根据与所述基础词典匹配的结果计算的第一分数。

这里,需要说明的是,该第一分数为根据正向情感词在正向情感词典中对应的情感强度确定。

情况二:正向情感词的前N个词内存在否定词和程度副词,确定所述正向情感词的分数为所述第一分数与预设值和所述程度副词的程度值的乘积;

这里,需要说明的是,该预设值可以为-1。

情况三:正向情感词的前N个词内仅存在否定词,确定所述正向情感词的分数为所述第一分数与预设值的乘积;

情况四,正向情感词的前N个词内仅存在程度副词,确定所述正向情感词的分数为所述第一分数与所述程度副词的程度值的乘积。

本具体实现方式中,正向情感词的分数不仅跟正向情感词本身相关,还与正向情感词的否定词和程度副词相关,如此,进一步提高了正向情感词的分数的准确性。

作为另一个具体的实现方式,计算所述评论文本数据的负向情感词的分数包括:

首先,判断所述负向情感词的前N个词内是否存在否定词和程度副词;其中,N为正整数,如N可以选为3。

其次,根据判断结果,按照不同的情况计算负向情感词的分数,具体包括如下四种情况:

情况一:负向情感词的前N个词内不存在否定词和程度副词,确定所述负向情感词的分数为根据与所述基础词典匹配的结果计算的第二分数;

这里,需要说明的是,该第二分数为根据负向情感词在负向情感词典中对应的情感强度确定。

情况二:负向情感词的前N个词内存在否定词和程度副词,确定所述负向情感词的分数为所述第二分数与预设值和所述程度副词的程度值的乘积;

这里,需要说明的是,该预设值可以为-1。

情况三:负向情感词的前N个词内仅存在否定词,确定所述负向情感词的分数为所述第二分数与预设值的乘积;

情况四,正向情感词的前N个词内仅存在程度副词,确定所述负向情感词的分数为所述第二分数与所述程度副词的程度值的乘积。

同样的,本具体实现方式中,负向情感词的分数不仅跟负向情感词本身相关,还与负向情感词内的否定词和程度副词相关,如此,进一步提高了负向情感词的分数的准确性。

作为一个可选的实现方式,根据所述正向情感词的分数、所述正向情感词的个数、所述负向情感词的分数和所述负向情感词的个数,计算所述评论文本数据的情感分数,包括:

在所述正向情感词的个数等于所述负向情感词的个数的情况下,确定所述情感分数为第一情感分数,所述第一情感分数为所述正向情感词的分数与所述负向情感词的分数的和,与,所述正向情感词的个数与所述负向情感词的个数的和的比值;

在所述正向情感词的个数大于所述负向情感词的个数的情况下,确定所述情感分数为第二情感分数,所述第二情感分数为所述正向情感词的分数与所述正向情感词的个数的比值,与,所述第一情感分数的平均值;

在所述正向情感词的个数小于所述负向情感词的个数的情况下,确定所述情感分数为第三情感分数,所述第三情感分数为所述负向情感词的分数与所述负向情感词的个数的比值,与,所述第一情感分数的平均值。

这种计算评论文本数据的情感分数的方式,防止了因为情感词的个数决定整个句子的情感倾向,提高了情感倾向确定的准确性。

本申请实施例的课程质量分析方法,依靠人工智能、自然语言处理技术对智能线上学习者发表的评论进行属性分类(采用卷积神经网络对评论文本进行属性分类)和情感计算(基于情感词典对评论进行极性计算,得到每个属性中正向评论所占比例、负向评论所占比例、中性评论所占比例和无效评论所占比例),将用户的每一种属性话术进行情感计算,最终根据不同属性在不同评价角度所占的权重(基于网页检索命中数作为权重)进行策略统计分析。将学习者的学习评论依据不同的情感计算结果和分类结果,从平台、学习者和教师三方面进行评估。从而更好地帮助平台了解用户的学习效果和平台上的课程质量,从而实现线上课程的智能评估,有利于后期平台课程的改进和平台的持久发展。

如图2所示,本申请实施例还提供一种课程质量分析装置,包括:

获取模块201,用于获取第一课程的评论文本数据;

分类模块202,用于基于属性分类模型,对所述评论文本数据进行属性分类;

确定模块203,用于基于情感计算模型,确定所述评论文本数据的情感极性;

计算模块204,用于根据所述情感极性和分类结果,计算所述第一课程的评分。

本申请实施例的课程质量分析装置,首先,获取模块201获取第一课程的评论文本数据;其次,分类模块202基于属性分类模型,对所述评论文本数据进行属性分类;再次,确定模块203基于情感计算模型,确定所述评论文本数据的情感极性;最后,计算模块204根据所述情感极性和分类结果,计算所述第一课程的评分。如此,实现了依靠人工智能、自然语言处理技术对智能线上学习者发送的评论进行属性分类和情感计算,将学习者的每一种属性话术进行情感计算,最终根据不同属性的评论文本数据的得分对第一课程进行智能评估,便于根据评估结果对课程进行改进,以利于平台的持久发展。

可选地,所述计算模块204包括:

第一确定子模块,用于根据每一类属性的不同情感极性的评价文本比例以及对应的极性计算正确率,确定每一类属性的得分;

第二计算子模块,用于根据各类属性的得分以及各类属性的权重,确定第一课程的评分;

其中,所述情感极性包括:正向情感和/或负向情感。

可选地,所述第一课程的评分包括下述至少一项:

教育者角度对应的第一评分;

学习者角度对应的第二评分;

平台角度对应的第三评分。

可选地,各类属性在不同角度中所占的权重不同。

可选地,所述装置还包括:

训练模块,用于训练所述属性分类模型;其中,所述训练模块包括:

获取子模块,用于获取用于训练所述属性分类模型的语料信息;

训练子模块,用于将所述语料信息输入至预先搭建的文本分类模型,对所述文本分类模型进行训练;

调整子模块,用于根据所述文本分类模型输出的分类结果和信息熵,调整所述文本分类模型的模型参数。

可选地,所述训练模块还包括:

处理子模块,用于对所述语料信息进行预处理;

转化子模块,用于基于预先训练的词-向量转化模型,将预处理后的语料信息转化为词向量;

所述训练子模块具体用于将所述词向量输入至预先搭建的文本分类模型,对所述文本分类模型进行训练。

可选地,所述确定模块203包括:

第一计算子模块,用于遍历所述评论文本数据,将所述评论文本数据与预先构建的基础词典进行匹配,计算所述评论文本数据的正向情感词的分数、正向情感词的个数、负向情感词的分数和负向情感词的个数;

第二计算子模块,用于根据所述正向情感词的分数、所述正向情感词的个数、所述负向情感词的分数和所述负向情感词的个数,计算所述评论文本数据的情感分数;

第三确定子模块,用于根据所述情感分数,确定所述评论文本数据的情感极性。

可选地,所述第一计算子模块在用于计算所述评论文本数据的正向情感词的分数时具体用于:

判断所述正向情感词的前N个词内是否存在否定词和程度副词,若都不存在,则确定所述正向情感词的分数为根据与所述基础词典匹配的结果计算的第一分数;若都存在,则确定所述正向情感词的分数为所述第一分数与预设值和所述程度副词的程度值的乘积;若仅存在所述否定词,则确定所述正向情感词的分数为所述第一分数与预设值的乘积;若仅存在所述程度副词,则确定所述正向情感词的分数为所述第一分数与所述程度副词的程度值的乘积;其中,N为正整数。

可选地,所述第一计算子模块在用于计算所述评论文本数据的负向情感词的分数时具体用于:

判断所述负向情感词的前N个词内是否存在否定词和程度副词,若都不存在,则确定所述负向情感词的分数为根据与所述基础词典匹配的结果计算的第二分数;若都存在,则确定所述负向情感词的分数为所述第二分数与预设值和所述程度副词的程度值的乘积;若仅存在所述否定词,则确定所述负向情感词的分数为所述第二分数与预设值的乘积;若仅存在所述程度副词,则确定所述负向情感词的分数为所述第二分数与所述程度副词的程度值的乘积;其中,N为正整数。

可选地,所述第二计算子模块包括:

第一确定单元,用于在所述正向情感词的个数等于所述负向情感词的个数的情况下,确定所述情感分数为第一情感分数,所述第一情感分数为所述正向情感词的分数与所述负向情感词的分数的和,与,所述正向情感词的个数与所述负向情感词的个数的和的比值;

第二确定单元,用于在所述正向情感词的个数大于所述负向情感词的个数的情况下,确定所述情感分数为第二情感分数,所述第二情感分数为所述正向情感词的分数与所述正向情感词的个数的比值,与,所述第一情感分数的平均值;

第三确定单元,用于在所述正向情感词的个数小于所述负向情感词的个数的情况下,确定所述情感分数为第三情感分数,所述第三情感分数为所述负向情感词的分数与所述负向情感词的个数的比值,与,所述第一情感分数的平均值。

本申请实施例还提供一种课程质量分析系统,包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上所述的课程质量分析方法实施例的各个过程,且能达到相同的技术效果,为了避免重复,这里不再赘述。

本领域技术人员可以理解,实现上述实施例的全部或者部分步骤可以通过硬件来完成,也可以通过计算机程序来指示相关的硬件来完成,所述计算机程序包括执行上述方法的部分或者全部步骤的指令;且该计算机程序可以存储于一可读存储介质中,存储介质可以是任何形式的存储介质。

另外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有程序,该程序被处理器执行时实现如上所述的传课程质量分析方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,该计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。

此外,需要指出的是,在本申请的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序或按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本申请的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本申请的说明的情况下运用他们的基本编程技能就能实现的。

因此,本申请的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本申请的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本申请,并且存储有这样的程序产品的存储介质也能构成本申请。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号