首页> 中国专利> 一种英语作文情感观点的分析方法

一种英语作文情感观点的分析方法

摘要

本发明提供了一种英语作文情感观点的分析方法,该方法包括一个由顺序连接的英语作文及其范文预处理模块、英语作文情感分析模块、英语作文观点分析模块、英语作文情感观点分析结果生成模块组成的分析模型。一篇英语作文通过该分析模型处理后,最后能够得到这篇英语作文的情感观点分析结果。本发明的方法只依靠少量英语范文,就能够分析出一篇英语作文的情感与观点,解决了传统的英语作文情感观点分析方法无法分析词汇与词汇之间的相关性,分析英语作文情感观点准确率较低的问题。

著录项

  • 公开/公告号CN106776551A

    专利类型发明专利

  • 公开/公告日2017-05-31

    原文格式PDF

  • 申请/专利权人 桂林电子科技大学;

    申请/专利号CN201611110038.X

  • 发明设计人 黄桂敏;李会娟;黄思睿;

    申请日2016-12-06

  • 分类号G06F17/27;

  • 代理机构桂林市华杰专利商标事务所有限责任公司;

  • 代理人罗玉荣

  • 地址 541004 广西壮族自治区桂林市七星区金鸡路1号

  • 入库时间 2023-06-19 02:23:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-12-13

    专利实施许可合同备案的生效 IPC(主分类):G06F40/289 专利申请号:201611110038X 专利号:ZL201611110038X 合同备案号:X2022450000186 让与人:桂林电子科技大学 受让人:桂林睿森教育服务有限公司 发明名称:一种英语作文情感观点的分析方法 申请日:20161206 申请公布日:20170531 授权公告日:20200508 许可种类:普通许可 备案日期:20221125

    专利实施许可合同备案的生效、变更及注销

  • 2020-05-08

    授权

    授权

  • 2017-06-23

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20161206

    实质审查的生效

  • 2017-05-31

    公开

    公开

说明书

技术领域

本发明涉及自然语言处理技术、英语短文本分析技术,具体是一种利用计算机系统对英语作文进行情感观点挖掘的方法。

背景技术

分析英语作文的情感观点表达是评价英语作文书写内容的重要指标之一。现有的英语作文情感观点分析技术主要分为潜在狄利克雷分布方法和机器学习相关方法,但是这些方法大多数是采用“词袋”作为基本单元,存在着忽略了词汇与词汇之间的相关性,挖掘英语作文的情感观点准确率较低,挖掘英语作文的情感观点之前需要用大量的英语范文训练构建分析模型,而收集大量的英语范文较为耗时耗力的问题。因此,为了更好的应用在英语作文自动批阅系统中,需要一种只依靠少量英语范文的英语作文情感观点挖掘方法,它能够快速高效的分析出英语作文的情感观点,并且对于国内的英语作文自动批阅技术具有重要的意义。

发明内容

1.一种英语作文情感观点的分析方法,其特征是:包括一个由顺序连接的英语作文及其范文预处理模块、英语作文情感分析模块、英语作文观点分析模块、英语作文情感观点分析结果生成模块组成的分析模型,该分析模型总体处理步骤如图1所示。

在分析模型中,第一步英语作文及其范文预处理模块读入一篇英语作文及其英语范文,对它们进行分句、分词、去停用词、词干化和词性标注,输出该英语作文及其英语范文的预处理结果;第二步英语作文情感分析模块读入该英语作文及其英语范文的预处理结果,在预处理结果中找出情感单词,并计算该英语作文中每个句子的情感得分和整篇作文情感得分,输出该英语作文情感得分;第三步英语作文观点分析模块读入该英语作文及其英语范文的预处理结果,在预处理结果中循环抽取该英语作文及其英语范文的主题单词、主题,并计算该英语作文与其英语范文的主题相似度,输出该英语作文的观点得分;第四步英语作文情感观点分析结果生成模块读入该英语作文情感得分和观点得分,并计算该英语作文情感和观点总分,输出该英语作文情感和观点评语;下面是该分析模型中每个模块的处理步骤:

(1)所述的英语作文及其范文预处理模块处理步骤如下,如图2所示:

P201开始;

P202读入英语范文;

P203对英语范文分句分词;

P204对英语范文去停用词,输出英语范文去停用词结果;

P205对英语范文词干化;

P206对英语范文进行词性标注,输出英语范文词性标注结果;

P207读入英语作文;

P208对英语作文分句分词;

P209对英语作文去停用词,输出英语作文去停用词结果;

P210对英语作文词干化;

P211对英语作文进行词性标注,输出英语作文词性标注结果;

P212结束;

(2)所述的英语作文情感分析模块处理步骤如下,如图3所示:

P301开始;

P302读入英语作文词性标注结果中一个句子;

P303读入英语作文一个句子中的一组单词-词性;

P304根据程度副词集判断读入的英语作文的单词,如果该单词是程度副词,转P305操作,否则转P306操作;

P305根据公式(1)计算程度副词的情感强度,转P311操作;

P306根据否定词集判断读入的英语作文的单词,如果该单词是否定词,转P307操作,否则转P308操作;

P307统计否定词出现的个数,转P311操作;

P308如果该单词词性是形容词、名词、动词、副词的一种,转P309操作,否则转P311操作;

P309保存英语作文的情感单词和其出现的次数;

P310根据词汇情感库,利用公式(2)计算词汇情感库中情感单词极性值,利用公式(3)计算词汇情感库中情感单词极性强度,利用公式(4)计算英语作文中情感单词权值;

P311如果该句子中还有单词,转P303操作,否则转P312操作;

P312根据公式(5)计算英语作文中句子的情感得分;

P313如果英语作文中还有句子,转P302操作,否则转P314操作;

P314根据英语作文中情感单词出现的次数将其排序,输出英语作文的情感单词;

P315根据公式(6)计算并输出英语作文的情感得分;

P316根据公式(7)判断并输出英语作文的情感倾向;

P317结束;

(3)所述的英语作文观点分析模块处理步骤如下,如图4所示:

P401开始;

P402读入英语范文的去停用词结果;

P403读入英语作文的去停用词结果;

P404设置英语范文和英语作文的每个主题分布的先验分布参数;

P405设置英语范文和英语作文的每个主题的各个观点词分布的先验分布参数;

P406设置英语范文和英语作文的观点词个数,主题个数;

P407设置计算英语范文和英语作文的主题分布矩阵和每个主题对应各个观点词的分布矩阵的最大取样次数;

P408随机分配英语范文和英语作文中句子的单词到对应主题作为初始值;

P409如果取样次数小于最大取样次数,转P410操作,否则转P415操作;

P410统计英语范文和英语作文单词分配给每个主题的次数;

P411根据公式(8)计算英语范文中各个单词分配给每个主题的概率,根据公式(10)计算英语作文中各个单词分配给每个主题的概率;

P412根据公式(9)计算英语范文中各个句子分配给每个主题的概率,根据公式(11)计算英语作文中各个句子分配给每个主题的概率;;

P413根据范文和英语作文中的句子分配给每个主题的概率值统计每篇英语范文和英语作文在每个主题下出现的次数;

P414取样次数增加1,转P409操作;

P415根据每篇英语作文和英语范文在不同主题下出现的次数和单词分配给每个主题的次数分数计算英语作文和英语范文的作文主题分布矩阵、主题观点词分布矩阵;

P416从英语范文和英语作文的主题概率分布中分别统计出它们的最大主题;

P417根据英语作文的最大主题从英语作文主题单词分布中分析出它的观点词,输出英语作文观点词;

P418根据公式(12)计算英语范文和英语作文的主题相似度;

P419得到并输出英语作文的观点得分;

P420结束。

(4)所述的英语作文情感观点分析结果生成模块处理步骤如下,如图5所示:

P501开始;

P502读入英语作文的情感得分;

P503读入英语作文的观点得分;

P504计算英语作文的情感观点总分;

P505输出生成的英语作文情感观点评语;

P506结束。

2.本发明方法的基本概念定义如下:

(1)词汇情感库结构

词汇情感库是指包含所有情感单词的情感信息的同义词集合。在词汇情感库中,每一行表示一个单词的情感记录,每个单词的存储结构如下:

<单词词性><单词序号><单词积极得分><单词消极得分><单词#单词在同义词集序号>

(2)增强情感语气类程度副词与减弱情感语气类程度副词

3.本发明方法的计算公式念定义如下:

(1)程度副词情感强度计算公式

(2)情感单词极性值的计算公式

在公式(2)中,n是情感单词所在的同义词集的个数;i是情感单词所在的同义词集中的序号;情感单词积极得分是词汇情感库中情感单词所在同义词集中的积极得分;情感单词消极得分是词汇情感库中情感单词所在同义词集中的消极得分。

(3)情感单词极性强度的计算公式

(4)英语作文句子情感得分的计算公式

在公式(5)中,正向情感单词权值总和是指在公式(4)中计算出的每个大于0的英语作文情感单词权值的总和,负向情感单词权值总和是指在公式(4)中计算出的每个小于0的英语作文情感单词权值的总和。

(5)英语作文情感得分的计算公式

在公式(6)中,正向句子情感得分总和是指在公式(5)中计算出的每个大于0的英语作文句子情感得分的总和,负向句子情感得分总和是指在公式(5)中计算出的每个小于0的英语作文句子情感得分的总和。

(6)英语作文情感倾向的计算公式

在公式(7)中,英语作文情感得分由公式(6)计算得到。

(8)英语范文各单词分配给每个主题概率值的计算公式如下:

在公式(8)中,i=1,2,3,…,n,n是指英语范文中单词w出现的总次数;k=1,2,3,…,t,t是指英语范文和英语作文中设定的主题数;w=1,2,3,…,m,m是指英语范文中所有单词的总数。

(9)英语范文各句子分配给每个主题概率值的计算公式

在公式(9)中,k=1,2,3,…,t,t是指英语范文和英语作文中设定的主题数;s=1,2,3,…,p,p是指英语范文中的句子总数;w=1,2,3,…,m,m是指英语范文句子中所有单词的总数;单词w分配给主题的概率值是指在公式(8)中计算出的英语范文中的单词分配给主题的概率值。

(10)英语作文各单词分配给每个主题概率值的计算公式

在公式(10)中,j=1,2,3,…,n,n是指英语作文中单词w出现的总次数;k=1,2,3,…,t,t是指英语范文和英语作文中设定的主题数;w=1,2,3,…,m,m是指英语作文中所有单词的总数。

(11)英语作文各句子分配给每个主题概率值的计算公式

在公式(11)中,k=1,2,3,…,t,t是指英语范文和英语作文中设定的主题数;s=1,2,3,…,p,p是指英语作文的句子总数。w=1,2,3,…,m,m是指英语作文句子中所有单词的总数。单词w分配给主题的概率值是指在公式(10)中计算出的英语作文中单词分配给主题的概率值。

(12)英语作文和英语范文主题相似度的计算公式

在公式(12)中,英语范文d在主题k下概率是指公式(9)中计算出的英语范文分配给主题的概率值,英语作文在主题k下概率是指公式(12)中计算出的英语作文分配给主题的概率值。d=1,2,…,r,r是指英语范文的总数。k=1,2,…,t,t是指英语范文和英语作文中设定的主题数。

附图说明

图1是本发明方法的总体处理步骤图;

图2是本发明方法的英语作文及其范文预处理模块处理步骤图;

图3是本发明方法的英语作文情感分析模块处理步骤图。

图4是本发明方法的英语作文观点分析模块处理步骤图。

图5是本发明方法的英语作文情感观点分析结果生成模块处理步骤图。

具体实施方式

本发明的一种英语作文情感观点的分析方法的具体实施方式包括以下步骤。

步骤一:执行“英语作文及其范文预处理模块”

(1)对英语范文和英语作文进行预处理,其中英语范文是与英语作文题目要求一致的英语作文。本发明实施方式中英语范文和英语作文的题目均为“Health Gains inDeveloping Countries”,其内容如下所示:

Health Gains in Developing Countries

From the pictures,we find the life expectancy in 1960 is less thanthat in 1990.And the infant mortaility in 1960 is more than that in 1990.Thismeans recently more and more babies are born and less and less peopledied.This change happens because of some factors.First,the technology ofmedcine rises and the skills of doctors rise.Doctors can make many peoplereturn into health.Second,the life is good,when a person is ill,he has enoughmoney to go to hosipital,and people now can eat enough and well so theirhealth become better.Thirty years before,some woman and their baby diedtogether,because of having no medcine and doctors having less skills.In somecountryside,when a girl was born,the family took her out of home and refusedto receive her,so many girl babies died.Now the government prohibits peopleto do such thing.So the infant mortality becomes less with the skills andmedcine rise and the rule carried on.

(2)对输入的英语作文进行分句、分词、去停用词处理,生成的处理结果如下所示:

pictures find life expectancy less infant mortaility more meansrecently more babies born less people died change happens factors firsttechnology medcine rises skills doctors rise doctors make many people returninto health second life good when person ill enough money hosipital peopleeat enough well health become better thirty years before woman baby diedtogether having no medcine doctors having less skills countryside girl bornfamily took home refused receive many girl babies died government prohibitspeople such infant mortality less skills medcine rise rule carried

(3)接着对上一步的结果进行词干化、词性标注处理,生成的处理结果如下所示:

picture/NN find/VB life/NN expectancy/NN less/JJR infant/JJmortaility/NN more/JJR mean/VB recently/RB more/JJR baby/NN born/VBN less/JJRpeople/NNS die/VB change/NN happen/VB factor/NN first/JJ technology/NNmedcine/NN rise/NN skill/NN of/IN doctor/NN rise/VB doctor/NN make/VB many/JJpeople/NNS return/VB into/IN health/NN second/LS life/NN good/JJ when/WRBperson/NN ill/RB enough/JJ money/NN hosipital/NN people/NNS eat/VB enough/RBwell/RB health/NN become/VBP better/JJR thirty/CD year/NN before/RB woman/NNbaby/NN die/VB together/RB have/VB no/DT medcine/JJ doctor/NN have/VB less/JJR skill/NN countryside/NN girl/NN born/VBN family/NN took/VBD home/NN and/CC refuse/VB receive/VB many/JJ girl/NN baby/NN die/VB government/NNprohibit/VB people/NNS such/JJ infant/JJ mortality/NN less/JJR skill/NNmedcine/NN rise/NN rule/NN carry/VB

步骤二:执行“英语作文情感分析模块”

英语作文情感分析模块是通过输入上述步骤一的英语作文词性标注结果从单词级别、句子级别和篇章级别对英语作文进行情感分析,本实施方式的情感分析过程如下:

(1)利用词汇情感库对英语作文中的情感单词计算分析得出情感单词所属所有词性的情感强度,生成英语作文的情感强度结果如下所示:

名词#find#positive

动词#find#weak_positive

名词#life#weak_positive

名词#expectancy#weak_negative

形容词#less#negative

副词#less#weak_positive

名词#infant#null

形容词#more#null

名词#more#null

副词#more#null

名词#means#null

副词#recently#null

形容词#more#null

名词#more#null

副词#more#null

形容词#born#weak_positive

名词#born#null

形容词#less#negative

副词#less#weak_positive

名词#people#null

动词#people#null

名词#change#weak_positive

动词#change#weak_positive

形容词#first#weak_positive

名词#first#weak_positive

副词#first#null

名词#technology#null

名词#rise#weak_positive

动词#rise#weak_positive

名词#make#positive

动词#make#weak_positive

形容词#many#null

名词#people#null

动词#people#null

名词#return#weak_negative

动词#return#weak_positive

名词#health#positive

形容词#second#null

名词#second#weak_negative

副词#second#null

动词#second#positive

名词#life#weak_positive

形容词#good#positive

名词#good#positive

副词#good#weak_positive

名词#person#null

形容词#ill#negative

名词#ill#negative

副词#ill#strong_negative

形容词#enough#weak_positive

名词#enough#null

副词#enough#weak_positive

名词#money#null

名词#people#null

动词#people#null

动词#eat#weak_positive

形容词#enough#weak_positive

名词#enough#null

副词#enough#weak_positive

形容词#well#positive

名词#well#weak_negative

副词#well#positive

动词#well#null

名词#health#positive

动词#become#weak_positive

形容词#better#strong_positive

名词#better#positive

副词#better#strong_positive

动词#better#positive

形容词#thirty#null

名词#thirty#null

名词#years#null

副词#before#null

名词#woman#null

名词#baby#null

动词#baby#weak_negative

形容词#together#positive

副词#together#null

形容词#no#null

名词#no#weak_negative

副词#no#weak_negative

形容词#less#negative

副词#less#weak_positive

名词#countryside#null

名词#girl#weak_positive

形容词#born#weak_positive

名词#born#null

名词#family#null

形容词#home#null

名词#home#weak_positive

副词#home#null

动词#home#null

动词#receive#weak_positive

形容词#many#null

名词#girl#weak_positive

名词#government#null

名词#people#null

动词#people#null

形容词#such#weak_negative

副词#such#null

名词#infant#null

名词#mortality#null

形容词#less#negative

副词#less#weak_positive

名词#rise#weak_positive

动词#rise#weak_positive

名词#rule#weak_positive

(2)根据英语作文中单词的词性标注结果和在词汇情感库中的情感强度计算英语作文的情感单词权值,生成英语作文的句子情感得分,其生成结果如下所示:

句子1情感得分[health,gain,develop,country,report,life,expectancy,develop,country,increase,sixty,year,life,expectancy,fourty,year,old,year,ago][0.5]

句子2情感得分[time,infant,mortality,decrease,apparently][0.5]

句子3情感得分[average,infant,die,birth,present][0.0]

句子4情感得分[mention,place][0.0]

句子5情感得分[hand,development,industrial,agriculture,standard,people,live,develop,country,give,rapid,rise,life,expectancy,infant,mortality,correspond,rise][0.7]

句子6情感得分[hand,hospital,establish,doctor,train][0.3]

句子7情感得分[patient,obtain,effective,treatment][0.5]

句子8情感得分[healthy,active,result,life,expectancy,rise][0.6666666666666666]

句子9情感得分[infant,carefully,consequence,infant,mortality,fall][0.0]

句子10情感得分[infant,mortality,less,skills,medcine,rise,rule,carried][-0.3]

(3)统计英语作文的情感单词的出现次数并输出英语作文情感单词,计算英语作文的情感得分,并判断其情感倾向,生成英语作文的情感分析结果如下所示:

情感单词:develophealthyliveobtainenough

情感得分:0.65

情感倾向:积极

步骤三:执行“英语作文观点分析模块”

英语作文观点分析模块是通过输入在步骤一中完成的英语作文和英语范文的去停用词结果对英语作文进行观点分析。

(1)根据计算英语范文和英语作文中各个单词分配给每个主题的概率值,生成英语作文和英语范文的主题单词分布矩阵如下所示,由于该分布矩阵较为庞大,无法全部列出,因此只列举出部分数据,其余的用省略号代替:

(2)根据计算英语范文和英语作文中各个句子分配给每个主题的概率值,生成英语作文和英语范文的每个句子对应主题数的分布情况如下所示:

(3)生成英语作文和英语范文的主题分布情况如下所示:

(4)根据设置的英语范文和英语作文中的观点词的个数以及英语范文和英语作文的主题单词分布,生成英语作文主题观点词分布结果如下所示:

hospitals 0.06687898089171974 best 0.06687898089171974 economic0.03503184713375796 make 0.03503184713375796 built 0.03503184713375796 infant0.07487922705314008 births 0.07487922705314008 deaths 0.05072463768115942mortaility 0.05072463768115942 one 0.026570048309178744 health0.12318840579710143 countries 0.12318840579710143 gains 0.12318840579710143developing 0.12318840579710143 infant 0.026570048309178744 life0.09534206695778748 expectancy 0.08806404657933041 infant0.058951965065502175 developing 0.04439592430858806 mortality0.04439592430858806 people 0.06907894736842105 foods 0.06907894736842105skills 0.03618421052631579 practising 0.03618421052631579 day0.03618421052631579 health 0.09922178988326846 people 0.04085603112840467advanced 0.04085603112840467 gain 0.04085603112840467 developing0.021400778210116732 countries 0.10856269113149845 developing0.07798165137614678 people 0.07798165137614678 living 0.03211009174311927healthy 0.03211009174311927 medicine 0.0657051282051282 past0.0657051282051282 reason 0.049679487179487176 death 0.049679487179487176births 0.03365384615384615 reported 0.08649789029535863 fourty0.044303797468354424 progress 0.044303797468354424 active 0.02320675105485232people 0.02320675105485232 result 0.04085603112840467 cure0.04085603112840467 mortality 0.04085603112840467 old 0.04085603112840467infant 0.04085603112840467

(5)根据计算英语范文和英语作文的主题相似度输出英语作文观点得分,并输出英语作文的观点词,英语作文的观点分析结果如下所示:

观点得分:0.7853484295104163

观点词:countries health progress life people

步骤四:执行“英语作文情感观点分析结果生成模块”

英语作文情感观点分析结果生成模块是指通过步骤二和步骤三中得到的英语作文的情感得分和观点得分,然后计算得到英语作文情感观点总分与评语,其分析结果如下:

英语作文情感观点总分为:0.72

情感观点评语为:内容基本切题,有些地方思想表达不清楚。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号