首页> 中文学位 >面向产品评价的观点挖掘方法研究
【6h】

面向产品评价的观点挖掘方法研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪 论

1.1 课题背景及研究目的和意义

1.2国内外研究现状

1.3本文的主要内容和组织结构

第2章 评价单元抽取及本体概念节点实例扩展

2.1中文相机产品评价语料获取和净化

2.2评价对象和评价词抽取及评价词极性判别

2.3相机领域本体的实例扩展

2.4评价搭配抽取和实例扩展实验结果分析

2.5本章小结

第3章 情感比较句识别和比较要素抽取

3.1基于规则的比较句识别

3.2基于CSR的比较句识别

3.3比较句观点要素抽取

3.4比较句的观点倾向性判断

3.5实验结果及分析

3.6本章小结

第4章 情感否定句情感倾向性判别

4.1词表构建

4.2基于规则的否定句极性判断

4.3计算句子整体极性

4.4实验结果和分析

4.5本章小结

第5章 数码相机观点挖掘系统

5.1系统框架

5.2系统数据更新及资源管理

5.3界面显示

结论

参考文献

攻读硕士学位期间发表的论文及其它成果

声明

致谢

展开▼

摘要

随着互联网的快速发展,更多的消费者开始通过Internet了解、购买产品并且发表评论。面向产品评论观点挖掘就是为了从海量的评论信息中挖掘出用户关心的事物的情感倾向性,可以帮助潜在消费者更好地了解产品,以及为制造商提供改善产品或服务决策的依据。
  相对于目前主要研究的句子或篇章级别情感分类,用户更期待细粒度属性级别的意见挖掘结果。现有的意见挖掘主流方法中,利用规则的抽取方法灵活性和扩展性有待于提高;而基于隐马尔可夫模型或条件随机场的属性抽取方法则不能很好的处理长距离情感要素依赖的问题。此外,目前的产品评价意见挖掘算法往往忽略了两类特殊的情感表达句式的处理,即比较情感句和否定情感句。
  本文工作主要集中在以下几个方面:第一,改进了产品评论中的细粒度评价单元抽取算法。该算法将评价单元抽取问题转化为结构化序列标注问题,并引入了词语的属性标识、词语在依存句法树上的依存关系(顺序结构,连词结构和句法结构)作为新特征。在细粒度情感分析语料库CUHK-HIT Opinmine上对该模型进行实验验证显示。第二,在此基础上通过计算属性词与对应于面向领域本体评价概念节点实例词语之间的相似度以及二者各自关联的评价词之间的相似度,实现了面向领域的评价概念节点实例词的扩充。通过引入评价概念节点词语知识,进一步提高了产品评价挖掘的性能。第三,分别研究了基于规则和基于最小多支持度的类序列规则的统计机器学习的方法用于比较情感句的识别。再次基础上研究了基于条件随机场比较要素抽取方法,并利用比较句的句式特征对比较要素的情感倾向性进行了判别。第四,研究了基于否定词表和判定规则的方法,利用子句的情感倾向性计算整段文本的情感倾向性。实现了否定句的情感倾向性判别。
  本文主要贡献如下:首先,改进了细粒度评价对象和评价词抽取算法,相对于树结构条件随机场在CUHK-HIT Opinmine数据集上评价对象抽取准确率和召回率各提高了4.8%和3.5%。其次基于类序列规则的统计机器学习的比较句识别方法在COAE2012比较情感句分析数据集上召回率达到79.3%,准确率达到87.0%的成绩。此外,实验显示本文提出的基于规则的否定句情感倾向性判断取得了较好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号