首页> 中文学位 >关联对识别方法及其在句子情感分类中的应用
【6h】

关联对识别方法及其在句子情感分类中的应用

代理获取

目录

摘要

第一章 绪论

1.1 研究背景、目的及意义

1.2 国内外研究现状

1.3 本文的研究内容

1.4 论文的组织结构

第二章 基于规则的产品特性获取方法

2.1 产品特性的定义

2.2 基于决策树模型的规则获取方法

2.2.1 决策树模型

2.2.2 C4.5决策树生成算法

2.3 特征选择

2.4 评价指标

2.5 实验结果与分析

2.6 本章小结

第三章 基于最大熵模型与决策树的关联对自动获取

3.1 关联对的定义与问题建模

3.2 最大熵模型

3.3 依存句法分析

3.4 实验数据集的构建

3.5 最大熵模型与生成规则特征的构建

3.5.1 最大熵模型特征的构建

3.5.2 生成规则的特征构建

3.6 实验结果与分析

3.6.1 最大熵模型的实验结果与分析

3.6.2 决策树规则的实验结果与分析

3.7 本章小结

第四章 基于关联对的句子情感倾向分类

4.1 问题建模

4.2 中文情感词词表

4.3 基于关联对的句子情感倾向分类方法

4.3.1 识别句子中的关联对算法

4.3.2 关联对情感倾向值计算

4.3.3 句子情感倾向权值计算

4.3.4 句子情感倾向分类器

4.4 实验结果与分析

4.5 本章小结

第五章 结论与展望

5.1 结论

5.2 展望

参考文献

附录

发表文章目录

致谢

个人简介

声明

展开▼

摘要

随着网络技术的迅速发展,Internet已成为越来越多的人们表达自己观点的平台。很多商家通过网上大量的评论,了解用户对产品的意见或建议,以便改进产品的性能和售后服务。同时,消费者也可以利用网上的评论来指导消费行为。然而,网上每天都有大量的新评论出现,对这些评论,仅靠人工进行跟踪和分析显然是行不通的。近年来,人们开始关注并研究评论文本的主观意见的获取与倾向性判别。
  针对产品评论,本文对评论中的产品特性进行了挖掘,提出了产品特性与情感词汇关联对的获取与倾向性判别方法,并将关联对的情感倾向用于句子的倾向性判定。主要有以下几方面的研究工作:
  1)挖掘评论中的产品特性
  根据产品特性所在的上下文信息,本文将产品特性相邻词的词性、产品特性在句中所处的位置以及产品特性在句中所形成的依存关系作为特征,采用决策树方法获得判断产品特性的规则。实验结果表明,这些规则用于产品特性识别任务是可行的。
  2)基于最大熵模型与决策树的关联对自动获取
  本文在确定了产品特性与情感词汇的基础上,选择词、词性、位置信息以及句子的依存信息作为最大熵模型的特征,构建了9种复合特征模板用于识别产品特性与情感词汇关联对。同时,利用决策树方法自动构造了用于识别关联对的规则。通过在多个数据集上的对比测试,实验结果表明,在数据集3上的最大熵模型得到了最佳的测试结果。
  3)基于关联对的句子倾向性分析
  关联对的情感倾向在一定程度上影响了句子的情感倾向,本文首先采用规则方法对关联对的情感倾向进行了判别。然后,利用关联对的情感倾向对整个句子的情感倾向做判断。实验结果表明,基于关联对的句子情感倾向判别是可行的,与传统的支持向量机分类方法相比,关联对判断反面评论句子的情感倾向的F值优于支持向量机分类方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号