首页> 中文学位 >中文评论文本情感分类方法的研究
【6h】

中文评论文本情感分类方法的研究

代理获取

目录

声明

1 绪论

1.1 课题研究背景

1.2 文本情感分类的一般流程

1.3 国内外研究现状

1.4 课题研究的意义、内容和目标

2 文本情感分类的基本思路

2.1 基于机器学习的文本情感分类基本流程

2.2 基本流程中的问题分析

2.3 本章小结

3 基于组合特征的主客观分类方法

3.1 主观性文本的定义

3.2 文本的主客观基本特征的选择与提取

3.3 特征选择方法

3.4 文本主客观组合特征的选择方法

3.5 基于组合特征的主客观分类方法的流程

3.6 实验设计与结果分析

3.7 本章小结

4 基于集成学习的主观文本情感分类方法

4.1 主观文本基本特征选择

4.2 特征选择方法

4.3 各个体分类器之间的差异性分析

4.4 集成学习方法中的组合策略研究

4.5 基于集成学习的主观文本情感分类方法流程

4.6 实验结果分析

4.7 本章小结

5 结束语

5.1 已完成的工作

5.2 下一步的工作

致谢

参考文献

展开▼

摘要

网络评论文本中往往包含着积极或消极的情绪、支持或反对的态度,对评论中包含的情绪或态度等情感信息进行分析具有重要的社会价值和商业价值。虽然针对评论文本情感分类方法的研究取得了一定的成果,但是文本的主客观分类方法和主观文本的情感分类方法仍有待改进和完善。
  针对文本的主客观分类问题,提出了一种中文评论文本主观性的评判标准;从语义和语法的角度出发选择了四种N-Gram特征和一种N-POS特征;考虑到词频-逆文档频率(TF-IDF)符合特征选择方法的要求,将其作为一种特征选择方法同主流的卡方统计、信息增益一起进行了考察;选择了三种经典的分类算法方法。在此基础上,对组合特征中基本特征的选择问题进行了研究,提出了一种基于分类结果相似性的选择方法。基于此特征组合方法完成了主客观分类,剔除了中文评论文本中可能存在的客观性文本,为后续主观性文本的情感分类奠定了基础。
  针对主观文本的情感分类问题,选择了四种N-Gram特征和一种词性特征作为主观文本的基本特征,进而对TF-IDF、卡方统计和信息增益三种特征选择方法进行了考察。为了避免对分类算法的选择,将多个分类算法结合起来完成主观文本的情感分类。在此过程中,对个体分类器之间的差异性进行了分析,提出了一种多分类器的组合策略,最终给出了一种基于集成学习的主观文本情感分类方法。
  针对所提方法,设计了相应的实验方案,给出了相应的实验评价指标,实验结果表明基于特征组合的主客观分类方法是有效可行的,基于集成学习的主观文本的情感分类方法能够提高情感褒贬分类的准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号