首页> 中文学位 >基于改进特征选择方法的文本情感分类研究
【6h】

基于改进特征选择方法的文本情感分类研究

代理获取

目录

声明

第1章 绪 论

1.1 课题研究的背景和意义

1.2 国内外研究现状

1.3 论文的主要内容

第2章 文本情感分类相关技术

2.1 文本预处理技术

2.2 文本表示模型

2.3 文本的特征选择

2.4 文本情感分类方法

2.5 文本情感分类评估方法

2.6 本章小结

第3章 文本情感分类框架介绍和预处理

3.1 文本情感分类框架介绍

3.2 文本选择

3.3 文本预处理

3.4 本章小结

第4章 融合情感词典的特征选择方法研究

4.1 信息增益算法介绍

4.2 改进的信息增益算法

4.3 融合情感词典的文本情感分类特征选择

4.4 实验与结果分析

4.5 本章小结

第5章 文本情感分类中SVM的优化

5.1 支持向量机分类原理

5.2 支持向量机参数选择与优化

5.3 混合核函数

5.4 本章小结

结论

参考文献

致谢

展开▼

摘要

随着越来越多的人参与到互联网中,互联网产生了海量并有研究价值的文本信息,如何有效的对文本信息进行情感挖掘是现阶段研究的热点之一。该文通过对文本情感分类国内外现状的分析和研究,对现有的特征选择方法进行改进,设计了一种结合情感词典和改进的信息增益算法的特征选择方法,并利用优化的支持向量机分类器分辨文本的正负情感极性。
  首先,在现有信息增益特征选择的基础上,针对信息增益只注重特征词的文档频率和忽略语料均衡与否的影响从而影响特征有效选择的问题,对信息增益特征选择算法进行改进,添加了特征词在每个类内出现的词频分布即分布因子和均衡概率,寻求分类性能的提高。
  其次,对现有信息增益应用在文本情感分类中忽略情感因素的问题,将情感词典和信息增益特征选择进行结合,对文本进行情感词匹配,只选用情感词进行信息增益特征选择,实现特征大幅降维和体现情感词在文本情感分类中的重要性。
  再次,针对文本语料的特点,对只采用匹配情感词而导致文本数据过于稀疏从而影响分类性能的问题,采用对情感词赋权重,并对所有词语进行信息增益特征选择,既体现情感重要性,又可以改善分类性能。
  最后,为了进一步改善分类效果,对支持向量机分类器进行优化,采用三种寻优算法对支持向量机参数进行寻优和利用混合核函数对分类器进行优化,通过实验对比,选择最好的优化方式作为最终优化的分类器模型。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号