首页> 中文学位 >基于组合分类策略的中英文情感分析系统研究与实现
【6h】

基于组合分类策略的中英文情感分析系统研究与实现

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题研究背景

1.2 国内外研究现状

1.2.1 情感分析的国内外研究与应用现状

1.2.2 组合分类的相关研究现状

1.2.3 中英文分词的相关研究现状

1.3 研究内容和论文组织结构

1.3.1 课题主要的研究内容和意义

1.3.2 论文的组织结构

第2章 相关理论和技术

2.1 网络爬虫

2.2 情感分析相关技术

2.2.1 文本表示模型

2.2.2 特征提取

2.2.3 权重计算

2.2.4 分类模型

2.2.5 相关工具

2.2.6 传统组合分类方法比较

2.3 本章小结

第3章 基于多特征融合的组合分类策略

3.1 组合分类方法的分析

3.2 构建分类模型

3.2.1 多特征融合方法

3.2.2 分类器选择

3.3 实验过程

3.3.1 实验设计

3.3.2 实验语料

3.3.3 预处理

3.3.4 特征选择与权重计算

3.3.5 基于NB的多特征分类模型SC

3.3.6 评价指标

3.4 实验结果与分析

3.5 本章小结

第4章 基于中英文混合文本的情感分析研究

4.1 中文文本的情感分析

4.2 英文文本的情感分析

4.3 中英文文本的情感分析

4.3.1 中英文常见混合方式

4.3.2 混合分词算法

4.3.3 分词词典

4.3.4 中英文混合分词算法

4.4 实验过程

4.4.1 实验语料

4.4.2 算法测试和结果分析

4.5 本章小节

第5章 基于特征融合的中英文情感分析系统的分析设计与实现

5.1 系统总体分析与设计

5.1.1 系统的功能性需求

5.1.2 系统的设计性需求

5.1.3 系统总体设计

5.2 系统各模块的分析设计与实现

5.2.1 网络爬虫模块的设计与实现

5.2.2 情感分类模块的设计与实现

5.3 本章小结

第6章 结论与展望

参考文献

攻读硕士学位期间发表的论文及其它成果

致谢

展开▼

摘要

随着以网络为载体的文章与评论信息的迅猛增加,情感分析技术的研究显得尤为迫切。情感分类是一种自动挖掘并分析文本中所包含的具有情感色彩、反映人们主张观点信息的技术方法。在当今信息大爆炸的时代,情感分类引起了广泛关注和研究,已经逐渐成为研究热点。
   本文构建了以特定网站海量评论信息爬取、中英文混合文本预处理、情感分类、结果展示一体化的平台:基于组合分类策略的中英文情感分析系统。研究了系统的关键问题中英文情感分析以及基于多特征融合的组合分类策略,并给出了解决方案和实现方法。
   由于网络信息的便利和英语的国际通用性,国内很多用户评论信息都是中英文结合表达的。在以往的中文情感分类中,因为无法对英文分词分类从而丢失了大量有效的信息。本文分别研究分析了中英文情感分析,总结了中英文的常见混合方式,对中英文混合文本的情感分析做了深入研究,给出了在已有算法基础上改进后的混合分词算法,并对算法进行了测试实验。结合了英文丰富的情感分析资源后,在整体上提高中文情感分类的效果。
   本文对基于多特征融合的组合分类策略进行了重点分析和研究,通过对特征选择维度的补充和引入情感词典的方法来提高系统性能和分类效果。在对多特征融合的实验中,进行了多次不同特征组合实验,并分析结果,得到了可以得到较好召回率值和准确率值的最优组合方法,并将实验所得的组合方法应用于基于组合分类策略的中英文情感分析系统。

著录项

  • 作者

    杨雅琴;

  • 作者单位

    华北电力大学;

    华北电力大学(保定);

  • 授予单位 华北电力大学;华北电力大学(保定);
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 赵文清;
  • 年度 2013
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.09;
  • 关键词

    网络爬虫; 特征融合; 情感分类; 组合模型; 混合分词;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号