首页> 中文学位 >基于半监督学习的文本情感分类平台的设计与实现
【6h】

基于半监督学习的文本情感分类平台的设计与实现

代理获取

目录

封面

目录

中文摘要

英文摘要

第一章 绪 论

1.1 文本情感分类的应用背景

1.2 国内外的研究现状

1.3 本文研究工作

1.4论文的组织结构

第二章 基于半监督的文本情感分类方法

2.1 半监督学习算法框架

2.2 特征选择

2.3分类器选择

2.4 基于自训练方法的分类算法的建立

2.5 基于主动学习的分类算法的建立

2.6本章小结

第三章 情感分类平台设计与分析

3.1平台的设计框架

3.2 平台核心功能的关键问题

3.4 UML类图

3.5 本章小结

第四章 基于半监督情感分类平台的实现

4.1 系统的功能界面

4.2 文本的存储

4.3 平台功能

4.4本章小结

第五章 结论与展望

5.1 结论

5.2展望

参考文献

攻读学位期间取得的研究成果

致谢

个 人 简 介

声明

展开▼

摘要

互联网目前已经进入数据爆炸的时代,形形色色的人在网络上自由的发表着对各式各样的事件、物品以及对某些人的观点与看法。这些海量级文本数据中蕴藏着大量的情感信息,对其进行文本情感极性的判断,可为网络安全、事件预测、购物导向、舆情分析等提供决策支持。为此,本文设计一个篇章级的文本情感分类平台,用于对网上用户的评论进行褒义贬义分类,具体内容如下:
  (1)基于半监督学习的文本情感分类方法
  传统的文本情感分类方法的精确度取决于训练语料的规模和质量,对于标注依赖于规模和高质量的语料,将消耗大量的人力、时间。而半监督机器学习方法可以作为自动或半自动扩展训练语料的一种有效手段。本文介绍了两种基于半监督学习方法的情感分类,基于自训练(self-training)和基于主动学习(active learning)的情感分类方法,并通过支持向量机和最大熵模型两种分类器对未标注数据进行分类,采用逐步迭代的方式优化分类模型。最后利用优化的单分类模型实现单个模型和集成模型对文本进行情感分类。
  (2)文本情感分类平台的设计与数据分析
  针对中文文本情感分类而言,中文数据杂乱无章,特别是用户评论,每个人都有不同的表达方式,为此本平台设计了数据预处理功能,包括去停用词、文本分词、数据向量化处理等,为文本情感分类做好数据准备。此平台既可以作为文本情感分类系统,包括有监督文本情感分类、半监督的文本情感分类等,又可以作为一个辅助数据标注系统。
  (3)文本情感分类平台实现
  本文基于Java语言搭建了一个文本情感分类平台,能够处理用户在各类网站发表的数据。为了加快平台运行速度,引入了Java的并行计算,通过VB美化了平台界面也方便了用户的使用。用户可以根据文本处理的需求选择相应的功能,每个文本处理模块都可以供用户单独使用或对于有能力的用户二次开发。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号