首页> 中文学位 >基于维度判别的文本情感聚类方法研究
【6h】

基于维度判别的文本情感聚类方法研究

代理获取

目录

封面

目录

中文摘要

英文摘要

第一章 绪论

1.1 研究背景、目的及意义

1.2 国内外研究现状

1.3 本文主要研究内容

1.4 论文的组织结构

第二章 实验语料及文本聚类评价指标

2.1 实验语料及预处理

2.2 情感聚类算法及其评价指标

2.3 本章小结

第三章 情感聚类的维度判别方法

3.1 情感维度确定的框架

3.2 原始特征空间的构建

3.3 特征空间的压缩

3.4 情感空间的构建

3.5 实验及结果分析

3.6 本章小结

第四章 基于RESS与DIMSC融合的情感聚类方法

4.1 词语相关度

4.2 基于相关性的文本相似度计算

4.3 基于情感向量的文本情感相似度计算

4.4 基于RSSV和ESSV融合的文本语义相似度计算(RESS)

4.5 基于RESS与DIMSC融合的文本情感聚类

4.6 实验及结果分析

4.7 本章小结

第五章 结论与展望

5.1 结论

5.2 展望

参考文献

攻读学位期间取得的研究成果

致谢

个人简况及联系方式

声明

展开▼

摘要

随着新兴电子商务平台和微博、微信等社交媒体的广泛使用,人们在享受互联网技术带来种种便利的同时,也用文字记载了自己的心情、状态、评价和观点,通过挖掘海量微博和评论文本等社会媒体数据,可以获得用户对产品的情感倾向(褒扬或者贬斥),从而指导企业的决策以及个人的消费行为。使用有监督的机器学习方法需要大量的带标签的文本数据,而无监督的文本聚类方法可以克服这一不足。针文本情感聚类问题,本文从情感聚类维度挖掘和文本语义相似性度量两个方面开展研究,主要研究内容和结论如下:
  (1)语料分析
  为了探索影响文本倾向性聚类性能的潜在因素,本文选取英文的产品评论数据和中文的微博数据作为实验语料,通过对数据集的统计以及对评论文本语言特点的分析,发现文本表示的高维、稀疏,情感的隐式表达是影响文本倾向性聚类的重要因素。
  (2)文本情感聚类的维度判别方法研究
  针对文本情感聚类问题,提出一种自动引导生成情感聚类结果的方法(DIMSC),该方法包括“特征空间压缩”和“情感维度构建”两个阶段。首先对维度进行特征化表示,然后采用观点词识别技术抽取语料中的观点词,根据维度特征词中观点词的个数,自动判别情感维度。在中、英文不同领域的评论数据上进行实验,结果表明,DIMSC在自动识别情感聚类维度中是有效的,与其他聚类算法相比获得了更高的纯度和F值。
  (3)基于语义子空间的文本相似度计算方法
  针对情感聚类中文本-特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS),并探讨基于 RESS与 DIMSC融合的方法对文本情感聚类效果的影响。实验结果表明,基于 RESS的文本相似度计算方法,有效地解决了文本向量的高维问题,并获得较好的聚类结果。基于 RESS与 DIMSC融合的聚类方法取得的纯度和 F值均优于单独使用RESS或DIMSC。该方法也适用于非平衡数据集。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号