首页> 中文学位 >多文档集合话题情感挖掘研究
【6h】

多文档集合话题情感挖掘研究

代理获取

目录

封面

中文摘要

英文摘要

目录

主要符号对照表

第一章 绪论

1.1 研究背景及目的

1.2 本文组织结构

第二章 相关工作

2.1 话题情感联合挖掘

2.2 多文档集文本建模

2.3 本章小结

第三章 多文档集合话题情感模型

3.1 概念定义与说明

3.2 模型设计

3.3 模型推断方法

3.4 本章小结

第四章 实验结果与评测

4.1 多文档集话题情感挖掘

4.2 文档情感分析

4.3 微博和新闻在同一事件上的话题情感对比研究

4.4 本章小结

第五章 全文总结

5.1 主要工作与创新点

5.2 后续研究工作

5.3 结束语

参考文献

致谢

攻读学位期间发表的学术论文目录

攻读学位期间参与的项目

声明

答辩决议书

展开▼

摘要

本文研究多文档集合话题情感挖掘。本文使用能自动确定组件个数的层次Dirichlet过程将文档集合表示为多个组件的混合,每个组件包含话题词和情感成分,扩展了话题情感混合模型。模型能够从多文档集合上挖掘出一组话题。话题在各文档集上有各自的比例和对应的情感比例,并为每个文档集找到一个正面和一个负面词汇分布。模型通过马尔科夫链蒙特卡洛方法实现,实验表明模型可以找出有意义的话题和它们的情感倾向。模型在参数设置方面比现有的多侧面或联合情感模型有优势,在多领域情感数据集上的实验确认了模型有进行情感分析的能力。通过对中文事件微博和新闻语料的迭代过程实验,分析了衡量多文档集话题混合相似程度的参数,发现了一些微博媒体和新闻媒体的区别。新闻媒体上事件事实具体,微博则有更多的讨论,例如占领华尔街事件中新闻具体报道示威活动并表达了负面情绪,同时微博用户讨论不少和中国相关的话题使得正负情感变得偏向混合;新闻更多地报道本国工作,例如在马航MH370失联事件中对我方工作的报道。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号