首页> 中文学位 >基于确定话题的相关微博观点分类研究
【6h】

基于确定话题的相关微博观点分类研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景

1.1.1 微博背景

1.1.2 研究意义

1.2 国内外研究现状

1.3 本文研究内容

1.4 本文的组织结构

第2章 微博特点及相关技术

2.1 微博的特点及基本功能

2.1.1 微博的特点

2.1.2 微博的基本功能

2.2 OAuth互联网标准协议

2.2.1 OAuth协议概念及特点

2.2.2 OAuth协议认证授权流程

2.3 微博应用开发协议

2.4 本章小结

第3章 微博爬虫分析和观点分类技术

3.1 微博爬虫分析

3.1.1 微博爬虫的特点

3.1.2 微博平台对微博爬虫的限制

3.1.3 微博爬虫与微博平台的连接

3.2 文本观点分类技术

3.2.1 文本情感倾向性判断及分类的基本流程

3.2.2 文本情感倾向值的计算

3.2.3 文本情感倾向分类方法

3.3 本章小结

第4章 基于新浪微博的爬虫设计

4.1 新浪微博SDK

4.2 基于新浪微博的爬虫设计

4.2.1 创建应用

4.2.2 连接微博平台

4.2.3 抓取微博信息

4.3 本章小结

第5章 基于语义相似度的情感倾向性分析及观点分类

5.1 知网简介

5.2 词语相似度的计算

5.3 观点分类流程的设计与实现

5.3.1 完整语句的情感倾向分析

5.3.2 词语情感强度值的计算

5.3.3 词语相似度的计算

5.4 本章小结

第6章 原型系统的设计与实现

6.1 需求分析与设计

6.2 开发的平台和工具

6.3 系统功能模块分析

6.4 系统模块的实现

6.4.1 微博爬虫模块的实现

6.4.2 重点用户监控模块

6.4.3 热门话题模块

6.4.4 情感分析模块的实现

6.4.5 图形化显示模块的实现

6.5 本章小结

第7章 总结和展望

7.1 研究工作总结

7.2 未来工作的展望

参考文献

致谢

展开▼

摘要

互联网已成为人们发布信息和表达观点的重要媒介,其中以微博为代表的新型社会化网络媒体服务,使人们分享和传递信息更加自由、灵活。微博提供了这样一个平台,你既可以作为观众,在微博上浏览你感兴趣的信息;也可以作为发布者,在微博上发布内容供别人浏览,它具有内容自主性、传播即时性和方式互动性等特点。
   目前国内几大门户网站均已开设微博,据中国互联网络信息中心公布的数据,截止2012年12月,全国网民中的微博用户比例达到54.7%。在微博这个庞大的即时通讯社交网络平台中,一些话题受到广大用户的关注而成为评论的热点,微博信息和评论信息反映了广大网民对于特定事件的态度和观点,因此针对热门微博和评论进行分析和预警,对于全面掌握舆论动态、了解民意和促进微博的健康发展具有较强的现实意义。
   本文首先分析了微博平台的特点及其相关技术,包括OAuth互联网认证协议和微博应用开发规范等,然后提出了基于确定话题的相关微博观点分类系统框架,主要包括微博爬虫、重点监控和观点分类三大部分。针对新浪微博平台,设计了相应的微博爬虫,抓取微博平台中用户基本信息及其所发布的微博信息、评论信息等,存储到本地数据库,接着提出了针对确定话题的相关微博观点的分类方法,基于HowNet,以语义相似度计算为基础,设计并实现了从文本分词、标注词性、相似度计算到情感倾向分类的整个模型,将微博评论所表达的观点进行分类,并且以表格或图形的形式展现给用户。另外,针对重点微博账户,设计了监控功能,能够一定程度上及时掌握被监控微博账户的动态。最后,设计并实现了原型系统,对运行结果和测试结果进行了分析,指出优点和不足,为该领域的进一步研究提供了参考。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号