首页> 中文学位 >基于新词识别和时间跨度的微博热点研究
【6h】

基于新词识别和时间跨度的微博热点研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1. 1研究背景和意义

1. 2国内外研究现状

1. 3论文的主要工作

1. 4论文结构

第二章 微博热点分析研究平台和相关技术

2. 1新浪微博

2.2 Hadoop云计算平台

2.3 ICTCLAS分词工具

2. 4文本分类技术

2. 5本章小结

第三章 微博分词优化及热点抽取

3. 1研究意义

3.2基于Hadoop的微博新词识别及分词优化

3. 3微博热点抽取

3. 4本章小结

第四章 微博情感分析

4. 1研究意义

4. 2条件随机场

4. 3系统框架

4. 4微博热点基于C R Fs的情感分析实现

4. 5本章小结

第五章 实验与分析

5. 1微博新词识别及分词优化实验

5. 2微博热点词语识别及分组

5. 3微博热点情感分析

5. 4本章小结

第六章 总结与展望

6. 1本文工作总结

6. 2研究展望

参考文献

致谢

攻读硕士学位期间已发表或录用的论文

上海交通大学硕士学位论文答辩决议书

展开▼

摘要

微博热点,是在一段时间内微博用户涉及最多的热议焦点。微博热点的研究可以帮助互联网用户及时了解当下的微博热点话题和热门事件,可以帮助企业了解和评测其商品口碑及竞争对手状况,同时也能够使得政府对社会舆情热点有明确的方向把握。因此对于微博热点的研究有广泛的适用性和研究价值。
  由于微博文本有自由度大、语法不规范、即时性强的特点,因此通过传统的文本分析难以对微博热点进行准确的把握。尤其是一般的分词工具在对微博文本进行分词时效果难以令人满意。本论文使用Had o op云计算平台对微博进行新词识别,构建新词词典,以对传统工具的分词结果进行优化。本文在识别微博热点词语之后,通过这些词语的时间跨度特征将其分类,分别将代表相同主题的热点词语一一归类。本文最后对微博的情感倾向性进行了研究,利用微博表情符号及CRFs分类器评价微博中包含情感的正负极性。
  实验后可以看到,本文的微博新词识别实验、微博热点词语识别和分组的实验及微博情感倾向性评价的实验都获得了较好的效果,说明本文提出的方法有不错的实用效果,在今后可以进行更深入的研究。

著录项

  • 作者

    黄晨;

  • 作者单位

    上海交通大学;

  • 授予单位 上海交通大学;
  • 学科 电子与通信工程
  • 授予学位 硕士
  • 导师姓名 刘功申;
  • 年度 2015
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.09;
  • 关键词

    热点识别; 分词优化; 云计算平台; 时间跨度; 微博热点;

  • 入库时间 2022-08-17 11:21:13

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号