微博健康热点话题发现系统的设计与实现

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

随着互联网技术的不断发展，微博作为W eb3.0新兴起的一类开放互联网社交平台，凭借其使用方便、信息传播速度快、平台开放性以及交互性强等优点，成为备受广大用户喜爱的分享、获取以及传播信息的重要平台。微博上每天都会产生大量的数据，这些数据蕴含着丰富的元数据信息。
　　目前，传统的话题发现模型及文本聚类技术己经被广泛应用于各个领域，并取得了不错的成果。针对微博短文本数据，传统的话题发现方法仍然存在着很大的局限性，给微博热点话题发现带来了新的挑战。因此，如何准确快速的从海量微博数据中获取热点话题信息并将其及时展示给广大用户，是微博话题发现技术亟待解决的问题。
　　基于以上研究背景，本文结合微博的特点，改进传统的话题发现模型以及文本聚类算法，提出了一种基于VSM模型和MLDA模型相结合的微博话题发现算法，在此基础上设计了微博健康话题发现系统。主要工作内容如下：
　　首先，采用微博平台开放API接口和网络爬虫技术，分别对微博用户信息和微博内容两方面数据进行爬取，通过数据去噪、文本分词等操作对微博文本数据进行预处理；
　　其次，利用VSM模型和MLDA模型对微博文本数据进行联合建模，构造微博文本的特征向量，实现微博文本相似度的联合计算。
　　再次，采用改进传统的Single-pass算法和凝聚式层次聚类算法，对微博文数据进行二次聚类，实现微博热点话题的抽取以及话题热度的计算与排序。
　　最后，通过多方面实验验证与分析证明了系统有效性和准确性。

著录项

作者
申思;
展开▼
作者单位

西安理工大学;

展开▼
授予单位西安理工大学;
学科计算机技术
授予学位硕士
导师姓名孙钦东;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.52;
关键词
二次聚类; 话题发现; 话题热度计算; 文本聚类; 微博文本; 健康热点;

相似文献

中文文献
外文文献
专利

1. 基于Hadoop微博热点话题挖掘系统的设计与实现 [J] . 杨浩 ,曾兴斌 ,何加铭 . 数据通信 . 2016,第002期
2. 微博热点话题检测系统的设计与实现 [J] . 赵前东 ,叶猛 . 电视技术 . 2013,第003期
3. 基于词共现网络的对农微博热点话题及用户舆情分析——以中国乡村之声官方微博为例 [J] . 赵雪 ,马娟娟 . 新闻爱好者 . 2019,第011期
4. 基于中心词和LDA的微博热点话题发现研究 [J] . 刘干 ,林杰豪 ,翟雯熠 . 情报杂志 . 2021,第005期
5. 基于两层聚类的微博热点话题发现算法研究 [J] . 李勇 . 自动化技术与应用 . 2021,第011期
6. 基于新闻评论的热点话题发现系统研究 [C] . 程军军 ,刘云 . 2008海峡IT创新与信息技术学术交流会议 . 2008
7. 基于微博客的热点话题发现系统的设计与实现 [A] . 陈晶晶 . 2016

微博健康热点话题发现系统的设计与实现

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅