社交网络中的创新创业热点信息分析

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的飞速发展，微博作为一种社交媒体已经获得了社会各界的广泛关注。但是如何从海量、不规则的微博数据中高效地提取出有效的信息来进行话题发现，仍然是目前亟待解决的问题。因此，使用主题模型挖掘微博数据的方法得以产生。目前，学者们已经对于主题模型进行了大量的研究，但现有的方法技术仍然存在一些不足，主要体现在:一是计算的复杂度太高，对于大数据级别的微博数据计算的效率不高;二是使用一些主题模型（比如传统的LDA模型）对微博这种短文把数据进行聚类后的准确度不高等。基于此，本文提出了一种基于Weibo2vec和适合微博数据的聚类方法的新浪微博数据挖掘方法，在保证计算微博数据效率的同时，提高微博数据挖掘的准确度。　　本文对Weibo2vec主题模型的微博数据挖掘方法进行了研究，研究内容主要分为微博数据的预处理、Weibo2vec建模、适合微博的聚类方法三个部分。其中，微博数据的预处理包括分词、去停用词、删除噪音数据等过程，并将预处理的结果存入PostgreSql数据库，作为下一步主题建模的输入。在Weibo2vec建模过程中，首先对数据预处理的结果进行不断地迭代，得到文档矩阵、词矩阵、用户矩阵和时间矩阵。然后选取适合微博的聚类方法对建模结果进行聚类分析，最后采用准确率、召回率和F1值对实验结果进行分析评价。使用Weibo2vec主题模型进行建模的方法避免了微博数据稀疏性的缺陷，且模型产物包括用户的向量表示和时间的向量表示。　　通过实验，本文对Doc2vec主题模型和本文提出的Weibo2vec主题模型的微博热点话题发现效果进行对比分析，以两个主题模型的准确率、召回率和F1值为对比分析的依据，发现本文提出的Weibo2vec主题模型在各个评价因素中都优于Doc2vec主题模型的微博热点话题发现效果，从而证明了本文使用的主题模型对微博数据进行建模和聚类方法的有效性。

著录项

作者
孙天洋;
展开▼
作者单位

对外经济贸易大学;

展开▼
授予单位对外经济贸易大学;
学科产业经济学
授予学位硕士
导师姓名喇磊;
年度 2018
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
社交网络,热点信息,主题模型,数据挖掘;

相似文献

中文文献
外文文献
专利

1. 社交网络中中介角色与信息位置的关联性研究——基于中国文化在推特传播的实证分析 [J] . 徐翔 ,靳菁 . 北京邮电大学学报（社会科学版） . 2019,第001期
2. 移动社交网络中个人信息保护现状的调查与分析--从用户行为习惯视角出发 [J] . 王娜 ,许大辰 . 情报杂志 . 2015,第001期
3. 创新创业教育在大学生全面发展中的意义分析——以常州信息职业技术学院实践探索为例 [J] . 时全丽 . 常州信息职业技术学院学报 . 2014,第005期
4. 医学信息工程专业教育研究中的热点主题及前沿趋势探析——基于知识图谱的可视化分析 [J] . 张兰华 ,李玉娟 ,韩忠东 . 医学教育管理 . 2021,第006期
5. 基于关键词的PDCA循环法在档案信息安全评估中的应用研究热点与趋势分析 [J] . 黄暄 . 办公自动化（办公设备与耗材） . 2018,第013期
6. 在线社交网络分析:透视在线社交网络及网络信息传播的内在规律 [C] . Binxing Fang ,方滨兴 . 2014年国际工程科技大会“信息网络与社会发展”分论坛 . 2014
7. 在线社交网络中的热点信息传播机制研究 [A] . 李涵曼 . 2015

社交网络中的创新创业热点信息分析

目录

摘要

著录项

相似文献

相关主题

期刊订阅