首页> 中文会议>第七届中国互联网学术会议（ICoC2018） >一种基于Spark学术研究热点的挖掘方法

一种基于Spark学术研究热点的挖掘方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

学术论文作为学术界研究成果的重要表现形式,其中包含了大量珍贵的信息.本文以学术论文为语料库,利用Spark机器学习库MLlib(Machine Learning Library)中的LDA(Latent Dirichlet Allocation)主题模型挖掘学术研究热点,发现隐藏的有价值的信息.对LDA主题模型生成的文档-主题概率分布矩阵和主题-词概率分布矩阵进行了类TF-IDF处理,可以得到文档-主题评分矩阵和主题-词评分分布矩阵.分别计算两个评分矩阵中主题向量与背景主题向量的Jensen-Shannon散度,然后对加权归一化的两个评分结果排序.评分结果排序中排名靠前的主题就是学术论文中的研究热点.实验结果表明,基于Spark挖掘学术论文研究热点的效果较好,此方法具有较高的应用价值.

著录项

来源
《第七届中国互联网学术会议（ICoC2018）》||1-6|共6页
会议地点
作者
Zhang Cong; 张聪; Yi Xiu-shuang; 易秀双; Zhu Ming-hao; 朱明浩; Wang Xing-wei; 王兴伟;
展开▼
作者单位

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
学术论文; 主题模型; 数据挖掘; 机器学习;
入库时间 2022-08-17 11:29:42

相似文献

中文文献
外文文献
专利

1. 基于Spark的学术研究热点挖掘方法 [J] . 张聪 ,易秀双 ,朱明浩 . 计算机工程 . 2019,第012期
2. 基于内容分析的人文社会科学研究热点挖掘方法 [J] . 逯万辉 . 东方论坛 . 2015,第004期
3. 浅析我国会计学术研究热点——基于核心学术期刊论文关键词的词频分析 [J] . 万红波 ,龙晓亮 . 财会研究 . 2010,第004期
4. h-b指数:一种确定学术研究热点的新方法——以出版学为例 [J] . 杨露 . 成都师范学院学报 . 2012,第005期
5. 基于"睡美人"文献识别的高校学术论文价值挖掘方法研究——以东北大学为例 [J] . 邹明慧 . 情报探索 . 2021,第003期
6. 近5年中国新闻传播领域学术研究热点分析——基于25种专业核心期刊发文关键词词频的研究 [C] . 王海峰 . 2018新媒体国际论坛 . 2018
7. 面向开放存取环境的研究热点与前沿挖掘方法 [A] . 陈小维 . 2014

一种基于Spark学术研究热点的挖掘方法

摘要

著录项

相似文献

相关主题

期刊订阅