基于Hadoop的学术文献排名及作者影响力评价算法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着科学技术的飞速发展，研究成果的产出量逐步提高，文献检索系统等电子媒介逐渐成为了学术成果的主要存储方式之一。面对海量电子文献数据，如何从中快速找到研究者们所需要的文献、作者信息，成为当前的一个亟待解决的问题。更准确的对文献进行排名、对学者的学术水平进行评价，可以减少普通研究者在进行文献、作者检索时所花费的代价，节省研究者的时间，使研究者快速了解某一领域内的研究重点、研究热点。传统的文献排名及作者影响力评价方法计算复杂度较高，难以处理海量文献数据。为了更合理的对海量学术数据中的文献进行排名、作者影响力进行评价，本文利用Hadoop云计算平台的数据处理能力，基于MapReduce计算框架对这两个问题进行了深入研究，主要工作包含以下两个方面：　　(1)提出了一种文献排名NTMP(Notave-Timefactor-Mapeduce-Pagerank)算法。改进了传统PageRank算法在进行文献排名计算时忽略文献发表时间对价值的影响以及迭代次数过多的问题。该算法基于MapReduce计算框架构建，加入了时间因素对于文献价值排名的影响，优化了迭代过程中NTMP值的分配过程。实验表明NTMP算法，在评价结果上比传统PageRank算法更合理。在进行大规模数据集的计算时，所需要时间少于PageRank算法。　　(2)基于NTMP算法并结合其他与作者影响力相关的特征，提出了一种多特征作者影响力评价算法MFAI(Multi Feature Author Influence)。该算法通过计算作者所著文献的价值、作者所属研究机构影响力、作者合作网络等特征，对作者影响力进行综合评价。为了避免主观因素在计算过程中对评价结果有不利影响，采用灰色关联分析法对各相关因素的权重进行求取。使用微软学术图作为数据集进行验证，实验表明在评价过程中，MFAI算法与H-index、作者被引次数等传统方法相比，可以更合理的对作者影响力进行综合评价。

著录项

作者
崔景洋;
展开▼
作者单位

河北地质大学;

展开▼
授予单位河北地质大学;
学科计算机应用技术
授予学位硕士
导师姓名曲文龙;
年度 2018
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
海量学术数据,信息检索,文献排名,作者影响力,评价体系,Hadoop云计算平台;
入库时间 2022-08-17 11:23:03

相似文献

中文文献
外文文献
专利

1. 基于Hadoop的微博用户影响力排名算法设计 [J] . 郑新 ,周莲英 . 信息技术 . 2017,第001期
2. 基于特征因子算法改进的作者影响力评价研究 [J] . 马瑞敏 ,韩小林 . 重庆大学学报（社会科学版） . 2015,第002期
3. 个人影响因子(PIF):基于综合贡献度和被引质量的作者影响力评价新指标 [J] . 李奇 ,李秀霞 ,臧志栋 . 情报探索 . 2021,第002期
4. 基于引文网络和个人影响因子的作者影响力评价研究 [J] . 李奇 ,李秀霞 . 山东图书馆学刊 . 2021,第005期
5. 基于作者贡献声明的科研人员学术影响力评价框架研究 [J] . 张闪闪 ,崔文健 ,李晓玲 . 中华医学图书情报杂志 . 2021,第007期
6. 一种基于MapReduce架构的微博用户影响力评价算法的设计与实现 [C] . FANG-Chao ,方超 ,ZHOU-Bin . 2013全国计算机网络与通信学术会议 . 2013
7. 基于引用网络的学术文献排名算法研究 [A] . 杜文杰 . 2013

基于Hadoop的学术文献排名及作者影响力评价算法

目录

摘要

著录项

相似文献

相关主题

期刊订阅