首页> 中文学位 >基于链接重要性的动态链接预测算法研究
【6h】

基于链接重要性的动态链接预测算法研究

代理获取

目录

文摘

英文文摘

声明

1 绪 论

2 基本概念和理论概述

3 基于链接重要性的动态链接预测

4 实验设计与分析

5 结束语

致 谢

参考文献

附录

展开▼

摘要

作为一种社会网络,科研合作网络中的实体关系就是两个作者之间合作发表一篇论文。科研合作网络的一个重要问题就是预测两个作者之间的合作发表论文的情况,在数据挖掘中,这一问题即是链接预测。在科研合作网络的链接预测问题中,传统的方法一般基于图的拓扑属性计算或结合语义属性的分类,但已有的方法存在两个主要问题:一篇论文在计算机表示的网络中形成的多条链接,往往是被同等对待的,但实际情况是不同作者的联系对一篇论文的贡献是不一样的。另一个问题是在相关属性的计算过程中,均将历史数据同等对待,忽视了时间因素在链接形成过程中的影响,显然这是不符合事实的。
   针对以上两点,给出了一种基于链接重要性的动态链接预测算法。根据Digital Bibliography & Library Project (DBLP)中数据集的特点,对数据集进行一个预处理,包括连通分量的求解和两个过滤规则的过滤,以使得数据规模的缩减和数据的降噪,这样有利于提高预测的准确性和降低时间复杂度。
   预处理后,给出一种称为链接重要性的度量,并以此度量为基础,对常用的拓扑属性进行修正。在语义相似度的计算过程中,对向量空间模型的TF-IDF进行了改进,并且以链接重要性为基础,提出了作者单篇论文贡献值的度量,以衡量单篇论文在描述不同作者时的区别。结合修正后的TF-IDF和单篇论文贡献值度量给出语义相似度的计算公式。引入时间因素对上述的拓扑属性和语义相似度定义进行最终的修正,以动态的反映时间因素对链接形成的影响。以上述属性为特征属性,利用分类技术进行最终的预测。
   在DBLP数据集上进行多组对比实验。实验结果表明,该算法较之已有的方法,预测准确性有了较大的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号