首页> 中文学位 >科技文献引用关系分析及其量化算法研究
【6h】

科技文献引用关系分析及其量化算法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 引 言

1.1 研究背景

1.2 国内外研究现状

1.3 主要工作和创新点

1.4 组织结构

第2章 相关知识介绍

2.1 信息检索

2.2 本体

2.3 引文分析

2.4 本章小结

第3章 科技文献引用关系分析及量化算法

3.1 知识图谱与知识可视化

3.2 文献引用与网页链接比较

3.3 文献引用关系分析

3.4 关注度和价值度计算的迭代算法

3.5 本章小结

第4章 实验与分析

4.1 数据集简介

4.2 查询公式

4.3 评价模型性能的指标

4.4 实验结果分析

4.5 本章小结

第5章 工作总结与展望

5.1 工作总结

5.2 工作展望

参考文献

致 谢

攻读硕士学位期间取得的科研成果

展开▼

摘要

在信息检索领域,科技文献之间的引用关系是一种重要的信息资源。传统引文分析在计算机科学、信息计量学和科学计量学等领域有着广泛地应用。但是传统引文分析大部分只考虑了文献被引用的次数,没有考虑文献本身的重要程度和文献间的紧密程度,也没有进行量化工作。
  一篇文献的重要性可以通过关注度和价值度来度量,文献的关注度定义为它被其所属领域内其他文献引用的程度,文献的价值度定义为它对其所属领域内其他文献的参考程度。一篇科技文献的关注度和价值度分别受到三个因素的影响,包括被引用或引用的文档数量,文档本身的重要程度,文档与文档间的紧密程度。引文分析可以以知识图谱的形式进行可视化工作,可以在逻辑结构层面上使用加权有向无环图来分析引文,其中节点代表文献,有向边代表引用关系,权值代表文献之间的紧密程度。文献引用关系在物理结构层面上使用索引表来分析,给出引用文献索引号、被引用文献索引号和对应的紧密程度。本文介绍了术语本体关联度和文档本体关联度的概念和计算方法,设计了一种迭代算法来计算关注度和价值度。
  原始的检索方法是以使用向量模型得到的相似度作为依据,本文提出的改进方法则使用相似度、关注度和价值度三个因子作为依据。通过使用两种方法得到的平均查全率查准率以及检索结果的排序情况来评估实验结果。实验结果证明,这种改进方法能有效地提高检索性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号