首页> 中文学位 >基于叙词表词间关系的领域信息检索
【6h】

基于叙词表词间关系的领域信息检索

代理获取

摘要

叙词表是由从自然语言中优选出来的语义相关、族性相关的科学术语所组成的一种规范化词典。它是文献标引与情报检索过程中,用以将文献中及标引、检索人员所用的自然语言转换为统一的系统语言的一种术语控制工具,曾在传统信息检索中取得了巨大成功。20世纪90年代以后,随着互联网技术的迅速发展和普及,信息环境发生了根本性转变。传统叙词表的编制方式、表现形式及使用模式都不再适用于网络化的信息环境,也无法满足用户新的信息需求。但在以搜索引擎为代表的网络信息检索系统逐渐暴露出缺点和不足的情况下,传统叙词表的网络化转变及其在网络信息检索中的应用研究开始成为信息检索领域的研究热点。
   本文在对网络信息检索系统现状和叙词表进行深入理论研究和调查分析的基础上,设计了一种基于叙词表词间关系的领域信息检索方法体系,以探索将叙词表词间关系引入网络信息检索中的有效方法。该方法结合了受控语言——叙词法与自然语言——关键词法,借鉴查询扩展和加权检索的思想,基于叙词表词间关系,设计了一个网络信息扩展检索和结果相关性排序方法体系,希望为用户提供更准确的检索结果。与普通的网络信息检索系统相比,基于叙词表词间关系的信息检索方法更注重如何利用叙词表这一语义逻辑体系提高检索结果的准确性和相关性。
   为了验证该方法体系的可行性与有效性,本文在方法体系及各具体功能模块详细设计的基础上,利用C#和SQL server实现了一个原型系统。然后选择《农业科学叙词表》中两个词量适中的类目范畴作为叙词表实验数据,分别以百度搜索引擎、万方数据的检索结果作为网页、文献的实验材料进行实验。实验具体分为两个阶段,首先是对扩展检索词的最优权值进行测定,然后是对相关性排序效果进行评价。
   实验结果表明,在叙词表的各种词间关系中,等同词和下位词能在一定程度上提高信息检索的准确率,而上位词和相关词几乎不能对准确率产生积极影响,应谨慎选用。此外,在具体的实验过程中也发现叙词表在真实信息检索系统中的应用还存在很多问题,需要不断对其进行改进和革新,使其更适应网络信息环境。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号