首页> 中文学位 >基于元数据的跨库文献检索方法研究
【6h】

基于元数据的跨库文献检索方法研究

代理获取

摘要

随着网络资源的爆炸式增长,特别是图书情报领域,数据库资源的种类和数量越来越多。由于各个数据库都有其独特的界面、网站结构、认证方式,用户在使用时往往需要从头开始熟悉数据库的使用方法。而且不同数据库的内容往往呈互补的关系,因此用户查找资料时经常会从一个数据库到另一个数据库逐个查找。为解决这些问题,跨库检索系统应运而生。跨库检索系统往往采用B/S模式运行,向用户提供一个统一的检索接口。用户在这个检索入口内输入检索要求,系统会同时从各个数据库内检索数据,将命中检索结果分组、排序后呈现给用户。目前成熟的跨库检索系统主要基于元搜索引擎、数据整合、中间件技术等三种技术方式实现。这些系统有的运行效率低;有的不开放数据共享接口;有的配置复杂,难以维护;有的数据描述不规范,难以交换数据。
   本文提出了基于元数据仓储的跨库检索系统模型。元数据是“关于数据的数据”,是描述一个具体的资源对象,并能对这个对象进行定位、管理,且有助于它的发现与获取的数据。DC核心元数据集,从产生开始就引起了各个领域广泛的研究兴趣。经过多年的研究发展,DC核心元数据集已被多个国家的多个组织,作为其领域描述资源对象的基本元数据集。中国数字图书馆标准规范建设项目也将DC作为数字资源对象的基本元数据集,并针对不同的文献类型的特点加以扩展。跨库检索系统中的资源类型很多,有期刊论文、会议论文、学位论文、电子图书、报纸等。因此,要充分考虑到各类型资源的共同点和不同点,又要考虑到跨库检索系统的主要功能不是保存数据、共享数据,最重要的是检索数据,统一检索分布、异构的庞大复杂数据。为此,我们将使用的元数据分成核心元素、资源类型核心元素、检索辅助元素三个层次。元数据应用纲要模型思想的重要内容,就是设计资源元数据结构时,尽量从通用元数据规范中找到需要描述和管理的元素的对应实体,利用这些实体来构建自己的元数据规范框架。在设计跨库检索系统元数据框架时,本课题充分借鉴了中国数字图书馆标准规范建设项目关于各类文献的元数据规范定义,对常用的期刊论文、学位论文、电子图书这三类文献,具体分析了他们的特点,并给出了详细的元数据规范定义。最后讨论了基于元数据仓储的跨库检索系统的框架结构,并着重讨论了数据库设计和搜索引擎两个核心问题,并进行了测试。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号