首页> 外文期刊>Library hi tech news >Measuring duplicate metadata records in library databases
【24h】

Measuring duplicate metadata records in library databases

机译:测量图书馆数据库中的重复元数据记录

获取原文
获取原文并翻译 | 示例
       

摘要

The changing architecture of bibliographic databases has created the problem of duplication of journal article metadata. Metadata has become a commodity, and packages of it are licensed to companies who redistribute it and make it available to users. Duplicate records have long been a problem for monograph and serial bibliographic records, and now with the increase and cross-licensing of journal article metadata, there is a need to consistently measure and define duplication in metadata databases. This article presents a new measure of duplication, which is the proportion of duplicate records retrieved in a search to the total number of records retrieved in the search. This equation measures and represents the concept of duplication in bibliographic databases. This measure can be used to compare duplication among databases and to better focus efforts towards the deduplication of metadata in bibliographic databases.
机译:书目数据库结构的不断变化产生了期刊文章元数据重复的问题。元数据已成为一种商品,其数据包已被许可给重新分发它并向用户提供的公司。重复记录长期以来一直是专着和连续书目记录的问题,现在随着期刊文章元数据的增加和交叉许可,需要在元数据数据库中一致地测量和定义重复项。本文介绍了一种新的重复度量,即在搜索中检索到的重复记录占在搜索中检索到的记录总数的比例。此等式度量并表示书目数据库中重复的概念。此措施可用于比较数据库之间的重复并更好地将精力集中于书目数据库中的元数据重复数据删除。

著录项

  • 来源
    《Library hi tech news》 |2010年第10期|p.10-12|共3页
  • 作者

    Jeffrey Beall;

  • 作者单位

    Auraria Library, University of Colorado Denver, Denver, Colorado, USA;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

  • 入库时间 2022-08-18 02:49:34

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号