首页> 中文期刊>中文信息学报 >词表的自动丰富--从元数据中提取关键词及其定位

词表的自动丰富--从元数据中提取关键词及其定位

     

摘要

词表和分类法是传统纸质文献环境下最重要的知识组织工具.它的更新和维护一直依靠手工进行.这限制了它在数字图书馆和网络信息环境下的应用.本文介绍了一项基于统计的、从元数据的标题中抽取关键词并定位在词表中的方法.定位的依据是抽取出的关键词所对应的标引词集的收敛性质.标引词是用于标引文献主题的、来自于词表的受控词汇,即主题词.在<中国分类主题词表>和北京大学图书馆提供的5千余条计算机科技领域的书目数据上所进行实验证明了文中所述的方法是可行的、有效的.这一方法可以直接用来实现基于已标引语料库的自动编目和元数据自动生成.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号