【24h】

Thesaurus Based Term Ranking for Keyword Extraction

机译:基于词库的关键词提取术语排名

获取原文

摘要

In many cases keywords from a restricted set of possible keywords have to be assigned to texts. A common way to find the best keywords is to rank terms occurring in the text according to their tf.idf value. This requires a corpus of texts from which document frequencies can be derived. In this paper we show that we can obtain results of the same quality without the usage of a background corpus, using relations between terms provided in a thesaurus.
机译:在许多情况下,必须将一组有限的可能关键字中的关键字分配给文本。查找最佳关键字的一种常见方法是根据文本中出现的字词的tf.idf值对其进行排名。这需要可以从中导出文档频率的文本语料库。在本文中,我们表明,通过使用同义词库中提供的术语之间的关系,无需使用背景语料库就可以获得相同质量的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号