【24h】

Subword Retrieval on Biomedical Documents

机译:生物医学文献的子词检索

获取原文
获取原文并翻译 | 示例

摘要

Document retrieval in languages with a rich and complex morphology - particularly in terms of derivation and (single-word) composition - suffers from serious performance degradation with the stemming-only query-term-to-text-word matching paradigm. We propose an alternative approach in which morphologically complex word forms are segmented into relevant subwords (such as stems, prefixes, suffixes), and subwords constitute the basic unit for indexing and retrieval. We evaluate our approach on a biomedical document collection.
机译:具有丰富而复杂的形态的语言中的文档检索-特别是在派生和(单词)组成方面-受到仅词干查询词到文本词匹配范例的严重性能下降。我们提出了一种替代方法,其中将形态复杂的单词形式分割为相关的子单词(例如词干,前缀,后缀),并且子单词构成了索引和检索的基本单位。我们评估我们在生物医学文献收集方面的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号