首页> 外文会议>International workshop on semantic evaluation >INRIASAC: Simple Hypernym Extraction Methods
【24h】

INRIASAC: Simple Hypernym Extraction Methods

机译:inriasac:简单的高瘤提取方法

获取原文

摘要

For information retrieval, it is useful to classify documents using a hierarchy of terms from a domain. One problem is that, for many domains, hierarchies of terms are not available. The task 17 of SemEval 2015 addresses the problem of structuring a set of terms from a given domain into a taxonomy without manual intervention. Here we present some simple taxonomy structuring techniques, such as term overlap and document and sentence cooccurrence in large quantities of text (English Wikipedia) to produce hypernym pairs for the eight domain lists supplied by the task organizers. Our submission ranked first in this 2015 benchmark, which suggests that overly complicated methods might need to be adapted to individual domains. We describe our generic techniques and present an initial evaluation of results.
机译:有关信息检索,使用来自域的术语层次结构对文档进行分类。一个问题是,对于许多域来说,术语的层次结构不可用。 2015年Semeval的任务17解决了在没有手动干预的情况下将一组术语从给定域构成一组术语的问题。在这里,我们提出了一些简单的分类结构化技术,例如大量文本(英语维基百科)的术语重叠和文档和句子Cooccurrence,用于为任务组织者提供的八个域列表生成HyperNyM对。我们的提交在本2015年的基准中排名第一,这表明提供了对单个域来调整的过于复杂的方法。我们描述了我们的通用技术,并提出了对结果的初步评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号