首页> 外文会议>Text, speech and dialogue >Finding the Optimal Number of Clusters for Word Sense Disambiguation
【24h】

Finding the Optimal Number of Clusters for Word Sense Disambiguation

机译:为词义消歧找到最佳的簇数

获取原文
获取原文并翻译 | 示例

摘要

Ambiguity is an inherent problem for many tasks in Natural Language Processing. Unsupervised and semi-supervised approaches to ambiguity resolution are appealing as they lower the cost of manual labour. Typically, those methods struggle with estimation of number of senses without supervision. This paper shows research on using stopping functions applied to clustering algorithms for estimation of number of senses. The experiments were performed for Polish and English. We found that estimation based on PK2 stopping functions is encouraging, but only when using coarse-grained distinctions between senses.
机译:对于自然语言处理中的许多任务,歧义是一个固有的问题。无监督和半监督解决歧义的方法很有吸引力,因为它们降低了人工成本。通常,这些方法在没有监督的情况下就难以估计感觉。本文展示了将停止函数应用于聚类算法以估计感官数量的研究。实验是针对波兰语和英语进行的。我们发现基于PK2停止功能的估计令人鼓舞,但仅当使用感官之间的粗粒度区分时才如此。

著录项

  • 来源
    《Text, speech and dialogue》|2011年|p.388-394|共7页
  • 会议地点 Pilsen(CZ);Pilsen(CZ)
  • 作者

    Bartosz Broda; Pawel Kgdzia;

  • 作者单位

    Institute of Informatics, Wroclaw University of Technology, Poland;

    Institute of Informatics, Wroclaw University of Technology, Poland;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 人工智能理论;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号