首页> 外文学位 >Corpus-based learning for pronominal anaphora resolution.
【24h】

Corpus-based learning for pronominal anaphora resolution.

机译:基于语料库的学习,用于代词回指解析。

获取原文
获取原文并翻译 | 示例

摘要

Anaphora resolution is a challenging and important problem in Natural Language Processing. We use machine learning from both labelled and unlabelled corpora to gather probabilistic information for reference resolution. Our unsupervised, unlabelled textual extraction approaches are a form of "bootstrapping" for information extraction. By assuming coreference links in unlabelled text, we can infer statistically meaningful information to assist coreference determination. This includes information on a noun's gender and number, its frequency as an antecedent, and the likelihood of coreference occurring between entities along a given syntactic relationship. These new sources of information are combined with well known constraints and preferences by inducing classifiers using supervised learning.
机译:回指解析度是自然语言处理中具有挑战性和重要的问题。我们使用来自标记和未标记语料库的机器学习来收集概率信息,以供参考解析。我们的无监督,无标签的文本提取方法是信息提取的“引导”形式。通过假设未标记文本中的共指链接,我们可以推断出有意义的统计信息,以帮助确定共指。这包括有关名词的性别和数量,其作为先行词的频率以及沿给定句法关系在实体之间发生共指的信息。通过使用监督学习归纳分类器,将这些新的信息源与众所周知的约束条件和偏好结合在一起。

著录项

  • 作者

    Bergsma, Shane Anthony.;

  • 作者单位

    University of Alberta (Canada).;

  • 授予单位 University of Alberta (Canada).;
  • 学科 Computer Science.
  • 学位 M.Sc.
  • 年度 2005
  • 页码 77 p.
  • 总页数 77
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 自动化技术、计算机技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号