首页> 外文OA文献 >Unsupervised Induction of Natural Language Morphology Inflection Classes
【2h】

Unsupervised Induction of Natural Language Morphology Inflection Classes

机译:自然语言形态学变形类的无监督归纳

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We propose a novel language-independent framework for inducing a collection of morphological inflection classes from a monolingual corpus of full form words. Our approach involves two main stages. In the first stage, we generate a large data structure of candidate inflection classes and their interrelationships. In the second stage, search and filtering techniques are applied to this data structure, to identify a select collection of \u22true\u22 inflection classes of the language. We describe the basic methodology involved in both stages of our approach and present an evaluation of our baseline techniques applied to induction of major inflection classes of Spanish. The preliminary results on an initial training corpus already surpass an F1 of 0.5 against ideal Spanish inflectional morphology classes.
机译:我们提出了一种新颖的独立于语言的框架,用于从完整形式的单词的单语语料库中诱导出形态学变形分类的集合。我们的方法涉及两个主要阶段。在第一阶段,我们生成候选拐点类别及其相互关系的大型数据结构。在第二阶段,将搜索和过滤技术应用于此数据结构,以识别该语言的\ u22true \ u22拐点类别的精选集合。我们描述了在方法的两个阶段都涉及的基本方法,并提出了对适用于西班牙主要拐点类的归纳的基线技术的评估。相对于理想的西班牙屈折形态学类,初始训练语料库的初步结果已经超过了F1 0.5。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号