首页> 外文会议>Nordic conference of computational Linguistics >Nefnir: A high accuracy lemmatizer for Icelandic
【24h】

Nefnir: A high accuracy lemmatizer for Icelandic

机译:Nefnir:适用于冰岛语的高精度lemmatizer

获取原文

摘要

Lemmatization, finding the basic morphological form of a word in a corpus, is an important step in many natural language processing tasks when working with morphologically rich languages. We describe and evaluate Nefnir, a new open source lemmatizer for Icelandic. Nefnir uses suffix substitution rules, derived from a large morphological database, to lem-matize tagged text. Evaluation shows that for correctly tagged text, Nefnir obtains an accuracy of 99.55%, and for text tagged with a PoS tagger, the accuracy obtained is 96.88%.
机译:在语料库中找到单词的基本形态形式的词法化处理,是处理许多形态丰富的语言时许多自然语言处理任务中的重要步骤。我们描述并评估了Nefnir,这是一种用于冰岛语的新型开源lemmatizer。 Nefnir使用源自大型形态数据库的后缀替换规则对标记的文本进行lem-matize。评估显示,对于正确标记的文本,Nefnir的准确性为99.55%,对于使用PoS标记器标记的文本,其准确性为96.88%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号