首页> 外文期刊>Procedia - Social and Behavioral Sciences >Building Corpus-based Frequency Lemma Lists
【24h】

Building Corpus-based Frequency Lemma Lists

机译:建立基于语料库的频率引语列表

获取原文
获取外文期刊封面目录资料

摘要

This paper presents a simple methodology to create corpus-based frequency lemma lists, applied to the case of the Basque language. Since the first work on the matter in 1982, the amount of text written in Basque and language resources related to this language has grown exponentially. Based on state-of-the-art Basque corpora and current NLP technology, we develop a frequency lemma list for standard Basque. Our aim is twofold: On the one hand, to propose a primary Basque lemma list for a bilingual dictionary that is currently being worked on at UPV/EHU, and on the other, to contrast existing Basque dictionary lemma lists with frequency data, in order to evaluate the adequacy of our proposal and to compare lemma lists with each other.
机译:本文提出了一种简单的方法来创建基于语料库的频率引理列表,并将其应用于巴斯克语的情况。自1982年就此问题进行首次工作以来,以巴斯克语撰写的文字和与该语言有关的语言资源的数量呈指数增长。基于最新的巴斯克语料库和当前的NLP技术,我们为标准巴斯克语制定了频率引理列表。我们的目标是双重的:一方面,为目前在UPV / EHU上工作的双语词典提出主要的巴斯克引理列表,另一方面,将现有的巴斯克词典引理列表与频率数据进行对比,以便评估我们建议的适当性,并比较引理列表。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号