首页> 外文会议> >A Dictionary Data Processing Environment and Its Application in Algorithmic Processing of Pali Dictionary Data for Future NLP Tasks
【24h】

A Dictionary Data Processing Environment and Its Application in Algorithmic Processing of Pali Dictionary Data for Future NLP Tasks

机译:词典数据处理环境及其在未来NLP任务的Pali词典数据的算法处理中的应用

获取原文

摘要

This paper presents a highly flexible infrastructure for processing digitized dictionaries and that can be used to build NLP tools in the future. This infrastructure is especially suitable for low resource languages where some digitized information is available but not (yet) suitable for algorithmic use. It allows researchers to do at least some processing in an algorithmic way using the full power of the C# programming language, reducing the effort of manual editing of the data. To test this in practice, the paper describes the processing steps taken by making use of this infrastructure in order to identify word classes and cross references in the dictionary of Pali in the context of the SeNeReKo project. We also conduct an experiment to make use of this data and show the importance of the dictionary. This paper presents the experiences and results of the selected approach.
机译:本文提出了一种高度灵活的基础结构,用于处理数字化词典,并且可以在将来用于构建NLP工具。此基础结构特别适用于一些数字化信息可用但还不适合算法使用的低资源语言。它使研究人员可以使用C#编程语言的全部功能以算法方式进行至少一些处理,从而减少了手动编辑数据的工作量。为了在实践中对此进行测试,本文描述了在SeNeReKo项目的上下文中利用此基础结构来识别Pali词典中的单词类和交叉引用所采取的处理步骤。我们还进行了一项实验,以利用这些数据并显示字典的重要性。本文介绍了所选方法的经验和结果。

著录项

  • 来源
    《》|2014年|65-73|共9页
  • 会议地点
  • 作者

    Juergen Knauth; David Alfter;

  • 作者单位
  • 会议组织
  • 原文格式 PDF
  • 正文语种
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号