首页> 中文期刊>新疆大学学报(自然科学版) >基于众包的维吾尔语事件标注研究

基于众包的维吾尔语事件标注研究

     

摘要

Large scale annotated corpora have played an important role in natural language processing (NLP) research, encountering the development of novel ideas, tasks and algorithm. Confronted with the lack of event tagging corpus in Uyghur language and the fact that corpus annotation only involves a simple human intelligence, this research proposes an event corpus annotation method based on crowdsourcing. At first, the paper formulated the Uygur event tagging specification, then we established a three-layer architecture corpus tagging platform, and then put forward error correction mechanism and quality control strategies to ensure the tagging quality. The establishment of Uygur language event tagging corpus can provide powerful resources for the Uyghur language event researches.%大规模标注语料库在自然语言处理的语义理解和算法研究等领域有重要作用。本文针对维吾尔语事件标注语料空白以及标注仅仅涉及简单的人类智能的事实,提出了一种基于众包的维吾尔语事件标注方法。在制定了维吾尔语事件标注规范之后,建立了三层架构的标注体系,并提出质量控制机制。维吾尔语事件标注语料库为维吾尔语事件的研究提供了重要的资源支持。

著录项

  • 来源
    《新疆大学学报(自然科学版)》|2015年第2期|209-214,220|共7页
  • 作者单位

    新疆大学 信息科学与工程学院;

    新疆 乌鲁木齐 830046;

    新疆大学 自治区语言技术重点实验室;

    新疆 乌鲁木齐 830046;

    新疆大学 信息科学与工程学院;

    新疆 乌鲁木齐 830046;

    新疆大学 自治区语言技术重点实验室;

    新疆 乌鲁木齐 830046;

    新疆大学 信息科学与工程学院;

    新疆 乌鲁木齐 830046;

    新疆大学 自治区语言技术重点实验室;

    新疆 乌鲁木齐 830046;

    新疆大学 信息科学与工程学院;

    新疆 乌鲁木齐 830046;

    新疆大学 自治区语言技术重点实验室;

    新疆 乌鲁木齐 830046;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP391.41;
  • 关键词

    事件; 维吾尔语; 语料库; 众包;

  • 入库时间 2023-07-25 22:48:24

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号