首页> 外文会议>Linguistic annotation workshop >Part of Speech Annotation of a Turkish-German Code-Switching Corpus
【24h】

Part of Speech Annotation of a Turkish-German Code-Switching Corpus

机译:土耳其语 - 德语代码切换语料库的词性注释的一部分

获取原文

摘要

In this paper we describe our efforts on POS annotation of a code-switching corpus created from Turkish-German tweets. We use Universal Dependencies (UD) POS tags as our tag set. While the German parts of the corpus employ UD specifications, for the Turkish parts we propose annotation guidelines that adopt UD's language-general rules when it is applicable and adapt its principles to Turkish-specific phenomena when it is not. The resulting corpus has POS annotation of 1029 tweets, which is aligned with existing language identification annotation.
机译:在本文中,我们描述了我们对从土耳其语 - 德国推文创建的代码切换语料库的POS注释的努力。我们使用通用依赖项(UD)POS标记作为我们的标记集。虽然德国人的核心员工雇用了UD规范,但对于土耳其零件,我们提出了在其适用和适应土耳其语特定现象时采用UD的语言一般规则的注释指南。由此产生的语料库具有1029推文的POS注释,其与现​​有语言识别注释对齐。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号