首页> 外文会议>Pacific Asia Conference on Language, Information and Computation >Automatic Clause Boundary Annotation in the Hindi Treebank
【24h】

Automatic Clause Boundary Annotation in the Hindi Treebank

机译:北印度语树库中的自动子句边界注释

获取原文

摘要

In this paper, we propose a method for automatic clause boundary annotation in the Hindi Dependency Treebank. We show that the clausal information implicitly encoded in a dependency structure can be made explicit with no or less human intervention. We exercised the proposed approach on 16,000 sentences of Hindi Dependency Treebank. Our approach gives an accuracy of 94.44% for clause boundary identification evaluated over 238 clauses. The resultant corpus has varied usages and can be utilized for developing a statistical clause boundary identifier.
机译:在本文中,我们提出了一种印地语依赖树库中自动子句边界注释的方法。我们证明了隐式编码在依赖结构中的子句信息可以在没有人为干预的情况下变得明确。我们对印地语依赖树库的16,000个句子执行了建议的方法。我们的方法给出了对238个子句进行评估的子句边界识别的94.44%的准确性。所得语料库具有多种用法,可用于开发统计子句边界标识符。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号