首页> 中文期刊>中文信息学报 >面向多领域多来源文本的汉语依存句法树库构建

面向多领域多来源文本的汉语依存句法树库构建

     

摘要

为了支持汉语句法分析研究,目前句法分析领域已经标注了多个汉语依存句法树库.然而,已有树库主要针对较规范文本,而对各种网络文本如博客 、微博 、微信等考虑较少.为此,该文基于近期研制的标注规范及可视化在线标注系统,开展了大规模数据标注.聘请了15名兼职标注者,并采用严格的标注流程保证标注质量,目前,已经标注了约3万句的汉语依存句法树库,其中包含约1万句淘宝头条文本.该文重点介绍了数据选取 、标注流程等问题,并详细分析了标注准确率 、一致性和标注数据的分布情况.未来将继续对多领域多来源文本进行标注,扩大树库规模,并以合适的方式公开相应的标注数据.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号