精细化的中文词性标注评测集的研制

摘要

本文提出了一套精细化的中文词性标注评测体系.本文的工作重点在于确立其中的评测项目以及每个项目所对应的词例,提出了比对、归类、合取的方法;依此,本文初步建立了规模为5873句的、涵盖了2326项词例和70个评测项目的评测试题集,并用这套试题集对几个常见的开源词性标注程序进行了评测.最后,本文指出了精细化评测体系将评测项目和评测语料联系起来的好处——在传统体系中,二者是分开的.本文从评测项目的价值和评测语料的组织性两个方面阐述了本文的评测体系相对于传统评测体系的优势,并指出了根据本文提出的评测体系改进被测程序的方法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号