首页> 中文期刊>计算机科学 >一种新的错误驱动学习方法在中文分词中的应用

一种新的错误驱动学习方法在中文分词中的应用

     

摘要

中文分词应用中一个很重要的问题就是缺乏词的统一性定义.不同的分词标准会导致不同的分词结果,不同的应用也需要不同的分词结果.而针对不同的分词标准开发多个中文分词系统是不现实的,因此针对多种不同的分词标准,如何利用现有的分词系统进行灵活有效的输出就显得非常重要.本文提出了一种新的基于转换的学习方法,对分词结果进行后处理,可以针对不同的分词标准进行灵活有效的输出.不同于以往的用于分词的转换学习方法,该方法有效利用了一些语言学信息,把词类和词内结构信息引入规则模板和转换规则中.为了验证该方法,我们在4个标准测试集上进行了分词评测,取得了令人满意的效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号