首页> 中文会议>第二十三届中国数据库学术会议(NDBC2006) >一种新的基于BMM和RMM分词方法的研究与实现

一种新的基于BMM和RMM分词方法的研究与实现

摘要

汉语自动分词是汉语信息处理的前提,也是一个极其复杂的过程.汉语自动分词的最终目的是为"计算机理解"服务的,因此在分词过程中,能保证一定程度上的精度要求,又能易于实现,这是值得研究的.同时,最大匹配法的原则是"长词优先",现有的最大匹配方法是在局部范围进行最大匹配,即每次最大匹配的范围都是建立在最先几个或最后几个汉字串,这样并没能充分体现"长词优先"的原则.基于以上这些讨论,本文提出了改进之后的正向最大匹配分词算法和逆向最大匹配分词算法,其核心思想就是在整个句子范围内寻找最长词.经测试并比较改进之前和改进之后的结果,具有歧义切分的句子数量明显减少,使得分词精度有一定程度的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号