首页> 中文期刊> 《电信技术研究》 >基于NGram的无词典中文分词算法

基于NGram的无词典中文分词算法

         

摘要

本文提出的无词典分词方法,仅依靠未标注语料里面包含的统计信息进行分词.这个方法分为两步:第一步通过统计得到NGram的统计信息;第二步根据这些NGram信息对新的语料进行分词.实验表明该方法在没有词典支持的情况下能够比较正确地分词,特别对于短文本有比较好的效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号