首页> 中文期刊> 《计算机工程与应用》 >中文垃圾邮件过滤系统中的实时分词算法设计

中文垃圾邮件过滤系统中的实时分词算法设计

     

摘要

在基于内容的中文反垃圾邮件技术中,中文分词是必不可少的一个环节.面对大规模的邮件训练样本和大负载的邮件服务器,中文分词算法的时间效率成为中文垃圾邮件过滤技术中的一个瓶颈.对此,提出一种应用在中文垃圾邮件过滤系统中的实时分词算法.该算法采用一种TRIE树型结构作为词典载体并基于最大匹配的原则,同时,在实时分类阶段结合hash表进行特征查询,极大地提高了系统的时间效率.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号