首页> 中文期刊> 《计算机科学 》 >基于句子级的最大频繁序列的文本分类

基于句子级的最大频繁序列的文本分类

             

摘要

本文提出了一种新的文本分类方法.这种方法将一篇文本的一个句子看作一个事务,一个段落看作是一个序列,则一篇文本表示成一个序列的集合.我们从每篇训练文本中挖出最大频繁序列用以表示这篇文本,这种表示方法可大大提高训练及分类速度,同时也可以几乎不损失分类精度.在数据集Reuters-21578[1]上的大量实验证明这种方法要远远好于其他的文本级的基于关联的分类方法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号