基于文本团的自动文本分类方法

摘要

自动文本分类是指在给定的分类体系下,对未知类别的文档进行自动处理,并根据文档特征判断其所属类别的过程.现有的文本分类算法如:KNN、SVM大都基于向量空间模型,没有考虑文档的语义特征信息。本文根据文档相似性矩阵构造文本相似图,在图中提取文本团(完全子图),这些文本团可以反映每个类别的主题信息,由此构造分类器,进而与经典的分类器组合,进行文本分类.在复旦大学中文文本分类语料库和20 Newsgroups上进行实验,实验表明本文提出的分类方法较大改进了分类性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号