基于潜在语义分析的Web文本分类

摘要

传统的基于向量空间的文本分类方法很难处理文本的高维特性,本文首先综述了潜在语义分析的理论及方法,并且解释其数学意义,提出基于潜在语义分析的Web文本分类方法,给出Web文本的特征表示,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间.在潜在语义空间中利用支持向量机方法实现文本分类.最后采用两种文本分类方法进行对比实验,实验表明基于潜在语义分析的方法比传统方法取得更好的文本分类效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号