基于核主成分分析的文本分类

摘要

主成分分析是模式识别中经典的降维技术.本文尝试把它的一个变种算法--核主成分分析,与k-NN分类模型结合,应用到文本分类中.核主成分分析方法通过选择合适的核函数,利用词之间的高阶的关系进行特征抽取.实验结果表明,核主成分分析在英文语料reuters21578上达到了潜在语义索引分类性能,而在中文863评测语料上微平均F1值比潜在语义索引高2%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号