首页> 中文期刊> 《商业经济》 >基于偏最小二乘法的Logistic模型在文本分类中的应用

基于偏最小二乘法的Logistic模型在文本分类中的应用

         

摘要

鉴于文本分类具有高维性和高相关性的特点,已有文本分类研究采用能够有效降维和消除共线性的主成分Logistic模型。然而,这种模型定式在提取主成分时没有考虑解释变量与被解释变量之间的相关性,可能导致与文本分类关系密切的解释变量信息的丢失,从而削弱模型的分类能力。考虑到这一缺陷,在分析中引入偏最小二乘方法,并对20newsgroups语料库进行分类,结果显示,在高维分类时,其分类性能相对于主成分Logistic模型具有明显优势,表明这种方法用于文本分类的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号