首页> 中文会议>第二届信息、电子与计算机工程国际学术会议 >一种基于位置及类内分布的文本特征加权

一种基于位置及类内分布的文本特征加权

摘要

向量空间模型下文本特征高维性是文本自动分类的主要瓶颈,文本特征降维是文本分类的核心技术。互信息(multi-information,MI)方法作为常用的特征选择方法在实际应用中效率较低。本文提出了一种改进的基于互信息的特征选择算法,针对特征项在类内分布差异以及在文本位置上差异,优化特征项的赋权方式,更充分地利用了特征项含有的类别信息。试验结果表明,该方法与经典的互信息方法相比具有明显的优势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号