首页> 中文期刊> 《现代计算机:下半月版》 >针对不平衡数据的用户画像方法研究

针对不平衡数据的用户画像方法研究

         

摘要

针对分类问题中数据集特征数量较少和数据不平衡的问题,提出了一种基于特征组合和SMOTE的随机森林算法(RFFCS)。首先利用随机森林算法在构造子树时随机选择部分而非全部特征的特点,对离散后的单一特征进行两两交叉,扩展了特征空间。然后对于每一棵子树,在用自助采样法(Bootstrap)选出训练数据集后,通过合成少数类过采样技术(SMOTE)生成少数类样本,以消除其不平衡性,并且保证了子树间的差异性。利用本文所提方法在用户类型、VIP两个属性上进行实验。结果表明,改进后的方法在少数类的分类精度上有明显提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号