首页> 中国专利> 基于密度的不平衡数据混合采样算法

基于密度的不平衡数据混合采样算法

摘要

本发明公开了基于密度的不平衡数据混合采样算法,首先使用DBSCAN聚类算法对少数类和多数类进行聚类,识别并处理少数类和多数类离群点,然后依据样本的K近邻总距离,计算每个样本的边界密度,依据边界密度,确定少数类样本和多数类样本的边界区域和非边界区域,对少数类样本边界区域进行过采样,多数类样本非边界区域欠采样,最后得到平衡数据集,使用交叉验证划分数据,使用随机森林算法对样本分类测试,实验结果显示,本发明能够得到较好的分类结果,分类器性能得到提高。

著录项

  • 公开/公告号CN113378987A

    专利类型发明专利

  • 公开/公告日2021-09-10

    原文格式PDF

  • 申请/专利权人 哈尔滨理工大学;

    申请/专利号CN202110762213.8

  • 发明设计人 姜诚;万静;纪耀立;

    申请日2021-07-06

  • 分类号G06K9/62(20060101);

  • 代理机构

  • 代理人

  • 地址 150080 黑龙江省哈尔滨市南岗区学府路52号哈尔滨理工大学

  • 入库时间 2023-06-19 12:32:17

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号