首页> 中国专利> 一种针对多标签分类数据不均衡问题的采样方法

一种针对多标签分类数据不均衡问题的采样方法

摘要

本发明公开了一种针对多标签分类数据不均衡问题的采样方法,包括A定义为大小为m*n的标签矩阵,m等于训练样本的数量,n等于每个图像具有的属性的数量,PA‑100K数据集有100000个要训练的行人图像,每个图像都有26个分类属性,A是一个二进制矩阵,大小为100000*26,r是权重向量,其长度等于m,它表示在将DAI应用于整个训练数据集后,产生的子数据集存在的样本数,重新加权后,带有少数正样本的标签通过重新采样更加平衡。本发明使每个标签样本达到相对平衡状态,从而提高属性识别的精确度,通过对样本进行加权来整合过采样和欠采样,有助于模型很好地学习在数据集中占据小部分的属性。

著录项

  • 公开/公告号CN111079811A

    专利类型发明专利

  • 公开/公告日2020-04-28

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201911245293.9

  • 发明设计人 白夏颖;翟得胜;冯子豪;

    申请日2019-12-06

  • 分类号

  • 代理机构北京劲创知识产权代理事务所(普通合伙);

  • 代理人徐家升

  • 地址 710000 陕西省西安市雁塔区太白南路2号

  • 入库时间 2023-12-17 09:12:36

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-04-28

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号