首页> 外国专利> METHOD FOR BALANCING DATASETS OF MULTI-CLASS INSTANCE DATA

METHOD FOR BALANCING DATASETS OF MULTI-CLASS INSTANCE DATA

机译:多类实例数据的数据平衡方法

摘要

This disclosure describes a method for balancing datasets of instances in which each instancemay be labelled by a sequence, plurality or distribution of class labels. The disclosure includesperforming stochastic under-sampling (removal of dataset instances) and oversampling(replication of dataset instances) based on the distribution of classes in each instance, tominimize the ratio between the sizes of the minority class (i.e. class labelling the fewest framesacross all instances) and the majority class (i.e. class labelling the most frames across allinstances).
机译:本公开描述了一种用于平衡实例的数据集的方法,其中每个实例可以由类别标签的序列,多个或分布来标记。本公开内容包括基于每个实例中的类的分布进行随机欠采样(去除数据集实例)和过采样(复制数据集实例),以最小化少数类的大小之间的比率(即,在所有实例中标记最少帧的类) )和多数类(即在所有实例中标记最多帧的类)。

著录项

  • 公开/公告号WO2020188425A1

    专利类型

  • 公开/公告日2020-09-24

    原文格式PDF

  • 申请/专利权人 WRNCH INC.;

    申请/专利号WO2020IB52251

  • 发明设计人 BROWN COLIN;

    申请日2020-03-12

  • 分类号G06F17;G06F16/90;G06F7;G06N20;

  • 国家 WO

  • 入库时间 2022-08-21 11:09:21

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号