首页> 外国专利> METHOD FOR BALANCING DATASETS OF MULTI-CLASS INSTANCE DATA

METHOD FOR BALANCING DATASETS OF MULTI-CLASS INSTANCE DATA

机译:多类实例数据的数据平衡方法

摘要

This disclosure describes a method for balancing datasets of instances inwhich each instancemay be labelled by a sequence, plurality or distribution of class labels. Thedisclosure includesperforming stochastic under-sampling (removal of dataset instances) andoversampling(replication of dataset instances) based on the distribution of classes ineach instance, tominimize the ratio between the sizes of the minority class (i.e. classlabelling the fewest framesacross all instances) and the majority class (i.e. class labelling the mostframes across allinstances).
机译:本公开描述了一种用于平衡实例中的数据集的方法。每个实例可以通过类别标签的序列,多个或分布来标记。的披露内容包括执行随机欠采样(删除数据集实例),以及过采样(复制数据集实例)基于每个实例,最小化少数族裔(即标记最少的帧在所有实例中)和多数类(即标记最多的类所有框架实例)。

著录项

  • 公开/公告号CA3036847A1

    专利类型

  • 公开/公告日2020-09-15

    原文格式PDF

  • 申请/专利权人 WRNCH INC.;

    申请/专利号CA20193036847

  • 发明设计人 BROWN COLIN;

    申请日2019-03-15

  • 分类号G06F17;G06N20;G06F7;

  • 国家 CA

  • 入库时间 2022-08-21 11:14:47

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号