首页> 外国专利> Counter data generation for data profiling using only true samples

Counter data generation for data profiling using only true samples

机译:仅使用真实样本生成计数器数据以进行数据分析

摘要

A method for generating a dual-class dataset is disclosed. A single-class dataset and a context dataset are obtained. The context dataset can be labeled. A model can be trained using the combination of the single-class dataset and the labeled context dataset. The model can be run on the context dataset. The data points that are classified the same as the data points included in the single-class dataset, can be removed from the labeled context dataset and added to the single-class dataset. These steps can be repeated until no data points are classified by the model.
机译:公开了一种用于生成双类别数据集的方法。获得单类数据集和上下文数据集。可以标记上下文数据集。可以使用单类数据集和标记的上下文数据集的组合来训练模型。该模型可以在上下文数据集上运行。与单类数据集中包含的数据点分类相同的数据点可以从标记的上下文数据集中删除,然后添加到单类数据集中。可以重复这些步骤,直到模型没有分类任何数据点为止。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号