首页> 中国专利> 用于模型探索的数据采样

用于模型探索的数据采样

摘要

所公开的实施例提供了用于处理数据的系统。在操作期间,所述系统获得包含与第一标识符(ID)值集合相关联的第一记录集合的训练数据集和包含与第二ID值集合相关联的第二记录集合的评估数据集。接下来,所述系统从所述第二ID值集合中选择随机ID值子集。所述系统然后生成经采样的评估数据集,所述经采样的评估数据集包括所述第二记录集合中的与所述随机ID值子集相关联的第一记录子集。所述系统还生成经采样的训练数据集,所述经采样的训练数据集包括所述第一记录集合中的与所述随机ID值子集相关联的第二记录子集。最后,所述系统输出所述经采样的训练数据集和所述经采样的评估数据集,以用于训练和评估机器学习模型。

著录项

  • 公开/公告号CN113939829A

    专利类型发明专利

  • 公开/公告日2022-01-14

    原文格式PDF

  • 申请/专利权人 微软技术许可有限责任公司;

    申请/专利号CN202080043172.0

  • 申请日2020-05-11

  • 分类号G06K9/62(20060101);G06N20/00(20190101);

  • 代理机构72002 永新专利商标代理有限公司;

  • 代理人张立达

  • 地址 美国华盛顿州

  • 入库时间 2023-06-19 13:54:12

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号