首页> 中国专利> 数据建模中的缺失值处理方法和装置、设备及存储介质

数据建模中的缺失值处理方法和装置、设备及存储介质

摘要

本申请公开了一种数据建模中的缺失值处理方法,通过获取样本数据集,将样本数据集中的缺失值替换为预设值,并基于样本数据集中的各数据构造多个变量;其中,每个变量中均包含有多个数据,将各变量中的数据进行分段得到多个数据段,其中,缺失值划分到同一数据段中,计算各变量的信息值,由多个变量中选择第一数量的变量,并基于所选择的第一数量的变量建立模型。由于没有对缺失值进行实质上的改变,因此保留了数据的真实性和准确性,并且将缺失值看作一种正常的属性值,与其他属性值一同参与到建模计算过程中,将会更清晰表现变量的缺失值对建模目标的趋势关系,有助于提升模型的分类能力并在后期模型评估过程中更好的解释模型。

著录项

  • 公开/公告号CN111984637A

    专利类型发明专利

  • 公开/公告日2020-11-24

    原文格式PDF

  • 申请/专利权人 苏州研数信息科技有限公司;

    申请/专利号CN202010641389.3

  • 发明设计人 王建刚;

    申请日2020-07-06

  • 分类号G06F16/215(20190101);G06K9/62(20060101);G06F16/2458(20190101);

  • 代理机构11751 北京市鼎立东审知识产权代理有限公司;

  • 代理人朱慧娟;刘瑛

  • 地址 100000 北京市东城区光明西里10号楼2单元204

  • 入库时间 2023-06-19 08:04:59

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-04-18

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号