首页> 中国专利> 一种基于函数依赖的数据清洗方法

一种基于函数依赖的数据清洗方法

摘要

本发明公开了一种基于函数依赖的数据清洗方法,其特征在于,包括:对原始数据进行数据转换,以将其不同类型的属性全部转换为数值型属性;对于数据转换后的原始数据,提取其属性的自依赖函数特征;对于数据转换后的原始数据,提取其属性之间的互依赖函数;根据自依赖函数特征和互依赖函数确定需要进行清洗及待清洗的属性及样本,并根据该属性及样本形成相关清洗决策依据,判断待清洗的属性对象是采用自依赖函数清洗还是采用互依赖函数进行清洗,若采用自依赖函数清洗,则将不符合条件的样本根据自依赖函数确定的多项式进行校准修复,并加上白噪声作为随机扰动。本发明能够解决大数据中“脏数据”问题,为后续的大数据分析挖掘提供高质量的数据。

著录项

  • 公开/公告号CN105447079B

    专利类型发明专利

  • 公开/公告日2018-11-02

    原文格式PDF

  • 申请/专利权人 华中科技大学;

    申请/专利号CN201510742638.7

  • 发明设计人 莫益军;曾志华;谭辉;

    申请日2015-11-04

  • 分类号

  • 代理机构华中科技大学专利中心;

  • 代理人朱仁玲

  • 地址 430074 湖北省武汉市洪山区珞喻路1037号

  • 入库时间 2022-08-23 10:20:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-02

    授权

    授权

  • 2016-04-27

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20151104

    实质审查的生效

  • 2016-04-27

    实质审查的生效 IPC(主分类):G06F 17/30 申请日:20151104

    实质审查的生效

  • 2016-03-30

    公开

    公开

  • 2016-03-30

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号