首页> 中国专利> 一种基于大数据和云计算的数据处理方法及云计算平台

一种基于大数据和云计算的数据处理方法及云计算平台

摘要

本发明公开了一种基于大数据和云计算的数据处理方法及云计算平台,包括步骤:S1,获取待处理的原始数据;S2,对原始数据进行缺失值清洗,得到缺失值清洗后数据;S3,对缺失值清洗后数据进行错误值清洗,得到错误值清洗后数据;错误值包括格式错误、拼写错误和属性域错误;S4,对错误值清洗后数据进行相似度重复记录清洗,得到重复清洗后数据。本发明利用云计算对大数据进行缺失值清洗、错误值清洗和相似度重复记录清洗,可有效提高大数据的质量。

著录项

  • 公开/公告号CN114595212A

    专利类型发明专利

  • 公开/公告日2022-06-07

    原文格式PDF

  • 申请/专利权人 深圳极联信息技术股份有限公司;

    申请/专利号CN202210169234.3

  • 发明设计人 陈强;游建;

    申请日2022-02-23

  • 分类号G06F16/215;G06F16/25;

  • 代理机构北京酷爱智慧知识产权代理有限公司;

  • 代理人阮建

  • 地址 518000 广东省深圳市南山区西丽街道西丽社区留仙大道创智云城1标段1栋C座706

  • 入库时间 2023-06-19 15:35:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-07

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号