首页> 中国专利> 一种基于数据摘要去重数据的方法、装置及存储介质

一种基于数据摘要去重数据的方法、装置及存储介质

摘要

本发明提出了一种基于数据摘要去重数据的方法、装置及存储介质,该方法包括:摘要计算步骤,对要去重的数据进行摘要计算得到数据摘要;去重步骤,基于数据摘要在内存数据库和列存数据库的查找结果完成数据的去重。提高了用户体验。本发明在对海量数据和每条记录多字段的场景下,通过对去重字段做摘要,减少比对次数,通过内存数据库和列存数据库来提高比对效率,来达到海量数据下的根据多字段进行高速去重。本发明只需要配置去重字段的配置文件即达到可快速识别重复数据的目的,提高了去重效率,防止系统因数据去重占用资源过多而导致系统崩溃,提高了用户体验,适用于在数据体量巨大、数据字段多、定制化字段等去重场景下。

著录项

  • 公开/公告号CN111444167A

    专利类型发明专利

  • 公开/公告日2020-07-24

    原文格式PDF

  • 申请/专利权人 厦门市美亚柏科信息股份有限公司;

    申请/专利号CN202010219652.X

  • 申请日2020-03-25

  • 分类号G06F16/215(20190101);G06F16/242(20190101);

  • 代理机构35235 厦门福贝知识产权代理事务所(普通合伙);

  • 代理人肖琨

  • 地址 361000 福建省厦门市思明区软件园二期观日路12号102-402单元

  • 入库时间 2023-12-17 10:46:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-24

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号