首页> 中国专利> 一种基于内存计算的并行化聚类方法

一种基于内存计算的并行化聚类方法

摘要

本发明提供了一种基于内存计算的并行化聚类方法,其主旨在于解决聚类算法DBSCAN在处理海量数据下的效率问题,其方案为:S1:基于简单随机抽样的数据划分,以作为此阶段的输入,通过对原始数据进行简单随机抽样来完成数据的切分,并将切分的结果保存到不同的RDD;S2:利用内存计算模型在各个计算节点并行执行DBSCAN算法,对不同的RDD中的原始数据进行聚类,产生局部类簇;S3:基于重心合并所有的局部类簇,利用内存计算模型对局部类簇进行合并,从而产生全局聚类结果。本发明基于内存计算模型,通过简单的数据划分方式对原始数据进行切割,极大地提高了算法的处理效率。同时,基于重心距离的局部类簇合并能快速地构建全局类簇,满足了处理大规模数据的用户需求。

著录项

  • 公开/公告号CN106203494B

    专利类型发明专利

  • 公开/公告日2019-12-13

    原文格式PDF

  • 申请/专利权人 电子科技大学;

    申请/专利号CN201610519403.6

  • 发明设计人 田玲;罗光春;陈爱国;殷光强;

    申请日2016-06-30

  • 分类号

  • 代理机构成都弘毅天承知识产权代理有限公司;

  • 代理人徐金琼

  • 地址 611731 四川省成都市高新区(西区)西源大道2006号

  • 入库时间 2022-08-23 10:45:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-12-13

    授权

    授权

  • 2017-01-04

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20160630

    实质审查的生效

  • 2017-01-04

    实质审查的生效 IPC(主分类):G06K 9/62 申请日:20160630

    实质审查的生效

  • 2016-12-07

    公开

    公开

  • 2016-12-07

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号