首页> 中国专利> 基于Spark的快速寻找聚类中心的方法和系统

基于Spark的快速寻找聚类中心的方法和系统

摘要

本发明涉及一种基于Spark的快速寻找聚类中心的方法,涉及计算机信息获取和处理技术。本发明实现了基于Spark的并行CFSFDP聚类算法,利用内存并行计算框架解决了CFSFDP聚类算法处理数据规模小、效率低的问题。基于Spark的并行CFSFDP聚类算法首先通过把两点距离计算分成完全独立的子部分,再将计算结果在汇总服务器上处理分析,然后继续将一系列计算任务切割成独立子任务,汇总到一台服务器上,最终并行计算得到聚类中心,在得到聚类中心后串行计算得到所有数据点的类别。本发明在处理数据中充分发挥了CFSFDP算法的优点,弥补一些常用并行聚类算法的不足。

著录项

  • 公开/公告号CN109389140A

    专利类型发明专利

  • 公开/公告日2019-02-26

    原文格式PDF

  • 申请/专利权人 中国科学院计算技术研究所;

    申请/专利号CN201710693112.3

  • 发明设计人 李学兵;庄福振;敖翔;何清;

    申请日2017-08-14

  • 分类号G06K9/62(20060101);

  • 代理机构11006 北京律诚同业知识产权代理有限公司;

  • 代理人祁建国;梁挥

  • 地址 100080 北京市海淀区中关村科学院南路6号

  • 入库时间 2024-02-19 06:52:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-22

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20170814

    实质审查的生效

  • 2019-02-26

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号