首页> 中国专利> 一种国产申威26010众核处理器上K-means算法的高性能并行实现方法

一种国产申威26010众核处理器上K-means算法的高性能并行实现方法

摘要

本发明提出了一种国产申威26010众核处理器上K‑means算法的高性能并行实现方法,基于国产处理器申威26010平台,针对聚类阶段,本发明设计了一种块距离矩阵计算与规约操作融合的计算框架,该框架使用三层分块策略进行任务划分,同时设计协作式的核间数据共享方案和基于寄存器通信机制的簇标签规约方法,及使用双缓冲技术,指令重排等优化技术。针对更新中心点阶段,本发明设计了动态调度的任务划分方式。通过在真实数据集上测试,本发明可以达到最大348.1GFlops的浮点计算性能,相比理论上最大性能,可以获得47%~84%的浮点计算效率,相比不融合的计算方式,可以获得最高1.7x,平均1.3x的加速比。

著录项

  • 公开/公告号CN108509270B

    专利类型发明专利

  • 公开/公告日2020-09-29

    原文格式PDF

  • 申请/专利权人 中国科学院软件研究所;

    申请/专利号CN201810188779.2

  • 发明设计人 杨超;李敏;闫碧莹;

    申请日2018-03-08

  • 分类号G06F9/50(20060101);G06F9/48(20060101);

  • 代理机构11251 北京科迪生专利代理有限责任公司;

  • 代理人安丽

  • 地址 100190 北京市海淀区中关村南四街4号

  • 入库时间 2022-08-23 11:15:19

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号