面向异构并行架构的大规模原型学习算法

苏统华; 李松泽; 邓胜春; 于洋; 白薇

首页> 中文期刊>哈尔滨工业大学学报 >面向异构并行架构的大规模原型学习算法

面向异构并行架构的大规模原型学习算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Current learning algorithms for prototype learning require intensive computation burden for large category machine learning and pattern recognition fields. To solve this bottleneck problem, a principled scalable prototype learning method is proposed based on heterogeneous parallel computing architecture of GPUs and CPUs. The method can transfer the intense workload to the GPU side instead of CPU side through splitting and rearranging the computing task, so that only a few control process is needed to be managed by the CPU. Meanwhile, the method has the ability to adaptively choose the strategies between tiling and reduction depending on its workload. Our evaluations on a large Chinese character database show that up to 194X speedup can be achieved in the case of mini-batch when evaluated on a consumer⁃level card of GTX 680. When a new GTX980 card is used, it can scale up to 638X. Even to the more difficult SGD occasion, a more than 30⁃fold speedup is observed. The proposed framework possess a high scalability while preserving its performance precision, and can effectively solve the bottleneck problems in prototype learning.%为解决当前原型学习算法在大规模、大类别机器学习和模式识别领域的计算密集瓶颈问题，提出一种采用GPU和CPU异构并行计算架构的可扩展原型学习算法框架。一是通过分解和重组算法的计算任务，将密集的计算负载转移到GPU上，而CPU只需进行少量的流程控制。二是根据任务类型自适应地决定是采用分块策略还是并行归约策略来实现。采用大规模手写汉字样本库验证本框架，在消费级显卡GTX680上使用小批量处理模式进行模型学习时，最高可得到194倍的加速比，升级到GTX980显卡，加速比可提升到638倍；算法甚至在更难以加速的随机梯度下降模式下，也至少能获得30倍的加速比。该算法框架在保证识别精度的前提下具有很高的可扩展性，能够有效解决原有原型学习的计算瓶颈问题。

著录项

来源
《哈尔滨工业大学学报》|2016年第11期|53-60|共8页
作者
苏统华; 李松泽; 邓胜春; 于洋; 白薇;
展开▼
作者单位

哈尔滨工业大学软件学院;

哈尔滨150001;

哈尔滨工业大学软件学院;

哈尔滨150001;

哈尔滨工业大学软件学院;

哈尔滨150001;

中建八局大连公司;

辽宁大连116021;

诺基亚通信系统技术北京有限公司浙江分公司;

杭州310053;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
原型学习; 学习矢量量化; 手写汉字识别; 并行归约; 异构并行计算;
入库时间 2023-07-25 10:07:16

相似文献

中文文献
外文文献
专利

1. CPU-MIC异构并行架构下基于大规模频繁子图挖掘的药物发现算法 [J] . 彭绍亮 ,牛琦 ,李肯立 . 大数据 . 2019,第002期
2. CPU-MIC异构并行架构下基于大规模频繁子图挖掘的药物发现算法 [J] . 彭绍亮1 ,牛琦1 ,李肯立1 . 大数据 . 2019,第002期
3. 面向异构架构的传递闭包并行算法 [J] . 肖汉 ,郭宝云 ,李彩林 . 计算机工程 . 2021,第008期
4. 面向混合异构架构的模型并行训练优化方法 [J] . 高开 ,郭振华 ,陈永芳 . 计算机工程与科学 . 2021,第001期
5. UPPA:面向异构众核系统的统一并行编程架构 [J] . 吴树森 ,董小社 ,王宇菲 . 计算机学报 . 2020,第006期
6. 混合异构众核架构下的并行蒙特卡罗期权定价算法 [C] . Zhang Shuai ,张帅 ,Liu Weiguo . 2014全国高性能计算学术年会 . 2014
7. 面向大规模数据分类问题的监督学习算法研究与并行应用 [A] . 杨子奇 . 2018

面向异构并行架构的大规模原型学习算法

摘要

著录项

相似文献

相关主题

期刊订阅