基于AVX2指令集的深度学习混合运算策略

蒋文斌; 王宏斌; 刘湃; 陈雨浩

首页> 中文期刊> 《清华大学学报：自然科学版》 >基于AVX2指令集的深度学习混合运算策略

基于AVX2指令集的深度学习混合运算策略

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

由于图形处理器(GPU)内存容量有限,其所能承载的深度学习网络模型规模受到很大限制。该文提出了一种深度学习混合运算策略,借助于Intel新的单指令多数据AVX2指令集,充分挖掘CPU对GPU的辅助支撑潜力。为节省GPU内存,将中间数据规模较大的网络层放在CPU端计算,并通过AVX2指令集提高CPU端的计算效率。核心技术点包括网络模型的切分与协调、基于AVX2指令的应用代码矢量化等。上述策略最终在Caffe上实现。在包括CIFAR-10、 ImageNet在内的典型数据集上的实验结果表明:采用混合运算策略后,Caffe能够正常运行更大型神经网络模型,并保持较高的执行效率。

著录项

来源
《清华大学学报：自然科学版》 |2020年第5期|408-414|共7页
作者
蒋文斌; 王宏斌; 刘湃; 陈雨浩;
展开▼
作者单位

华中科技大学计算机科学与技术学院;

大数据技术与系统国家工程研究中心;

服务计算技术与系统教育部重点实验室;

武汉430074;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工神经网络与计算;
关键词
混合运算; 深度学习; AVX2指令集; 图形处理器(GPU)内存; Caffe;

相似文献

中文文献
外文文献
专利

1. 基于深度学习提升初中生数学运算能力策略研究 [J] . 王正香 ,孙书荣 ,韩振来 . 山东教育 . 2022,第42期
2. 逆向而行,用问题驱动深度学习--以"分数四则混合运算"为例 [J] . 朱森明 . 小学教学:数学版 . 2022,第9期
3. 立足运算能力的“有理数的混合运算”教学策略 [J] . 马振华 . 数学教学研究 . 2023,第3期
4. 基于 MIPS 指令集的超标量和超长指令字混合架构处理器设计 [J] . 李源 ,马海林 ,何虎 . 计算机应用研究 . 2016,第6期
5. 基于二进制插桩的ASIP处理器指令集混合仿真方法 [J] . 邱吉 ,高翔 ,彭飞 . 计算机研究与发展 . 2012,第z1期
6. 基于二进制插桩的ASIP处理器指令集混合仿真方法 [C] . 邱吉 ,高翔 ,彭飞 . 2011年第17届全国信息存储技术大会(IST 2011) . 2011
7. 基于RISC-V指令集微处理器的运算模块设计 [A] . 关文博 . 2018

基于AVX2指令集的深度学习混合运算策略

摘要

著录项

相似文献

相关主题

期刊订阅