...
首页> 外文期刊>IEICE Transactions on Electronics >Preliminary Performance Analysis of Distributed DNN Training with Relaxed Synchronization
【24h】

Preliminary Performance Analysis of Distributed DNN Training with Relaxed Synchronization

机译:缓解同步分布式DNN训练的初步性能分析

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Scalability of distributed DNN training can be limited by slowdown of specific processes due to unexpected hardware failures. We propose a dynamic process exclusion technique so that training throughput is maximized. Our evaluation using 32 processes with ResNet-50 shows that our proposed technique reduces slowdown by 12.5% to 50% without accuracy loss through excluding the slow processes.
机译:由于出乎意料的硬件故障,分布式DNN培训的可扩展性可能受到特定过程的放缓的限制。 我们提出了一种动态过程排除技术,以便培训吞吐量最大化。 我们使用32种具有Reset-50的进程的评估显示,我们所提出的技术通过排除缓慢的过程,我们所提出的技术将减速12.5%至50%,而无需精确损失。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号