首页> 外文期刊>電子情報通信学会技術研究報告. リコンフィギャラブルシステム. Reconfigurable Systems >Nested RNSの定数除算を用いた深層畳込みニューラルネットワークのFPGA実現について
【24h】

Nested RNSの定数除算を用いた深層畳込みニューラルネットワークのFPGA実現について

机译:关于使用嵌套RN恒定划分的FPGA实现深卷积神经网络

获取原文
获取原文并翻译 | 示例
           

摘要

画像識別等の組込み機器では学習済み深層畳み込みニューラルネットワーク(DCNN:Deep Convolutional Neural Network)の識別高速化が求められている.DCNNの演算の90%以上は2次元畳み込みであり,主に積和(MAC:Multiply-Accumulation)演算が行われている.現行のFPGAはMAC演算用のDSPブロック(Xilinx社FPGAではDSP48Eブロック)を搭載しているが,大規模なDCNNを実現する際,大量のDSPプロックが必要である.nビットの乗算はO(n·2~(2n))の面積を必要とするため,入力数nを分解すれば面積を削減できる.剰余数系(RNS:Residue Number System)を改良したNested RNS(NRNS)を適用することで入力数nが分割されるため,コンパクトな回路で並列処理でき,かつ動作周波数が上がる.DCNNを実現するためには,活性化関数とオーバーフローを防止するための切り上げ処理を実現する必要がある.本論文では,NRNSの性質を利用してNRNS上で活性化関数ReLUを各桁のマルチプレクサで実現する.また,切り上げはNRNSの法の部分集合のダイナミックレンジによる定数除算を行う.この成立を利用して,定数除算をNRNS上でコンパクトに実現する.提案手法をNetFPGA SUME(Xilinx社Virtex7 VC7V690T)上に実現し,他のFPGA実現法と比較した結果提案手法が面積性能効率で最も優れていた.
机译:在诸如图像识别之类的嵌入式设备中,需要学习的深度卷积神经网络(DCNN)(DCNN)的识别速度。 DCNN的90%或更多的操作是二维卷积,主要执行产品 - 和(MAC:乘法)操作。当前FPGA配备有用于MAC计算的DSP块(Xilinx FPGA中的DSP48E块),但在实现大规模DCNN时需要大量的DSP协议。由于N位乘法需要O(n·2至(2n))的区域,因此可以通过拆卸输入数n来减小该区域。通过应用具有改进的剩余系统(RNS)系统(RNS)系统(NRNS)(NRNS)的嵌套RNS(NRNS),输入N的数量划分,因此可以与紧凑的电路并联处理,并且工作频率增加。为了实现DCNN,有必要实现圆形过程以防止激活功能和溢出。在本文中,我们使用NRNS的性质来实现NRNS在NRNS上的激活函数Relu,每个数字多路复用器都有。此外,通过NRNS法律子集的动态范围来舍入执行恒定划分。该建立用于在NRNS上实现恒定的分区。在NetFPGA Sume(Xilinx Virtex 7 VC7V690T)上实现了该方法,结果与其他FPGA实现方法相比,所提出的方法是面积的性能效率最佳。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号