首页> 外文期刊>電子情報通信学会技術研究報告. VLSI設計技術. VLSI Design Technologies >Nested RNSの定数除算を用いた深層畳込みニューラルネットワークのFPGA実現について
【24h】

Nested RNSの定数除算を用いた深層畳込みニューラルネットワークのFPGA実現について

机译:利用嵌套RNS的恒定除法实现深度卷积神经网络的FPGA实现

获取原文
获取原文并翻译 | 示例
       

摘要

画像識別等の組込み機器では学習済み深層畳み込みニューラルネットワーク(DCNN:Deep Convolutional Neural Network)の識別高速化が求められている.DCNNの演算の90%以上は2次元畳み込みであり,主に積和(MAC:Multiply-Accumulation)演算が行われている.現行のFPGAはMAC演算用のDSPブロック(Xilinx社FPGAではDSP48Eブロック)を搭載しているが,大規模なDCNNを実現する際,大量のDSPブロックが必要である.nビットの乗算はO(n·2~(2n))の面積を必要とするため,入力数nを分解すれば面積を削減できる.剰余数系(RNS:Residue Number System)を改良したNested RNS(NRNS)を適用することで入力数nが分割されるため,コンパクトな回路で並列処理でき,かつ動作周波数が上がる.DCNNを実現するためには,活性化関数とオーバーフローを防止するための切り上げ処理を実現する必要がある.本論文では,NRNSの性質を利用してNRNS上で活性化関数ReLUを各桁のマルチプレクサで実現する.また,切り上げはNRNSの法の部分集合のダイナミックレンジによる定数除算を行う.この成立を利用して,定数除算をNRNS上でコンパクトに実現する.提案手法をNetFPGA SUME(Xilinx社 Virtex7 VC7V690T)上に実現し,他のFPGA実現法と比較した結果提案手法が面積性能効率で最も優れていた.
机译:对于诸如图像识别之类的嵌入式设备,需要加快对学习的深度卷积神经网络(DCNN)的识别。超过90%的DCNN运算是二维卷积,并且主要执行乘法累加(MAC)运算。当前的FPGA配备了用于MAC计算的DSP模块(Xilinx FPGA中的DSP48E模块),但是要实现大规模的DCNN,需要大量的DSP模块。由于n位乘法需要O的面积(n·2〜(2n)),因此可以通过分解输入数n来减小面积。通过使用嵌套RNS(NRNS),它是居民号码系统(RNS)的改进版本,输入的数量n被划分,因此可以在紧凑的电路中执行并行处理,并且工作频率增加。为了实现DCNN,有必要实现激活功能和向上舍入过程以防止溢出。本文利用NRNS的特性,通过每个数字的多路复用器在NRNS上实现激活函数ReLU。此外,舍入是NRNS方法子集的动态范围的恒定除法。利用此设置,可以在NRNS上紧凑地实现常数分割。该方法在NetFPGA SUME(Xilinx Virtex7 VC7V690T)上实现,并且与其他FPGA实现方法进行比较,结果表明该方法在区域性能效率方面最为出色。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号