A 8.93-TOPS/W LSTM Recurrent Neural Network Accelerator Featuring Hierarchical Coarse-Grain Sparsity With All Parameters Stored On-Chip

Deepak Kadetotad; Visar Berisha; Chaitali Chakrabarti; Jae-Sun Seo

首页> 外文期刊>IEEE Solid-State Circuits Letters >A 8.93-TOPS/W LSTM Recurrent Neural Network Accelerator Featuring Hierarchical Coarse-Grain Sparsity With All Parameters Stored On-Chip

【24h】

A 8.93-TOPS/W LSTM Recurrent Neural Network Accelerator Featuring Hierarchical Coarse-Grain Sparsity With All Parameters Stored On-Chip

机译：8.93 - 顶/ W LSTM经常性神经网络加速器，具有分层粗粒稀疏性，具有存储片上的所有参数

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Long short-term memory (LSTM) networks are widely used for speech applications but pose difficulties for efficient implementation on hardware due to large weight storage requirements. We present an energy-efficient LSTM recurrent neural network (RNN) accelerator, featuring an algorithm-hardware co-optimized memory compression technique called hierarchical coarse-grain sparsity (HCGS). Aided by HCGS-based block-wise recursive weight compression, we demonstrate LSTM networks with up to 16× fewer weights while achieving minimal accuracy loss. The prototype chip fabricated in 65-nm LP CMOS achieves 8.93/7.22 TOPS/W for 2-/3-layer LSTM RNNs trained with HCGS for TIMIT/TED-LIUM corpora.

机译：长期内存（LSTM）网络广泛用于语音应用，但由于大量存储要求，在硬件上有效实现困难。我们提出了一个节能的LSTM经常性神经网络（RNN）加速器，具有算法 - 硬件共同优化内存压缩技术，称为分层粗粒稀稀物（HCG）。通过基于HCGS的块递归重量压缩，我们向LSTM网络展示了高达16倍的重量，同时实现了最小的精度损耗。在65-NM LP CMOS中制造的原型芯片达到8.93 / 7.22顶/倍，用于2- / 3层LSTM RNNS，用HCG为Timit / Ted-lim Coresta培训。

著录项

来源
《IEEE Solid-State Circuits Letters》 |2019年第9期|119-122|共4页
作者
Deepak Kadetotad; Visar Berisha; Chaitali Chakrabarti; Jae-Sun Seo;
展开▼
作者单位

School of Electrical Computer and Energy Engineering Arizona State University Tempe AZ USA;

School of Electrical Computer and Energy Engineering Arizona State University Tempe AZ USA;

School of Electrical Computer and Energy Engineering Arizona State University Tempe AZ USA;

School of Electrical Computer and Energy Engineering Arizona State University Tempe AZ USA;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
Computer architecture; Logic gates; Speech recognition; Microprocessors; System-on-chip; Microsoft Windows; Recurrent neural networks;

机译：计算机架构;逻辑门;语音识别;微处理器;片上系统;Microsoft Windows;经常性神经网络;

相似文献

外文文献
专利

1. An 8.93 TOPS/W LSTM Recurrent Neural Network Accelerator Featuring Hierarchical Coarse-Grain Sparsity for On-Device Speech Recognition [J] . Kadetotad Deepak, Yin Shihui, Berisha Visar, IEEE Journal of Solid-State Circuits . 2020,第7期

机译：8.93个顶部/ W LSTM经常性神经网络加速器，具有用于设备的分层粗粒稀疏性，用于设备上的语音识别
2. A Sparse Coding Neural Network ASIC With On-Chip Learning for Feature Extraction and Encoding [J] . Knag Phil, Kim Jung Kuk, Chen Thomas, Solid-State Circuits, IEEE Journal of . 2015,第4期

机译：带有片上学习的稀疏编码神经网络ASIC，用于特征提取和编码
3. NullHop: A Flexible Convolutional Neural Network Accelerator Based on Sparse Representations of Feature Maps [J] . Aimar Alessandro, Mostafa Hesham, Calabrese Enrico, Neural Networks and Learning Systems, IEEE Transactions on . 2019,第3期

机译：NullHop：基于特征图的稀疏表示的柔性卷积神经网络加速器
4. OCEAN: An on-chip incremental-learning enhanced processor with gated recurrent neural network accelerators [C] . Chixiao Chen, Hongwei Ding, Huwan Peng, 43rd IEEE European Solid State Circuits Conference . 2017

机译：OCEAN：带有门控递归神经网络加速器的片上增量学习增强处理器
5. Design of a Scalable, Configurable, and Cluster-based Hierarchical Hardware Accelerator for a Cortically Inspired Algorithm and Recurrent Neural Networks [D] . Dey, Sumon. 2019

机译：设计可扩展，可配置和基于群集的分层硬件加速器，用于显影灵感算法和经常性神经网络
6. Deep neural network with weight sparsity control and pre-training extracts hierarchical features and enhances classification performance: Evidence from whole-brain resting-state functional connectivity patterns of schizophrenia [O] . Junghoe Kim, Vince D. Calhoun, Eunsoo Shim, -1

机译：具有权重稀疏控制和预训练的深度神经网络可提取分层特征并增强分类性能：来自精神分裂症的全脑静止状态功能连接模式的证据
7. A Cloud Server Oriented FPGA Accelerator for LSTM Recurrent Neural Network [O] . Jun Liu, Jiasheng Wang, Yu Zhou, 2019

机译：LSTM经常性神经网络的云服务器导向FPGA加速器

A 8.93-TOPS/W LSTM Recurrent Neural Network Accelerator Featuring Hierarchical Coarse-Grain Sparsity With All Parameters Stored On-Chip

摘要

著录项

相似文献

相关主题

期刊订阅