基于近端策略优化的阻变存储硬件加速器自动量化

魏正; 张兴军; 卓志敏; 纪泽宇; 李泳昊

首页> 中文期刊>计算机研究与发展 >基于近端策略优化的阻变存储硬件加速器自动量化

基于近端策略优化的阻变存储硬件加速器自动量化

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

卷积神经网络在诸多领域已经取得超出人类的成绩.但是,随着模型存储开销和计算复杂性的不断增加,限制处理单元和内存单元之间数据交换的"内存墙"问题阻碍了其在诸如边缘计算和物联网等资源受限环境中的部署.基于阻变存储的硬件加速器由于具有高集成度和低功耗等优势,被广泛应用于加速矩阵-向量乘运算,但是其不适合进行32 b浮点数计算,因此需要量化来降低数据精度.手工为每一层确定量化位宽非常耗时,近期的研究针对现场可编程门阵列(field programmable gate array,FPGA)平台使用基于深度确定性策略梯度(deep deterministic policy gradient,DDPG)的强化学习来进行自动量化,但需要将连续动作转换为离散动作,并通过逐层递减量化位宽来满足资源约束条件.基于此,提出基于近端策略优化(proximal policy optimization,PPO)算法的阻变存储硬件加速器自动量化,使用离散动作空间来避免动作空间转换步骤,设计新的奖励函数使PPO自动学习满足资源约束的最优量化策略,并给出软硬件设计改动以支持混合精度计算.实验结果表明:与粗粒度的量化相比,提出的方法可以减少20%~30%的硬件开销,而不引起模型准确度的过多损失.与其他自动量化相比,提出的方法搜索时间短,并且在相同的资源约束条件下可以进一步减少约4.2%的硬件开销.这为量化算法和硬件加速器的协同设计提供了参考.

著录项

来源
《计算机研究与发展》|2022年第3期|518-532|共15页
作者
魏正; 张兴军; 卓志敏; 纪泽宇; 李泳昊;
展开▼
作者单位

西安交通大学计算机科学与技术学院;

北京电子工程总体研究所;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工神经网络与计算;
关键词
自动量化; 强化学习; 基于阻变存储的硬件加速器; 神经网络; 内存计算;
入库时间 2022-09-15 21:32:15

相似文献

中文文献
外文文献
专利

1. 面向阻变存储器的长短期记忆网络加速器的训练和软件仿真 [J] . 刘鹤 ,季宇 ,韩建辉 . 计算机研究与发展 . 2019,第006期
2. 基于I-V特性的阻变存储器的阻变机制研究 [J] . 李颖弢 ,刘明 ,龙世兵 . 微纳电子技术 . 2009,第3期
3. 阻变存储器阻变层材料专利技术综述 [J] . 黄晓亮 ,田凌桐 ,王文晓 . 河南科技 . 2019,第013期
4. 氧分压对Ni/HfO_x/TiN阻变存储单元阻变特性的影响 [J] . 张志超 ,王芳 ,吴仕剑 . 物理学报 . 2018,第5期
5. 基于FPGA模拟的阻变神经网络加速器评估方法 [J] . 石永泉 ,景乃锋 . 计算机工程 . 2021,第012期
6. 基于HfO2的阻变存储器抗辐照特性研究 [C] . S.G.Hu ,胡绍刚 ,X.Y.Zhang . 2013年全国博士生学术论坛——电子薄膜与集成器件 . 2013
7. 二硫化铪阻变存储器的阻变机理研究及忆阻性能优化 [A] . 李乃峰 . 2020

基于近端策略优化的阻变存储硬件加速器自动量化

摘要

著录项

相似文献

相关主题

期刊订阅