可重构计算
可重构计算的相关文献在1998年到2022年内共计274篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术
等领域,其中期刊论文169篇、会议论文13篇、专利文献388768篇;相关期刊80种,包括中国科学技术大学学报、计算机工程、计算机工程与应用等;
相关会议10种,包括全国抗恶劣环境计算机第二十五届学术年会 、第十三届全国容错计算学术会议、2008年全国高性能计算机学术年会等;可重构计算的相关文献由557位作者贡献,包括周学海、魏少军、刘雷波等。
可重构计算—发文量
专利文献>
论文:388768篇
占比:99.95%
总计:388950篇
可重构计算
-研究学者
- 周学海
- 魏少军
- 刘雷波
- 张兴明
- 季爱明
- 王超
- 张文建
- 沈海斌
- 李丽
- 李曦
- 刘波
- 向志宏
- 吴君安
- 张帆
- 曹伟
- 朱敏
- 李伟
- 杨延辉
- 赵博
- 陈鹏
- 高彦钊
- 吕平
- 周学功
- 尹首一
- 张军能
- 李仁发
- 葛伟
- 郭琦
- 陆生礼
- 刘冬培
- 吴东
- 庞建民
- 彭澄廉
- 李斌
- 窦勇
- 邬江兴
- 陈乃金
- 高妍妍
- 黄雅静
- 龚宇
- 倪明
- 刘勤让
- 刘宗海
- 刘彦
- 刘超
- 周国昌
- 宋克
- 宋宇鲲
- 宋庆增
- 尹勇生
-
-
徐雷钧;
项厚友;
倪利华
-
-
摘要:
针对传统谷物粉种类检测速度较慢的问题,基于ZYNQ平台实现随机森林算法辅助微波无损检测技术对谷物粉种类进行高效准确识别。通过对随机森林模型硬件实现的分析研究,提出了一种改进模型参数结构,有效节省了硬件存储资源的消耗。为了缩短算法预测时间并降低系统功耗,在硬件实现时引入提前终止识别机制,在保证准确率不变的前提下避免不必要的决策树预测过程。针对Zedboard开发板,设计一种模型参数存储方案,充分利用片上资源保证系统正常工作。实验结果表明,与传统CPU实现随机森林算法相比,该方案在ZYNQ上运行的实测时间缩短约54.2%,同时没有引起识别精度的损失。
-
-
黄海;
徐江;
孙铭玮;
于斌;
马超;
方舟;
曲家兴
-
-
摘要:
针对目前采用专用集成电路的硬件实现架构难以满足不同应用对灵活性需求的问题,提出一种面向轻量级分组密码的高性能可重构架构(HRALBC).通过分析42种主流的轻量级分组密码算法,提取出算法的模式特征和组合特征;以模式特征结果和组合特征结果为依据设计出可重构处理单元;根据算法映射规律设计可重构处理单元阵列,进而进行架构整体设计.将不同类型算法映射到HRALBC上,验证其功能正确性并分析映射结果.实验结果表明,在TSMC 55 nm CMOS工艺下,HRALBC的工作频率最高可达429MHz,总面积为1.23百万等效门(GE),对于不同密码算法面积效率最高可达22.33Gbit·s^(-1)·MGE^(-1);与Anole相比,对于PRESENT64/80,SPECK64/128和SIMON64/128算法,可重构单元利用率分别提高16.67%,16.67%和13.89%,面积效率分别提高66.64%,66.64%和11.04%.
-
-
常立博;
张盛兵
-
-
摘要:
为了解决已有卷积神经网络(convolution neural networks,CNNs)加速器,因无法适应混合量化CNN模型的计算模式和访存特性而引起加速器效率低的问题,设计了可适应混合量化模型的可重构计算单元、弹性片上缓存单元和宏数据流指令集。其中,采用了可根据CNN模型结构的重构多核结构以提高计算资源利用率,采用弹性存储结构以及基于Tile的动态缓存划分策略以提高片上数据复用率,采用可有效表达混合精度CNN模型计算和可重构处理器特性的宏数据流指令集以降低映射策略的复杂度。在Ultra96-V2平台上实现VGG-16和ResNet-50的计算性能达到216.6和214 GOPS,计算效率达到0.63和0.64 GOPS/DSP。同时,在ZCU102平台上实现ResNet-50的计算性能可达931.8 GOPS,计算效率可达0.40 GOPS/DSP,相较于其他类似CNN加速器,计算性能和计算效率分别提高了55.4%和100%。
-
-
蒲江;
陈海燕;
田楠
-
-
摘要:
可重构计算是为解决高性能、高效率计算问题而提出来的,通过利用可编程逻辑器件的灵活性,使设备在运行时根据不同的计算任务实现不同的功能。利用可重构系统支持运行时可重配置的特性可以构建多样化的平台,从而解决系统的安全性问题。因此,基于可重构计算的平台动态化技术的出发点与可重构计算是不同的,其目的不是实现高效能计算问题,而是借鉴可重构系统的设计方法,着眼提高系统的安全性。
-
-
李景琳;
姜晶菲;
窦勇;
许金伟;
温冬
-
-
摘要:
目标检测任务通常使用非极大值抑制算法(NMS)删除卷积神经网络输出的冗余候选框.Soft-NMS使用逐步衰减候选框得分值的方法代替Hard-NMS中直接删除大于预定义阈值候选框的方法,可以避免误删图像中重叠的目标候选框,提高目标检测任务的准确率.但是,频繁地改变候选框得分值使得Soft-NMS较Hard-NMS更为复杂,为了实现高准确率、低延时、低功耗的候选框去冗余效果,提出一种基于Soft-NMS的体系结构,利用对数函数优化复杂的浮点计算,细粒度流水和粗粒度并行组成2级优化结构进一步提升算法的吞吐率.在XILINX KU-115 FPGA开发板上对该体系结构进行了评估,评估结果表明,该体系结构的功耗为6.107W,处理992个候选框的延时为168.95μs,与CPU实现的Soft-NMS相比,该体系结构实现了36倍的性能提升,性能功耗比为CPU实现的264倍.
-
-
樊萌;
蒋林;
邓军勇;
刘洋
-
-
摘要:
针对在可重构图形处理器中根据不同性能特征选择最优纹理贴图算法的问题,采用Coffee Lake架构处理器上的硬件性能计数器,分析了最近邻点采样、双线性滤波、M ipmap结合线性滤波等3种算法在立方体、球体、圆环和茶壶等4种渲染场景对象中的数据移动量、计算量、功耗、数据缓存以及各指标的相关性.仿真结果表明,为了提高图形处理器性能,点采样和M ipmap结合线性滤波算法重构可减少数据移动量,点采样和双线性滤波算法重构可减少计算量,采用点采样算法可降低功耗,使用双线性滤波算法可提高缓存命中率.
-
-
魏少军;
李兆石;
朱建峰;
刘雷波
-
-
摘要:
随着科技快速进步,新兴应用不断涌现.无法响应软件变化的芯片,如专用集成电路(applicationspecific integrated circuit, ASIC),将因为生命周期过短,面临一次性工程成本(non-recurring engineering,NRE)过高的难题.与此同时,随着摩尔定律(Moore's law)和迪纳德定律(Dennard scaling)走向终结,未来集成电路工艺更新带来的能效收益越来越小,通用处理器可实现的计算能力被芯片功耗约束.近几年兴起的领域定制加速器(domain-specific accelerator,DSA)通过针对特定应用领域的计算模式,定制芯片架构,以期兼顾能量效率和特定领域内的灵活性.但目前DSA面向硬件定制软件,这导致软件生态碎片化,程序员学习成本增大.未来芯片设计需要兼顾灵活性、能量效率和可编程性.软件定义芯片(software-defined chip,SDC)在这一需求下成为了研究热点.可重构芯片通过融合处理器的高灵活性、ASIC的高能效,并通过重构提供了在运行时根据软件定制芯片架构的能力,是当前SDC的研究热点.本文首先回顾SDC的研究动机,然后分析可重构芯片如何满足SDC的需求,之后探讨当前可重构芯片面临的挑战,最后阐述为了实现SDC,可重构芯片未来的发展方向.
-
-
杨鹏飞;
刘波;
党佳乐;
吕文凯
-
-
摘要:
在体积、功耗等条件和资源受限的场景下,承载异构计算资源的嵌入式计算设备之间如何实现异构资源的接入和自适应协同管理,进一步联合形成具有足够规模“算力”的智能空间“云”计算平台,是实现平台“算力”的跨越提升、实现更多功能、更优性能和更高智慧应用的关键.本文提出了一种任务驱动的嵌入式可重构异构计算平台,通过集群构建的方式,对多个分布式的、承载各种不同异构计算资源的嵌入式计算板卡统一调度管理;利用容器化技术,构建任务驱动的、可重构的任务执行的虚拟计算环境;开发了基于B/S模式的平台可视化用户界面,实现了用户对平台的随遇接入和全网资源可见.本文提出的嵌入式计算平台能够提供高可用的任务接入、任务下发与任务执行;实现了异构计算资源的自组织协同和统一化管理;基于容器化的任务执行方式细化了资源管理粒度,在不损失计算能力的前提下提高了资源利用率和任务并发度.本文提出的嵌入式动态可重构计算平台解决方案是对未来嵌入式“云”计算平台架构研究设计的有益探索.
-
-
张骁;
周清雷;
李斌
-
-
摘要:
针对同时要求高吞吐率和高安全性的应用场景,提出了基于HRCA的高性能可扩展的SM4实现方案.首先,通过分析对SM4提取出的不同粒度的基础算核,提出了一个通用的粗粒度可重构计算单元;然后,为满足不同加密模式的需要给出了多种映射策略,根据不同策略将算法映射到重构计算单元;最后,通过分割控制平面和数据平面优化SM4整体架构.实验结果表明,使用所提方法,SM4算法在较低的资源消耗下吞吐量有了明显提高.
-
-
陈国通;
刘琪;
孙敬
-
-
摘要:
为解决传统频谱分析系统存在测试速度慢、对瞬态信号侦测分析不精确、实时性差的问题,提出了频率模板触发技术结合可重构计算,实现系统的超高速数据捕获、侦测与分析.频谱显示采用数字荧光显示技术,信号频谱展现更加实时、直观、精确.实测结果表明:该系统在可接受的性能损失范围内,提高了对信号的分析精确度.可重构计算使系统运行更高效,降低了传统频谱分析方法的能量消耗,使系统在大带宽情况下仍可实现对瞬态信号和复杂信号的实时精准分析.
-
-
海钰琳;
刘永强
- 《全国抗恶劣环境计算机第二十五届学术年会》
| 2015年
-
摘要:
根据可重构计算技术的发展现状及其在航空航天领域的应用和优势,对可重构计算的实际可用性进行研究,并从可重构芯片、开发工具、编译技术三个方面分析了可重构计算目前面临的障碍,理论分析了可重构计算的发展趋势.未来,伴随着可重构计算系统结构模型及可重构计算系统开发流程的成熟,可重构计算将发挥出它在半导体行业真正的影响力。
-
-
尹勇生;
高明伦;
杜高明;
宋宇鲲;
李丽
- 《2007年全国高性能计算学术年会》
| 2007年
-
摘要:
将传统微处理器与可编程器件集成在一起的混合式可重构计算系统正在成为主流计算系统。提出了一种新的混合式可重构计算系统MPRS (Multi-Pipeline Reconfigurable System),该系统中为解决流水化的应用问题而集成了多段可重构线性阵列,对其系统架构、执行模型以及系统化映射方法进行了全面论述。首先,建立了包括MPRS行为级仿真器及其编程环境在内的完整系统,给出了可重构阵列的处理单元及互连结构,定义了可重构单元的配置字格式;其次,提出了基于DGRV (Dependency Graph with Reconfigurable Variable)的系统化实现可重构阵列的方法,分析了在融入可重构因素后新的映射过程中的目标函数及设计约束;最后,给出了MPRS的编程框架,针对几个典型应用问题开发了MPRS可重构并行算法并做了编程实现。实验结果表明MPRS在功能和性能两方面都达到了预期目标。
-
-
漆锋滨;
王珊珊;
姜小成;
何王全
- 《2007全国开放式分布与并行计算学术年会》
| 2007年
-
摘要:
可重构计算是未来高性能计算的发展趋势,它兼具了通用计算的灵活性和专用计算的高效性,充分利用系统资源的同时,又能发挥应用程序的效率.可重构编译是推广可重构计算的关键技术,可重构编译系统能够为传统的软件编程人员提供一个体系结构透明的开发平台,并让用户真正灵活利用可重构计算平台.
-
-
-
-
-
-
-
王大伟;
窦勇;
李思昆
- 《2008中国计算机大会》
| 2008年
-
摘要:
粗粒度可重构体系结构为数据密集型应用提供了灵活性和高效的解决方法,而应用中的核心循环消耗了程序的大量执行时间,满足核心循环在CGRAs上实现的性能/开销的严格约束仍旧是个重大难题。针对已有工作在研究映射核心循环到CGRAs上的不足,本文提出一种新颖的核心循环自动流水映射到粗粒度可重构体系结构上的方法。rn 首先,本文形式化了核心循环到CGRAs的流水映射问题,阐述了CGRAs的资源共享和流水方法,定义了其循环自流水CGRAs体系结构模板,并给出核心循环流水映射方法。实验结果表明,与已有的先进的方法相比,我们的方法的资源占用率降低16.3%,吞吐量提高169.1%。
-
-
王大伟;
窦勇;
李思昆
- 《2008中国计算机大会》
| 2008年
-
摘要:
粗粒度可重构体系结构为数据密集型应用提供了灵活性和高效的解决方法,而应用中的核心循环消耗了程序的大量执行时间,满足核心循环在CGRAs上实现的性能/开销的严格约束仍旧是个重大难题。针对已有工作在研究映射核心循环到CGRAs上的不足,本文提出一种新颖的核心循环自动流水映射到粗粒度可重构体系结构上的方法。rn 首先,本文形式化了核心循环到CGRAs的流水映射问题,阐述了CGRAs的资源共享和流水方法,定义了其循环自流水CGRAs体系结构模板,并给出核心循环流水映射方法。实验结果表明,与已有的先进的方法相比,我们的方法的资源占用率降低16.3%,吞吐量提高169.1%。