您现在的位置: 首页> 研究主题> 异构多核

异构多核

异构多核的相关文献在2006年到2022年内共计329篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、测绘学 等领域,其中期刊论文76篇、会议论文4篇、专利文献26994篇;相关期刊45种,包括地球信息科学学报、黑龙江科技信息、电子技术应用等; 相关会议4种,包括第十五届计算机工程与工艺年会暨第一届微处理器技术论坛、2009年全国高性能计算学术年会、2008年全国高性能计算机学术年会等;异构多核的相关文献由786位作者贡献,包括周学海、张军能、李曦等。

异构多核—发文量

期刊论文>

论文:76 占比:0.28%

会议论文>

论文:4 占比:0.01%

专利文献>

论文:26994 占比:99.70%

总计:27074篇

异构多核—发文趋势图

异构多核

-研究学者

  • 周学海
  • 张军能
  • 李曦
  • 王超
  • 方娟
  • 冯晓静
  • 陈香兰
  • C·王
  • E·鲍林
  • S·胡
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 张志超; 王剑; 章隆兵; 肖俊华
    • 摘要: 针对数据中心基于图形处理器(GPU)平台的关系网络推理计算中存在的低效能问题,本文提出了一种基于软硬件协同加速的关系网络优化方法。该方法采用基于GPU提取的支持集特征池与现场可编程门阵列(FPGA)推理异构协同的方式处理关系网络的推理计算,在高效能计算的同时保持关系网络的推理计算与GPU平台一致的准确率。利用基于高级综合(HLS)优化浮点卷积神经网络的计算方式,提高关系网络的处理能效。利用多运算单元异构多核处理的方式,满足FPGA时序收敛的同时,提升FPGA片上吞吐能力。本文在FPGA平台上实现了关系网络推理运算单元,在Omniglot数据集上构建的加速器功耗为15.867W,相对于GPU加速比为1.4~17.2;在miniImageNet数据集上构建的加速器功耗为12.359W,相对于GPU加速比为1.5~3.4。本文方法与同类FPGA加速浮点卷积神经网络相比,达到了最优的计算效能。实验数据表明,该方法有效利用了软硬件协同计算以及FPGA可重构计算的优势,降低了软硬件协同开发的耦合度,在保持关系网络推理计算准确率的同时,提升了关系网络推理的计算效能。
    • 凤良山; 李俊
    • 摘要: 目前整车E/E架构由于面临来自不同控制器和传感器的数据交互需求而变得愈加复杂,所需要解决的问题包括:功能复杂性,通信带宽,计算能力,灵活性,可拓展性等。其中域控制器上层应用算法对获取数据的同步尤其敏感,数据融合需要针对同一时间点获取到的数据做融合处理。因此,对域控制器内部的异构多核、外部控制器数据以及传感器数据时间同步的研究尤其重要。基于此,文章详细介绍了域控制器片内及片外时间同步的方法,解决了域控制器内外部数据时间不同步的技术缺陷。
    • 李阳; 李建华; 周义涛; 赵玉来; 胡海洋
    • 摘要: 异构多核架构逐渐成为多核处理器的主流平台,并且不同的应用场景对异构多核架构有不同的需求。通过集成不同类型的处理核,异构多核平台具有更好的灵活性,不同的应用程序可以根据需求动态地选择不同的核心组合来高效地处理任务。然而,随着核的类型、数量和支持的频率级别的增加,如何高效地调度和管理异构多核平台是当前的一个重要的挑战。现有的调度算法多是基于内核利用率的简单启发式算法,难以利用异构多核的特性获得最优的性能。本文提出了一种基于ANN的动态调度算法,能更好地发挥异构多核平台不同核心的优势来提升应用程序的执行效率。本文所提出的调度算法将应用程序的执行划分为等长的间隔,在相邻的间隔间动态调整映射策略。该调度算法由2个模块构成:首先根据不同核心在不同时刻的处理特征,利用神经网络预测应用程序下一阶段在该类型核心上运行的IPC。其次,所提出的调度算法会根据预测的IPC值确定应用程序下一阶段被映射的核心类型,动态调整映射。实验表明,本文提出的方法相比于传统的轮询调度算法(Round Robin Scheduler,RRS)可以将每个时钟周期执行的指令条数(Instruction Per Cycle,IPC)平均提高63%。
    • 张玄; 张多利; 宋宇鲲
    • 摘要: 异构多核技术的发展使微处理器的性能有了较大提升,而处理器与外部存储器之间的带宽差异限制了处理器的性能发挥,“存储墙”问题日益严重。针对一种用于高密度计算的异构多核SoC系统,文中提出了一套存储设计方案。该方案通过复用一些长时间闲置的本地空闲存储资源作为二级共享缓存来增加访存带宽,减少访问外部存储频率。分布式高速共享二级缓存结合多路并行访问外部存储的层次化存储结构,缓解了系统处理数据与外部存储器间的速度差异,提高了数据的存取效率,优化了系统的性能。综合资源消耗和计算效率,文中所提设计相比普通二级缓存节约了69.36%的片上SRAM资源,相比无缓存结构提高了41.2%的加速比,整体任务计算时间平均减少了约40.6%。
    • 王月恒; 倪伟; 汪敏
    • 摘要: 关键路径的确定与优化在异构多核系统的任务调度算法中占据重要地位。为解决异构多核系统调度算法常因估算关键路径时的参数选择存在局限而导致的估算结果偏差过大,调度结果不佳的问题,文章提出一种在参数计算时考虑资源约束的异构多核任务复制调度算法(task-duplication scheduling algorithm with resource constraints,TDSA-RC)。该算法通过改进布局优化方式,扩大其适用范围;同时通过筛除冗余任务,减少任务复制过程中产生的不必要的计算。通过随机生成的任务图和3种实际应用的任务图调度对比实验表明,该算法能有效缩短并行任务的调度长度,与TDCA(task-duplication based clustering algorithm)算法相比,平均性能可提升12.08%,适合处理规模大、层级少且join节点占比多的并行任务。
    • 谭磊; 李益; 付建国
    • 摘要: 随着需求的不断提高,变流器控制平台中,越来越多的使用到了异构多核芯片处理架构,复杂的数据链路不可避免的给数据传输带来难度.本文根据其控制芯片多、数据交互量大、实时性要求高、数据链路长的特点,提出了一套稳定可靠的高速数据传输方法,解决异构多核平台跨时钟域数据传输过程中的丢包和重包问题.
    • 谭磊; 李益; 付建国
    • 摘要: 随着需求的不断提高,变流器控制平台中,越来越多的使用到了异构多核芯片处理架构,复杂的数据链路不可避免的给数据传输带来难度。本文根据其控制芯片多、数据交互量大、实时性要求高、数据链路长的特点,提出了一套稳定可靠的高速数据传输方法,解决异构多核平台跨时钟域数据传输过程中的丢包和重包问题。
    • 张铭; 张志刚; 文勇军; 宾峰; 唐立军
    • 摘要: 针对4K超高清视频无线传输中压缩率低,数据存储成本高以及信道抗干扰能力弱等问题,提出基于异构多核的超高清视频无线传输方法.该方法使用ARM+FPGA异构多核架构,将四核Cortex-A53 APU、双核Cortex-R5 RPU及定制FPGA集成.由ARM执行多项任务处理与控制,借助FPGA强大的并行处理能力,实现硬件层次上编解码及通信算法的加速,根据HEVC编解码和COFDM调制解调原理,研究相关算法,完成超高清视频传输系列IP核的设计.根据该方法搭建了一个4K超高清视频无线传输系统,采用每秒60帧4K分辨率(3840像素×2160像素)的视频进行无线传输实验,结果表明:接收视频图像播放正常,视频压缩率达6.19%,延时低至350 ms,4K超高清视频无线传输效果好.
    • 张铭; 张志刚; 文勇军; 宾峰; 唐立军
    • 摘要: 针对4K超高清视频无线传输中压缩率低,数据存储成本高以及信道抗干扰能力弱等问题,提出基于异构多核的超高清视频无线传输方法.该方法使用ARM+FPGA异构多核架构,将四核Cortex-A53 APU、双核Cortex-R5 RPU及定制FPGA集成.由ARM执行多项任务处理与控制,借助FPGA强大的并行处理能力,实现硬件层次上编解码及通信算法的加速,根据HEVC编解码和COFDM调制解调原理,研究相关算法,完成超高清视频传输系列IP核的设计.根据该方法搭建了一个4K超高清视频无线传输系统,采用每秒60帧4K分辨率(3840像素×2160像素)的视频进行无线传输实验,结果表明:接收视频图像播放正常,视频压缩率达6.19%,延时低至350 ms,4K超高清视频无线传输效果好.
    • 曾敏; 袁松; 石永华; 胡子鑫; 王卓然
    • 摘要: 针对传统焊接集控器中人机交互界面影响焊接任务实时性,而多控制器间通信速率低且不稳定的特点,提出以异构多核控制器为核心的焊接集控器人机交互设计.通过在不同的内核上同时运行Linux和FreeRTOS系统,将主焊接任务与人机交互任务分别运行在不同的内核,两者通过核间通信任务进行数据传输,完成焊接过程控制,实现了实时任务与非实时任务的解耦.试验结果证明,基于异构多核的核间通信速率可达6675.78 kB/s,保证了焊接过程控制的实时性,并可通过人机交互界面实时显示和控制各从机.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号