现场可编程门阵列(FPGA)

现场可编程门阵列(FPGA)的相关文献在1995年到2022年内共计652篇,主要集中在无线电电子学、电信技术、自动化技术、计算机技术、电工技术 等领域,其中期刊论文626篇、会议论文5篇、专利文献145380篇;相关期刊268种,包括时间频率学报、重庆邮电大学学报(自然科学版)、电力系统自动化等; 相关会议5种,包括全国第十四届空间及运动体控制技术学术会议、第十四届全国核电子学与核探测技术学术年会、全国抗恶劣环境计算机第十七届学术年会等;现场可编程门阵列(FPGA)的相关文献由1640位作者贡献,包括柴志雷、张强、张涛等。

现场可编程门阵列(FPGA)—发文量

期刊论文>

论文:626 占比:0.43%

会议论文>

论文:5 占比:0.00%

专利文献>

论文:145380 占比:99.57%

总计:146011篇

现场可编程门阵列(FPGA)—发文趋势图

现场可编程门阵列(FPGA)

-研究学者

  • 柴志雷
  • 张强
  • 张涛
  • 刘琨
  • 杨军
  • 杨海钢
  • 华宇
  • 吴国光
  • 吴淼
  • 周有庆
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 郭俊; 虞致国; 洪广伟; 顾晓峰
    • 摘要: 为简化嵌入式开发人员更新RISC-V处理器固件的操作流程,提出了一种易操作、高效且稳定的固件更新系统设计方法,包括BootROM引导流程设计和在应用中编程(in-application programming,IAP)设计。在BootROM引导流程设计中,通过启动参数再配置的方法,可使此引导流程兼容多种启动模式,如SRAM启动、主内存启动。在IAP设计中,处理器先通过通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接收从上位机发送过来的新固件,该固件采用Ymodem协议发送,再通过串行外设接口(serial peripheral interface,SPI)进行片外Flash的重新烧写,以完成对系统固件的更新,同时,为保证接收新固件的可靠性,加入了循环冗余校验(cyclic redundancy check,CRC)算法。在现场可编程门阵列(field programmable gate array,FPGA)上对该系统进行了多次测试,均完成了对系统固件的更新,验证了该设计的可行性与稳定性。
    • 苑福利; 宫磊; 娄文启; 陈香兰
    • 摘要: 近年来,随着可重构计算方法和可重构硬件特性的不断演进,基于FPGA动态部分重构技术构建运行时可重构加速器已经成为解决传统加速器设计中硬件资源限制问题的重要途径。然而,区别于传统静态重构加速器,FPGA的动态重构开销是影响硬件加速整体性能的重要因素,而目前尚缺少能够在可重构硬件设计的早期阶段进行动态重构开销精确估算的相关方法。为此,通过对主流FPGA的比特流配置文件进行剖析,提出了一种基于可重构功能模块消耗的资源估算相应部分重构比特流文件大小的方法,并在此基础上构建了运行时重构的性能开销模型。作为验证,在Xilinx VC709 FPGA平台对神经网络计算方法如Winograd算法、FFT算法、GEMM算法和加密算法如AES、DES等进行了动态重构模式下的硬件部署。实验结果表明,所提出的性能开销模型可以对不同算法的动态重构开销进行快速评估,并达到了平均98%的准确率,能够便捷地应用于动态重构加速器设计中。
    • 严飞; 马可; 刘佳; 刘银萍; 夏金锋
    • 摘要: 随着无人机(unmanned aerial vehicle,UAV)在航拍、空中侦察等相关领域被广泛应用,对于无人机的智能化需求逐渐提高。目标跟踪具有信息量大、实时性高等优点,能够为无人机的智能飞行提供大量且实时的外部信息。进行低开销、低功耗的无人机目标跟踪系统的研究,对无人机智能化进程的加速具有深远意义。为更好解决跟踪过程中出现的对背景复杂、光照变化、目标较小、移动速度快等情景的目标跟踪准确度和实时性等问题,提出一种基于FPGA的自适应跟踪算法。将视频RGB数据流进行灰度转换;将模板数据和搜索区域的像素灰度值保存于片内RAM,搜索区域内遍历寻找与模板相似度最高的区域;当背景或光线发生变化,采用更新模板的方式,进一步提高跟踪准确度。仿真结果显示所提跟踪算法具有较好的实时性,跟踪重叠率在95%以上,跟踪速率在50 frame/s以上,有较好的跟踪准确度和实时性。
    • 郭子博; 高瑛珂; 胡航天; 弓铎; 刘凯; 吴宪云
    • 摘要: 具有优越性能的卷积神经网络算法已得到广泛应用,但其参数量大、计算复杂、层间独立性高等特点也使其难以高效地部署在较低功耗和较少资源的边缘场景。为此结合该种算法的特点提出了一种基于混合架构的卷积神经网络计算加速方法,该方法选用CPU加FPGA的混合架构,对网络模型进行了压缩优化;在FPGA上通过指令控制数据流的DSP阵列结构实现了卷积计算加速;通过YOLO算法测试了该方法的加速性能,在7 000万门级FPGA上各类资源消耗低于50%且总功耗为7.36 W的情况下,吞吐率达到了120 GOPS。
    • 吴宇航; 何军
    • 摘要: 为实现边缘端人体行为识别需满足低功耗、低延时的目标,本文设计了一种以卷积神经网络(CNN)为基础、基于可穿戴传感器的快速识别系统.首先通过传感器采集数据,制作人体行为识别数据集,在PC端预训练基于CNN的行为识别模型,在测试集达到93.61%的准确率.然后,通过数据定点化、卷积核复用、并行处理数据和流水线等方法实现硬件加速.最后在FPGA上部署识别模型,并将采集到的传感器数据输入到系统中,实现边缘端的人体行为识别.整个系统基于Ultra96-V2进行软硬件联合开发,实验结果表明,输入时钟为200 M的情况下,系统在FPGA上运行准确率达到91.80%的同时,识别速度高于CPU,功耗仅为CPU的1/10,能耗比相对于GPU提升了91%,达到了低功耗、低延时的设计要求.
    • 吴健; 顾明剑; 曾长紊; 邵春沅; 范余茂
    • 摘要: 针对卷积神经网络在嵌入式系统需要耗费大量计算资源、计算复杂度高等问题,提出一种基于ZYNQ系列FPGA的加速方法。通过HLS工具对卷积神经网络加速器进行设计,提出相邻层位宽合并和权重参数重排序的策略实现数据传输的优化,利用卷积分解、并行展开充分发挥FPGA并行计算的优势。为验证卷积神经网络加速器的加速效果,将YOLO目标检测模型进行部署。实验结果表明,在PYNQ-Z2上达到了39.39 GOP/s的计算性能,是intel i5-2400 CPU的3.4倍,是ARM-Cortex A9 CPU的147.5倍。在相同FPGA平台上与之前的工作相较也有更高的性能。
    • 吴静瑜; 肖顺文; 雷小英; 郑瑞; 陈韵文
    • 摘要: 针对参数固定的移位寄存器在使用上不足的问题,文章设计了基于FPGA的参数可调的多功能移位寄存器,实现了多参数多种移位方式的移位功能。电路主要包括多路选择器模块和移位功能模块等。经仿真测试表明,该设计达到了参数可调多功能移位寄存器的要求。
    • 张志超; 王剑; 章隆兵; 肖俊华
    • 摘要: 针对星载等功耗受限平台下遥感影像目标检测存在的高准确率、低功耗以及高吞吐量等要求,本文提出了一种面向目标检测的现场可编程门阵列(FPGA)卷积神经网络(CNN)优化方法。采用数据流调度技术以及基于乘法矩阵与前向加法链的卷积计算阵列设计对浮点卷积神经网络模型进行加速。利用该方法在FPGA开发板上实现了浮点卷积目标检测网络,在应用中达到了与原模型一致的准确率,平均准确率为97.59%,吞吐量达到了Titan X的22倍。与同类的FPGA加速浮点卷积方法对比,该方法的吞吐量以及能效比达到了最优。实验数据表明,该方案突破了浮点卷积加速的线速吞吐难点,解决了应用中存在的功耗、准确率以及吞吐量三者制衡的问题。
    • 陈朋; 何建彬; 陈诺; 俞天纬; 宦若虹
    • 摘要: 针对实时目标检测网络在图形处理器(GPU)加速器上实时性低、功耗高和成本高等问题,本文提出了一种结合通道注意力机制与深度可分离卷积的神经网络模型(At DS-SSD),并将该网络在现场可编程门阵列(FPGA)上进行优化与部署。At DS-SSD网络在SSD模型基础上,将VGG 16特征提取网络部分替换成以深度可分离卷积为主体的MobileNet网络,并加入通道注意力模块。本文采用8位的定点量化方法,对网络模型参数进行量化。最后,本文将量化后的At DS-SSD网络模型在ZCU 102平台上进行部署,并采用PASCAL VOC数据集进行测试。在平均精度均值只损失0.58%的情况下,加速器性能从85 fps提升到311.7 fps,测试功耗相当于NVIDIA RTX 2080Ti的11%。实验数据表明,基于FPGA平台结合注意力机制和深度可分离卷积的网络模型,可以提升计算实时性并降低功耗,减少网络复杂度降低导致的精度损失,从而验证了本文方法的有效性。
    • 陈标发; 陈传东; 魏榕山; 罗海波
    • 摘要: 在我国电力系统中,配电站属于电力网络边缘节点,是电力系统中的重要环节。然而,人工巡检或一些传统硬件设备的数据采集手段,由于成本及效率等问题,已经无法匹配当下的安防巡检需求。针对此问题,本文提出一种基于现场可编程门阵列(FPGA)的智能配电站安防巡检解决方案。首先利用YOLOv4-tiny网络实现安全帽佩戴检测、工作服着装检测、越界预警识别等功能,其准确率可达93.5%;其次针对配电站的应用场景,本文利用FPGA在边缘设备上实现实时检测的效果,并从并行展开及流水线等方面进行加速优化。实验结果表明,该系统可在ZCU102平台上实现每秒传输帧数为68的检测速度,整体平均性能达到228十亿次运算/秒。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号