摘要:在大数据和云计算的时代背景下,数据中心的计算密集度越来越高,需要处理的数据量与日俱增,要求数据中心有很强的计算能力的同时功耗开销尽可能低,因此一些具有高灵活性和容错能力的软件编程架构在服务器集群被部署,它们具有很好的扩展性和很高的计算效率.然而在数据中心的服务器中部署硬件加速器能够进一步提升数据分析和处理的性能.在本文中,提出了一种基于FPGA的硬件加速平台,用来处理大规模的矩阵运算.这种架构由多块Xilinx Virtex-6FPGA评估板(EVBs)组成,计算服务器与EVBs通过PCIE接口连接,EVBs之间通过14GB/s光纤接口通信.此外,利用FPGA的可编程性和高灵活性,在每个EVBs中设计了相同的offload引擎模块,分别实现对不同数据报文的预处理.针对本文不同规模的矩阵向量乘分块计算,通过仿真实验验证了该加速平台模型设计的正确性,对比CPU和GPU的计算性能,本文设计的加速平台获得较好的性能增益,且该设计具有良好的并行效率和加速比.此外,对于不同维数的矩阵向量乘法进行了实验,其结果也证实该设计达到了较高的计算性能.