首页> 外文期刊>Pomiary Automatyka Kontrola >A parallel hardware-oriented algorithm for constant matrix-vector multiplication with reduced multiplicative complexity
【24h】

A parallel hardware-oriented algorithm for constant matrix-vector multiplication with reduced multiplicative complexity

机译:面向并行硬件的恒定矩阵向量乘法算法,可降低乘法复杂度

获取原文
获取原文并翻译 | 示例

摘要

This paper presents the algorithmic aspects of organization of a low-complexity fully parallel processor unit for constant matrix-vector products computing. To reduce the hardware complexity (number of two-operand multipliers), we exploit the Winograd's inner product calculation approach. We show that by using this approach, the computational process of calculating the constant matrix-vector product can be structured so that it eventually requires fewer multipliers than the direct implementation of matrix-vector multiplication.%W pracy został przedstawiony sprzętowo-zorientowany algorytm wyznaczania iloczynu wektora przez macierz stałych. W odróżnieniu od implementacji naiwnego sposobu zrównoleglenia obliczeń wymagającego N~2 układów mnożących proponowana równoległa struktura wymaga tylko N(M+1)/2 takich układów. A ponieważ układ mnożący pochłania znacznie więcej zasobów sprzętowych platformy implementacyjnej niż sumator, to minimalizacja liczby tych układów podczas projektowania dedykowanych układów obliczeniowych jest sprawą nadrzędną. Idea syntezy algorytmu oparta jest na wykorzystaniu do wyznaczania cząstkowych iloczynów skalarnych metody S. Winograda. Zaprezentowany w artykule algorytm może być z powodzeniem zastosowany do akceleracji obliczeń w podsystemach cyfrowego przetwarzania danych zrealizowanych na platformach FPGA oraz zaimplementowany w dowolnym środowisku sprzętowym, na przykład zrealizowana w postaci układu ASIC. W tym ostatnim przypadku niewątpliwym atutem wyróżniającym przedstawione rozwiązanie jest to, że zaprojektowany w ten sposób układ będzie zużywać mniej energii oraz wydzielać mniej ciepła.
机译:本文介绍了用于恒矩阵矢量乘积计算的低复杂度完全并行处理器单元组织的算法方面。为了降低硬件复杂度(二操作数乘法器的数量),我们利用Winograd的内部乘积计算方法。我们证明,通过这种方法,可以构造计算恒定矩阵向量乘积的计算过程,从而最终比直接实现矩阵向量乘积需要更少的乘法器。%本文提出了一种用于确定乘积的面向硬件的算法向量通过固体矩阵。与实现需要N〜2乘数的并行计算的朴素方法的实现不同,所提出的并行结构仅需要此类系统的N(M +1)/ 2。而且由于乘法器系统比加法器消耗更多的实现平台硬件资源,因此在设计专用计算系统时最大程度地减少这些系统的数量是至关重要的。算法综合的思想是基于使用S.Winograd方法确定部分标量积的。本文中介绍的算法可以成功地用于加速在FPGA平台上实现的数字数据处理子系统中的计算,并可以在任何硬件环境中实现,例如以ASIC形式实现。在后一种情况下,与提出的解决方案区分开的毫无疑问的优势在于,以这种方式设计的系统将消耗更少的能量并散发更少的热量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号