...
首页> 外文期刊>Concurrency and computation: practice and experience >High-performance SIMD modular arithmetic for polynomial evaluation
【24h】

High-performance SIMD modular arithmetic for polynomial evaluation

机译:高性能SIMD模块化算法用于多项式评估

获取原文
获取原文并翻译 | 示例
           

摘要

Two essential problems in computer algebra, namely polynomial factorization and polynomial greatest common divisor computation, can be efficiently solved thanks to multiple polynomial evaluations in two variables using modular arithmetic. In this article, we focus on the efficient computation of such polynomial evaluations on one single CPU core. We first show how to leverage SIMD (single instruction, multiple data) computing for modular arithmetic on AVX2 and AVX-512 units, using both intrinsics and OpenMP compiler directives. Then we manage to increase the operational intensity and to exploit instruction-level parallelism in order to increase the compute efficiency of these polynomial evaluations. All this results in the end to performance gains up to about 5x on AVX2 and 10x on AVX-512.
机译:计算机代数中的两个基本问题,即多项式分解和多项式最大的常见除数计算,可以通过使用模块化算术的两个变量中的多个多项式评估有效地解决。 在本文中,我们专注于在一个CPU核心上的这种多项式评估的有效计算。 我们首先使用内在的内部和OpenMP编译器指令展示如何利用SIMD(单指令,多个数据)计算AVX2和AVX-512单元上的模块化算法。 然后,我们设法增加操作强度并利用指令级并行性,以提高这些多项式评估的计算效率。 所有这些都导致AVX2和AVX-512上的AVX2和10x上的性能增益最高约5倍。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号