auto-tuning; linear algebra; nested parallelism;
机译:自动调整嵌套并行性:一种减少NUMA系统中科学软件执行时间的方法
机译:支持轻量级嵌套并行性,可在嵌入式多核应用程序中控制NUMA效果
机译:叠加Numa架构上模板计算的多级平行优化
机译:通过自动调谐嵌套并行性提高NUMA平台上的线性代数计算
机译:NUMA页面迁移/页面复制ASIC {lcub} NPMR {rcub}:一种芯片设计,用于在非统一内存访问(NUMA)多处理器系统体系结构中提高内存系统性能。
机译:QuBiLS-MAS开源多平台软件用于基于原子和键的拓扑(2D)和手性(2.5D)代数分子描述符计算
机译:符号线性系统的代数计算中的并行性和并行算法(软件科学与工程中的数学方法:第三次会议)