机译:在NUMA架构和多核加速器上的ILUPACK预处理CG解算器中利用任务和数据并行性
Univ Jaume 1, Dept Ingn & Ciencia Comp, Castellon de La Plana, Spain;
Barcelona Supercomp Ctr BSC CNS, Barcelona, Spain|CSIC, Artificial Intelligence Res Inst IIIA, Barcelona, Spain;
Univ Jaume 1, Dept Ingn & Ciencia Comp, Castellon de La Plana, Spain;
TU Braunschweig, Inst Computat Math, Braunschweig, Germany;
Univ Republica, Inst Computac, Montevideo, Uruguay;
Univ Republica, Inst Computac, Montevideo, Uruguay;
Univ Jaume 1, Dept Ingn & Ciencia Comp, Castellon de La Plana, Spain;
Sparse linear systems; Reconditioned Conjugate Gradient solver; Task and data parallelism; Multi-core processors; Intel Xeon Phi; Graphics processing units (GPUs);
机译:嵌入式多核NUMA架构中的应用程序任务和数据放置。
机译:轻量级OpenMP任务在嵌入式多核加速器上释放出细粒度的并行性
机译:在多核GPU上利用任务程序并行化的流程序
机译:在ILUPACK的预处理CG方法中利用带有OmpS的任务并行性
机译:用于多核体系结构的并行感知资源管理技术。
机译:利用多核体系结构利用线程级和指令级并行性对质谱数据进行聚类
机译:在NUMA架构和多核加速器上的ILUPACK预处理CG解算器中利用任务和数据并行性