Division of Mathematical and Computer Sciences and Engineering Thuwal Saudi Arabia;
Supercomputing Laboratory King Abdullah University of Science and Technology Thuwal Saudi Arabia;
Matrix-Vector Multiplication; GPU Optimizations; Memory-Bound Operations; Hessenberg Reduction; Bidiagonal Reduction;
机译:GPU上有限元数值集成的最佳核心设计
机译:使用内核表征标准为NVIDIA GPU优化APSP实施
机译:使用CUDA在nVIDIA GPU上D3Q19晶格Boltzmann内核的性能分析和优化策略
机译:优化GPU数值内存内核的系统方法
机译:在多核处理器和GPU上实现和优化大数据科学内核
机译:基于GPU的动力学隔室建模的新型数值优化方法估计功能参数的准确性和性能
机译:在GPU硬件加速器上优化内存绑定SYMV内核
机译:采用与sobolev梯度法相关的新功能优化方法对GpU上常微分方程的时间并行解。