...
机译:CPU与GPU:它可以执行基本线性代数子程序更快的性能比较矩阵计算
Harbin Inst Technol Shenzhen Grad Sch Shenzhen Key Lab Internet Informat Collaborat Shenzhen Peoples R China;
Harbin Inst Technol Shenzhen Grad Sch Shenzhen Key Lab Internet Informat Collaborat Shenzhen Peoples R China;
City Univ Hong Kong Dept Elect Engn Kowlloon Tong Hong Kong Peoples R China;
Harbin Inst Technol Shenzhen Grad Sch Shenzhen Key Lab Internet Informat Collaborat Shenzhen Peoples R China;
Matrix computation; Basic linear algebra subprograms; CPU; GPU;
机译:CPU与GPU:它可以执行基本线性代数子程序更快的性能比较矩阵计算
机译:一组批次的基本线性代数子程序和Lapack例程
机译:基本线性代数子程序上的多核Intel Xeon处理器的性能评估
机译:基本线性代数次级编程的多核英特尔Xeon处理器的性能评估
机译:GPU和CPU上有效的viewShed计算算法
机译:BLAMM:基于BLAS的算法用于查找CPU和GPU上DNA序列中的位置权重矩阵
机译:为混合CPU + GPU平台调整基本的线性代数例程