机译:具有加权正则化的交替最小二乘算法的并行化在记录系统中的高效GpU执行
机译:GPU上大型推荐系统的高效歧管正则稀疏非负矩阵分解模型
机译:用于GPU执行的高阶图匹配算法的有效并行化
机译:数据并行算法框架的同时CPU-GPU执行
机译:为GPU设计高效的并行前缀和算法
机译:使用GPU在异构系统上高效执行数据并行应用程序的时间能量
机译:具有多核CPUGPU和MIC的系统上的应用程序性能分析和高效执行:以显微镜图像分析为例
机译:具有GPU的异构系统上数据并行应用程序的高效时间能源执行