CUDA; Fermi; OpenCL; life science algorithms; optimizations; performance evaluation;
机译:针对3D超声计算机断层扫描中的算法评估40和28 nm世代中FPGA和GPU的性能和架构效率
机译:GPU上固定和可变大小的批处理Cholesky分解的性能调整和优化技术
机译:一种在GPU上优化稀疏矩阵矢量乘法的体系结构感知技术
机译:新型GPU架构的两种生命科学算法的优化技术和性能分析
机译:用于将算法和应用程序映射到CUDA GPU平台和CPU-GPU异构平台的优化技术。
机译:RGCA:基于有效性能-能源优化的可靠的GPU集群架构用于大规模物联网计算
机译:基于图可达性算法的源代码分析性能优化技术的大规模研究结果