NEC Labs. America, Princeton, NJ, USA;
coprocessors; edge detection; neural nets; parallel programming; program compilers; scheduling; CPU; CUDA; GeForce 8800 graphics card; NVIDIA; Tesla C870 GPU computing card; code generator; computing industry; convolutional neural networks; domain-specific templates; edge detection kernels; forward scalability; graphics processing unit programming; image analysis; lower-level frameworks; many-core computing; multi-core computing; of-fload unit identification; off-loaded computation scheduling; parallel operator graphs;
机译:Juggler:GPU的基于依赖的任务的执行框架
机译:Panda:在GPU加速的超级计算机上同时执行3D模具计算的CPU + GPU执行的编译器框架
机译:图挥舞架构:高效执行GPU上的图形应用程序
机译:在GUS上有效和可扩展的域特定模板执行的框架
机译:使用GPU在异构系统上高效执行数据并行应用程序的时间能量
机译:具有多核CPUGPU和MIC的系统上的应用程序性能分析和高效执行:以显微镜图像分析为例
机译:优化CCSD(T)中的张量凹陷,以便在GPU上进行高效执行