The Ohio State University;
The Ohio State University;
The Ohio State University;
Carnegie Mellon University;
Louisiana State University;
The Ohio State University;
机译:叠加Numa架构上模板计算的多级平行优化
机译:优化短向量Simd架构的矩阵乘法-单元处理器
机译:SIMD架构上的数据交织和数据到内存映射的集成探索方法
机译:适用于短向量语法架构的模板编译器
机译:现代SIMD架构上的模板计算性能优化。
机译:耦合SIMD和SIMT体系结构以提高系统发育感知比对内核的性能
机译:短向量SIMD架构上模板计算的数据布局转换