首页> 中文会议>2015全国高性能计算学术年会 >面向MIC的模板计算向量化研究

面向MIC的模板计算向量化研究

摘要

随着更宽向量、更高精度、更多指令数及更强大功能的SIMD操作在高性能处理器领域的快速发展,高性能计算程序的向量化已成为提升应用性能的重要手段之一.在模板计算的向量化研究中,编译器的自动向量化能力直接影响其向量化效果.虽然ICC编译器已经支持使用OpenMP4.0提供的simd编译指导命令直接指导循环强制向量化,但在以MIC为平台的研究中发现,编译器在插入向量存取操作时始终使用数据非对齐存取指令,这必然会影响访存密集型模板计算的向量化性能,所以本文选择了使用Intrinsic函数手动向量化,结果使性能提升了9.1%.此外,提出了Loop Peeling的数据对齐方法,优化了数据布局;并且改进了Loop Tiling的循环分块策略,优化了数据访问.从而减少了数据流进流出向量指令的开销,使手动向量化代码分别获得了31.2%和60.1%的性能提升.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号