首页> 中文期刊>中国科学技术大学学报 >基于龙芯2F体系结构的BLAS库优化

基于龙芯2F体系结构的BLAS库优化

     

摘要

在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测试表明,高性能BLAS在750 MHz的龙芯2F处理器(双精度浮点峰值3 Gflops)上HPL实测峰值达到1.47 GHz,比原始BLAS提高了6倍以上,比ATLAS提高了45%.

著录项

  • 来源
    《中国科学技术大学学报》|2008年第7期|854-859|共6页
  • 作者单位

    中国科学技术大学计算机系,安徽合肥,230027;

    安徽省计算与通信软件重点实验室,安徽合肥,230027;

    国家高性能计算中心(合肥),安徽合肥,230026;

    中国科学技术大学计算机系,安徽合肥,230027;

    安徽省计算与通信软件重点实验室,安徽合肥,230027;

    中国科学技术大学计算机系,安徽合肥,230027;

    国家高性能计算中心(合肥),安徽合肥,230026;

    中国科学技术大学计算机系,安徽合肥,230027;

    国家高性能计算中心(合肥),安徽合肥,230026;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 算法理论;
  • 关键词

    BLAS; 龙芯2F; KD-50-I; 数据预取; 指令调度;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号