封面
声明
目录
中文摘要
英文摘要
1绪论
1.1 研究背景和意义
1.2 源到源并行化技术研究现状
1.3 本文的主要工作
1.4 本文的组织结构
2 CUDA通用并行计算模型
2.1 CUDA基础
2.2 硬件映射
2.3 软件体系
2.4存储器层次结构
2.5 小结
3 STS-CUDA并行化架构设计
3.1 STS-CUDA的核心架构
3.2 STS-CUDA的编译过程
3.3 STS-CUDA并行转化的要点
3.4 小结
4 实现并行转化的关键技术
4.1 计算模型的并行转化
4.2 数据模型的并行转化
4.3 源到源并行化的转化策略
4.4 小结
5目标代码的优化
5.1 STS-CUDA中用到的优化方法
5.2 CUDA中实现进一步优化的方法
5.3 小结
6实验测试和分析
6.1 实验平台的搭建
6.2 第一种矩阵乘法并行化方案
6.3 第二种矩阵乘法并行化方案
6.4 STS-CUDA源到源并行化BP算法方案
6.5 小结
7 总结与展望
7.1全文总结
7.2研究展望
参考文献
攻读硕士期间学术成果
致谢