声明
摘要
第1章 绪论
1.1 研究背景
1.1.1 众核流处理器是半导体工艺发展的必然产物
1.1.2 计算核粒度固定的局限性
1.2 可重构众核流处理器设计的关键技术问题
1.2.1 对应用中资源需求变化的响应能力
1.2.2 对流式应用的描述与映射
1.2.3 针对流应用特点的存储系统
1.3 论文研究目标和主要工作
1.4 论文结构
第2章 相关研究工作
2.1 面向计算密集型应用的流体系结构
2.1.1 流处理器Imagine及其衍生
2.1.2 分片式流处理器TPA—PD
2.1.3 CELL处理器
2.1.4 RAW和Tile64
2.1.5 NVIDIA GPU及CUDA编程模型
2.2 处理器片上可重构技术
2.2.1 Voltron
2.2.2 CoreFusion
2.2.3 TFlex
2.2.4 Forwardflow
2.3 可重构众核流处理器设计趋势总结
第3章 可重构众核流处理器的程序执行模型
3.1 流处理框架
3.1.1 流处理的基本思想
3.1.2 流体系结构模型
3.1.3 应用程序的流化:以块分组加密算法为例
3.2 流编程模型的选择
3.2.1 层次化的线程组织
3.2.2 层次化的存储模型
3.3 众核流处理器的重构模式
3.3.1 可重构众核流处理器的硬件基础
3.3.2 可重构众核流处理器的性能评价
3.4 流编程模型的映射方案
3.5 类数据流驱动的执行模型与指令集架构
3.5.1 基于超块结构的类数据流执行模型
3.5.2 类数据流驱动的指令集设计
3.6 编译支持
3.7 小结
第4章 TPA-S:一种可重构众核流处理器体系结构
4.1 引言
4.2 物理核微结构设计
4.2.1 计算单元
4.2.2 超块级激进执行部件
4.2.3 片上多级存储层次
4.2.4 计算核流水线设计
4.3 片上操作数网络
4.3.1 互连拓扑
4.3.2 路由节点设计
4.3.3 路由节点的流水线与时序设计
4.4 逻辑处理器重构机制
4.4.1 逻辑处理器构造与超块结构映射
4.4.2 分布式的执行控制
4.4.3 存储资源的重配置
4.4.4 逻辑处理器重构决策机制
4.5 小结
第5章 可重构众核流处理器性能评测
5.1 实验平台搭建
5.1.1 编译工具链与软硬件划分
5.1.2 TPA-S软件模拟器设计
5.1.3 Benchmark选取
5.2 TPA-S处理器性能评测
5.2.1 总体性能评价
5.2.2 物理核设计空间探索
5.2.3 存储层次设计空间探索
5.2.4 片上网络对程序执行性能的影响
5.2.5 逻辑处理器可重构性能分析
5.3 小结
第6章 可重构众核流处理器的片上二级缓存
6.1 引言
6.2 均匀一致的片上二级缓存设计
6.2.1 均匀一致的片上二级缓存硬件结构设计
6.2.2 均匀一致的片上二级缓存性能评估
6.3 静态非均匀一致的片上二级缓存设计
6.3.1 静态非均匀一致的片上二级缓存硬件结构设计
6.3.2 物理地址映射方式
6.3.3 片上互连结构
6.3.4 Cache事务的处理
6.3.5 静态非均匀一致的片上二级缓存性能评估
6.4 Mesh-SNUCA架构片上二级缓存的重构
6.5 小结
第7章 全文总结
7.1 研究工作和成果
7.2 主要创新
7.3 进一步的工作
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
在读期间参与的科研项目
中国科学技术大学;