首页> 中文学位 >片上多处理器体系结构中Cache一致性模型研究
【6h】

片上多处理器体系结构中Cache一致性模型研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景

1.1.1 片上多核处理器体系结构

1.1.2 片上多核处理器体系结构面临的挑战

1.1.3 片上存储模型

1.2 高速缓存一致性模型

1.2.1 概念

1.2.2 实现

1.2.3 片上网络

1.3 片上高速缓存一致性模型的研究意义

1.4 高速缓存一致性模型技术研究的几个关键问题

1.4.1 功能扩展模型

1.4.2 性能及扩展性优化模型

1.4.3 小结

1.5 论文研究目标和主要工作

1.6 论文结构

第2章 相关研究工作

2.1 基本的高速缓存一致性模型

2.1.1 一致性状态及消息

2.1.2 基于侦听形式的高速缓存一致性协议

2.1.3 基于目录结构的高速缓存一致性协议

2.1.4 基于Token的高速缓存一致性协议

2.2 功能扩展模型

2.2.1 FlexTM

2.2.2 FasTM

2.2.3 TLS模型

2.3 面向性能的优化模型

2.3.1 基于协议行为的性能优化模型

2.3.2 基于预测机制的性能优化模型

2.3.3 基于通信模式的性能优化模型

2.4 面向扩展性的优化模型

2.5 小结

第3章 基于TM及TLS机制的高速缓存一致性模型

3.1 引言

3.1.1 硬件模型的提出

3.1.2 性能影响因素分析

3.1.3 小结

3.2 TT-Dir模型架构

3.2.1 推测状态管理

3.2.2 冲突检测

3.2.3 快速回退机制

3.2.4 定序机制

3.3 冲突容忍机制

3.3.1 一致性协议行为

3.3.2 冲突容忍表更新

3.3.3 多个数据拥有者

3.3.4 提交与回退

3.3.5 缓存溢出

3.3.6 事务动态定序机制

3.4 TT-Dir模型评测

3.4.1 评测方法

3.4.2 基准测试程序

3.4.3 推测多线程机制评测分析

3.4.4 事务存储机制评测分析

3.4.5 硬件评测

3.5 相关工作对比讨论

3.6 小结

第4章 一种带有阶段优先级支持的目录缓存一致性模型

4.1 引言

4.2 相关背景

4.2.1 高速缓存一致性协议

4.2.2 片上网络

4.3 PPB缓存一致性协议模型

4.3.1 缓存一致性协议分析

4.3.2 PPB高速缓存一致性模型的实现

4.3.3 片上网络中优先级支持机制

4.4 模型评测

4.4.1 评测方法及测试程序集

4.4.2 评测结果

4.5 相关工作对比讨论

4.6 小结

第5章 基于本地目录结构的高速缓存一致性模型

5.1 引言

5.1.1 目录结构

5.1.2 性能优化

5.1.3 小结

5.2 Loc-Dir模型架构

5.3 Loc-Dir模型中目录机制的实现

5.3.1 目录结构

5.3.2 目录管理机制

5.3.3 一致性协议行为及操作

5.4 Loc-Dir模型中性能优化操作

5.4.1 预测机制

5.4.2 缓存替换策略

5.4.3 通信模式优化

5.5 模型评测

5.5.1 评测方法及测试程序集

5.5.2 评测结果及分析

5.6 相关工作对比讨论

5.7 小结

第6章 全文总结

6.1 研究工作和成果

6.2 主要创新

6.3 进一步的工作

参考文献

致谢

在读期间发表的学术论文

在读期间参与的科研项目

展开▼

摘要

现代的片上多处理器大都采用共享存储结构,每个处理器核都拥有自己的私有缓存,这就需要高速缓存一致性模型来管理共享数据。早期的缓存一致性模型多用于板级多处理器系统中,对于片上多处理器结构而言,实现缓存一致性模型的技术参数及约束条件都发生了变化,从而带来了许多新的研究问题。由其是通过扩展高速缓存一致性模型实现硬件事务存储和推测多线程机制,为大幅度降低共享存储并行编程的复杂性带来了新的机遇。因此,围绕着高速缓存一致性模型的功能扩展、性能优化以及提高可扩展性等方面的工作仍然是工业界和学术界共同关注的热点研究问题。
   本文主要从高速缓存一致性模型的功能扩展和性能优化两个方面开展研究工作,通过发掘高速缓存一致性模型在功能及性能两方面的潜在优势,来达到对多核处理器芯片上晶体管资源的充分利用,并在保证片上多处理器模型扩展性的基础上,提升整个系统的性能,以适应未来多核及众核体系结构对高速缓存一致性模型的需要。本文研究工作的主要内容和成果如下。
   本文工作的第一部分是研究高速缓存一致性协议功能扩展模型。通过扩展高速缓存一致性协议的功能,实现对硬件事务存储机制及推测多线程机制混合模型的高效支持。硬件事务存储机制及推测多线程机制都可以采用高速缓存一致性模型的功能扩展来实现,且二者对硬件的需求类似,因此可以提供对二者的统一硬件支持。但是针对单个芯片中有限的硬件资源及功耗的限制,及应用程序对自身性能日益增长的需求,如何能实现一个高效的功能扩展模型,仍是一个重要的问题。针对此问题,本文在事务存储及推测多线程两种机制的统一高效硬件支持方面展开了深入的研究,其主要研究成果包括:
   (1)提出了一个新的基于高速缓存一致性模型的功能扩展模型TT-Dir,此扩展模型可以同时支持事务存储及推测多线程两种机制;
   (2)为TT-Dir模型引入了快速回退机制,在保证原始事务及推测线程提交速度的前提下,实现了对粒度较小的事务及推测线程的快速回退;
   (3)为TT-Dir模型引入了冲突容忍机制,实现了对并发推测线程之间写后读及写后写型二义性冲突的容忍,减少了并发推测线程间的冲突数量;并针对事务存储模型引入了动态定序机制,使上述冲突容忍机制也能适用于事务存储模型中。对模型的评测结果表明,TT-Dir模型可以在满足较小硬件需求及功耗的基础上,有效提升上述两种机制自身的性能。
   本文工作的第二部分是研究高速缓存一致性协议优化模型,包括性能优化和可扩展性优化两个方面。现代应用程序对性能及吞吐率的需求越来越高,因此需要片上高速缓存一致性模型不断提升其性能,以满足上层应用的需求;且随着片上处理器核数越来越多,片上高速缓存一致性模型需要提供良好的扩展性,以满足未来多核及众核体系结构发展的需要;此外,单个芯片上有限的硬件资源及功耗约束又为高速缓存一致性模型的扩展性引入了新的难点。为了对高速缓存一致性模型的性能及扩展性影响因素进行详细的分析,本文首先将高速缓存一致性模型的实现分为网络层及行为层两个方面,并从这两个方面分别进行了深入研究,主要研究成果包括:
   (1)在网络层方面,本文首先对片上网络中影响高速缓存一致性模型性能的因素进行了分析,根据分析结果提出了基于阶段优先级的一致性模型PPB,PPB模型引入了“阶段性”消息的概念,使不同阶段的消息具有不同的优先级;随后本文还给出了此PPB模型的具体实现机制,这其中包括一致性消息优先级的设置及相应片上网络中的仲裁机制;
   (2)在行为层方面,本文针对目录一致性模型的性能及硬件需求两个方面进行了优化,提出了一个基于本地目录机制的高速缓存一致性模型Loc-Dir。首先,此Loc-Dir模型采用了本地目录模型来降低一致性模型实现的硬件需求,即保证了一致性模型的扩展性;其次Loc-Dir模型引入了预测机制来降低目录一致性模型中的间接数据传输延迟,在预测器的实现中,本文提出了基于通信模式的预测器来扩展可预测地址的范围;最后,本文还提出了针对应用程序中通信模式的优化策略,并提出了对本地私有缓存的替换策略的修改方案,以使其适应上述Loc-Dir的预测机制。
   本文的研究工作获得了如下一些重要的认识:
   (1)片上高速缓存一致性模型可以高效地应用于并行编程模型,以简化并行编程模型对共享数据的管理;
   (2)片上网络与高速缓存一致性模型之间相互依赖且相互制约,一致性模型产生的一致性消息直接影响了片上网络的负载量,而一致性消息在片上网络中的传输也影响了一致性模型自身的性能,所以,建立起一致性模型与片上网络的接口,以实现对二者的协同管理,是提升整个系统性能的关键;
   (3)对于目录一致性模型来讲,多级目录机制是降低目录开销的重要策略;而针对应用程序中的数据共享模式或者通信模式进行优化,也是目录一致性模型获得性能提升的一个重要方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号