首页> 中文学位 >处理器条件分支指令处理关键技术研究
【6h】

处理器条件分支指令处理关键技术研究

代理获取

目录

声明

致谢

摘要

1 绪论

1.1 研究背景与意义

1.2 分支指令特征

1.2.1 分支指令的行为属性

1.2.2 条件分支指令对流水线性能的影响

1.3 分支处理技术研究现状

1.3.1 条件分支跳转方向预测技术

1.3.2 条件分支目标指令获取技术

1.3.3 分支目标地址预测技术

1.3.4 返回地址预测技术

1.3.5 间接分支预测技术

1.4 论文的技术路线

1.5 论文的研究基础

1.6 论文的研究内容和组织架构

2 基于预测极性动态变换的分支预测方法研究

2.1 基于分支别名的分支预测技术现状

2.2 分支预测错误高峰期研究

2.2.1 全局分支预测错误的时间局部特性研究

2.2.2 局部分支预测错误的时间局部特性研究

2.2.3 分支预测错误的时间局部性

2.3 基于动态极性变换的分支预测方法

2.3.1 预测错误高峰期的动态监测

2.3.2 预测极性动态变换分支预测的具体实现

2.3.3 监测粒度分类

2.3.4 实验与分析

2.4 本章小结

3 基于多层次过滤的分支预测方法研究

3.1 多路分支预测技术现状

3.2 分支预测错误空间局部性研究

3.2.1 第一层次分支预测错误的空间布局特性研究

3.2.2 第二层次分支预测错误的空间布局特性研究

3.2.3 分支预测错误的空间局部性

3.3 基于多层次过滤的分支预测方法

3.3.1 设计理念

3.3.2 预测器结构

3.3.3 各层次组织架构

3.3.4 动态自适应监测机制

3.3.5 预测算法

3.3.6 过滤式训练机制

3.3.7 实验与分析

3.4 本章小结

4 并行高精度分支预测技术研究

4.1 高带宽取指中的条件分支溢出现象研究

4.2 多条并行分支预测技术现状

4.3 基于多级缓冲的并行分支预测方法

4.3.1 动态分支时间分布行为特点研究

4.3.2 采用历史信息索引的预取机制

4.3.3 基于多级缓冲的并行分支预测架构

4.3.4 多级缓冲控制状态机

4.3.5 实验与分析

4.4 基于预测粒度自适应的并行分支预测方法

4.4.1 程序视角的转变

4.4.2 指令包的封装

4.4.3 历史信息的缓存和维护

4.4.4 基于预测粒度自适应分支预测的具体实现

4.4.5 实验与分析

4.5 本章小结

5 基于解码缓冲器复用及PC越级传输的循环加速方法研究

5.1 现有循环处理技术面临的问题

5.2 程序循环特性研究

5.2.1 循环体长度特征

5.2.2 循环体空间分布对性能的影响

5.2.3 循环衔接对性能的影响

5.3 基于解码缓冲器复用及PC越级传输的循环加速方法研究

5.3.1 PC越级传输技术

5.3.2 基于解码缓冲器复用的循环加速技术

5.3.3 循环处理状态机设计

5.3.4 自循环宽发射技术

5.3.5 实验与分析

5.4 本章小结

6 结与展望

6.1 论文研究工作总结

6.2 今后工作展望

攻读学位期间发表/录用的学术论文

参考文献

展开▼

摘要

随着各种应用对处理器性能的需求不断提高,超标量、超深流水线以及投机执行等技术被应用到处理器设计中以提高指令并行度,而条件分支指令由于具备条件执行及程序流控制的双重特性,对并行度造成负面影响,因此高效的条件分支指令处理是保证上述技术发挥潜能的前提。本文重点研究若干面向性能优化的条件分支处理关键技术,主要研究内容和创新点包括:
  1、基于预测极性动态变换的分支预测方法研究。通过研究分支预测错误的时间局部性,提出一种基于预测极性动态变换的分支预测方法,动态监测未经极性变换的原始分支预测错误率,筛选出预测错误率高于阈值的预测错误高峰期,将高峰期内的预测极性进行变换,使变换后的最终分支预测错误率维持在较低水平,以提高整体分支预测精度。该方法可解决传统基于分支别名的预测方法无法解决的分支抖动等问题。
  2、基于多层次过滤的分支预测方法研究。通过研究分支预测错误的空间局部性,提出一种基于多层次过滤的分支预测方法,将预测空间分为多个层次,动态监测各层分支预测错误率,进而将各层中集中分布的少数错误倾向性分支过滤到下一层中通进行针对性处理,降低各层预测错误率,从而提高整体预测精度。该方法可解决传统多路预测方法中各通路均需处理全部条件分支从而造成资源利用率不高的问题。
  3、基于多级缓冲以及基于预测粒度自适应的并行分支预测方法研究。先提出一种基于多级缓冲的并行分支预测方法,在分支空闲周期内访问预测器,提前预取后续分支预测信息并对其进行缓存,当同时出现多条条件分支时,从缓存的信息中选取对应预测信息分配给各条分支,该方法可在小于等于8的取指带宽下实现高精度并行分支预测。随后进一步提出一种基于预测粒度自适应的并行分支预测方法,根据取指带宽和分支行为,自适应地将若干条件分支封装成指令包,以指令包作为预测粒度,并以指令包为单位维护历史信息,该方法可在任意取指带宽下实现高精度并行分支预测。
  4、基于解码缓冲器复用及PC越级传输的循环加速方法研究。针对循环体特性,提出一种基于解码缓冲器复用及PC越级传输的循环加速方法,通过PC越级传输,使设计多表项解码缓冲器成为可能,进而复用该缓冲器,在循环过程中从缓冲器内向执行单元发送循环体指令,加速循环执行。并通过自循环宽发射技术,解决循环体指令分布、循环衔接、cache位宽限制等影响循环处理性能的问题。
  本文提出的关键技术对提高条件分支指令处理性能具有积极的理论研究意义与实际应用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号