摘要:目前,"存储墙"问题成为了计算机系统性能提升的主要瓶颈.硬件数据预取技术将处理器可能访问的数据提前取到Cache中,使得处理器访存时尽量命中Cache,提升了系统性能.现有研究和应用主要对一级Cache进行预取,预取的数据可能在使用前无法及时装入Cache,影响了硬件预取对系统性能的提升效果.针对这一问题,本文基于现代处理器中Cache层次的结构特点,以流访问特征的预取为基础,提出了一种同时对多级Cache进行预取的方法.基于SPEC CPU2000测试程序集,与仅对一级Cache进行预取相比,对多级Cache同时进行预取可以将整数程序的性能平均提升2.11%,最高提升11.19%;浮点程序的性能平均提升3.08%,最高提升12.77%.