摘要:近年来,海量数据挖掘、XML解析、生物信息处理、内存数据库优化等领域的非规则数据密集应用日益增多.这些应用线程中多链表、非直接数组、多过程调用、多控制流路径等访问模式都困扰着人们对片上多核处理器的有效使用,大量循环的非规则数据存在于这些模式之中,它们的访存请求可以轻松穿过由乱序、提前执行、多级缓存、基于硬件的规则数据预取器等构成的访存延迟隐藏技术体系.目前基于多核共享缓存的帮助线程顸取技术是应对该问题的重要性能优化技术之一,然而,对多核环境下帮助线程来说,使用不同的预取控制策略,预取效果具有差异性;对不同多核环境下的同一应用,使用同样的预取控制策略,预取效果也不尽相同.为此,采用流计算基本原理,提出了面向预取质量的海量数据获取、基于流计算的性能分析及预取获益评价等方法,它们可广泛用于优化和改进帮助线程预取控制策略的参数阈值,从而为实现高质量的帮助线程预取控制提供方法支撑.