面向大规模查询处理的GPU缓存框架设计

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着搜索引擎面临越来越大的性能压力，使用现代图形处理器(Graphic Processing Units)进行搜索引擎查询处理加速被证明是一个有效提高搜索引擎效率的途径。GPU的众核架构十分有利于加速查询处理算法。但是，由于搜索引擎需要处理的数据量日益增长，GPU有限的显存空间限制了它在这个领域的应用。在本文中，我们提出一种面向大规模查询处理的GPU缓存框架。该框架使得在GPU上处理远大于显存空间的倒排索引成为可能。另一方面，我们注意到，在查询处理中应用提前停止算法（early termination）后，大部分倒排链表只被部分地访问到。基于此，我们提出了一种基于倒排链表剪枝的GPU静态缓存算法。该算法只缓存倒排链表中被频繁访问到的部分，使得显存中能够容纳更多的链表。
　　为了提高在剪枝索引上的查询效率，我们在 GPU上实现了数据并行的查询处理算法，包括链表求交、top-k排序和提前停止算法等多个步骤。对比于CPU查询处理算法，GPU算法达到11倍的加速比。此外，为了保证在剪枝索引上进行的查询处理的结果是正确、完整的，我们提出了一种GPU-CPU协同查询处理的方案。
　　作为一种静态缓存策略，我们提出的缓存算法需要将一部分的显存预留作为存储缓存失效数据的临时存储空间（缓冲区空间）。实验表明，缓存空间和缓冲区空间的大小比例对于查询处理的性能至关重要。因此，我们从理论上讨论并分析了显存空间的划分问题并提出了两种寻找最优划分经验值的方法。
　　实验表明，我们提出的 GPU查询处理缓存框架和缓存算法能够有效减少GPU和CPU之间的数据传输量，进而显著提高系统吞吐率。

著录项

作者
余文清;
展开▼
作者单位

南开大学;

展开▼
授予单位南开大学;
学科计算机软件理论
授予学位硕士
导师姓名王刚;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类检索机;内存贮器（主存贮器）总论;
关键词
搜索引擎; 查询处理; 倒排索引; GPU缓存框架;

相似文献

中文文献
外文文献
专利

1. CPU-GPU异构环境下的大规模商品知识查询处理 [J] . 方创新 ,宋浩 ,林煜明 . 华东师范大学学报（自然科学版） . 2021,第005期
2. 面向大规模RTM处理的CPU/GPU集群架构 [J] . . 江苏科技信息 . 2013,第009期
3. 一种面向现代GPU的大规模地形渲染技术 [J] . 石雄 ,朱毅 . 成都信息工程学院学报 . 2009,第003期
4. 一种面向大规模数据密集计算的缓存方法 [J] . 周恩强 ,张伟 ,卢宇彤 . 计算机研究与发展 . 2015,第007期
5. 面向大规模分布式系统的多级缓存信息结构研究 [J] . 陈建英 ,杨宪泽 ,张楠 . 西南民族大学学报（自然科学版） . 2012,第003期
6. MANET中基于缓存的移动数据查询处理算法的研究 [C] . 张艳卿 ,李金宝 ,郭龙江 . 第28届中国数据库学术会议 . 2011
7. 面向大规模RDF知识图谱的分布式正则路径查询处理研究 [A] . 辛月祺 . 2018

面向大规模查询处理的GPU缓存框架设计

目录

摘要

著录项

相似文献

相关主题

期刊订阅