混合多CPU和GPGPU解析大型XML文档的算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

XML是一种半结构化的语言，XML文档被越来越多地应用在数据传播和存储领域，比如在线数据，日志文件，配置文件，基于内容的数据库以及企业文档。通常处理XML文件时，会顺序扫描整个文件来分析文档的元素和结构。但是当XML文件变得非常大的时候，这种方法将有很大的效率问题，因为从头到尾地分析整个文档将会消耗大量的时间，传统的XML文件处理将会变成灾难。为了解决解析XML的问题，许多基于CPU线程的并行算法已经被提出来，但是仍然没有使用 GPGPU来解析XML的方法出现。
　　在这篇文章中，为了解决处理大型 XML的效率问题,我们提出 Hybrid Parallel XML Processing（HPXP）算法，HPXP算法是一种使用GPGPU集群来处理大型XML文件的算法设计。这个算法将混合使用CPU和GPGPU，形成master-slave的架构来处理文件。处理过程包括两个阶段，结构抽取以及标签解析。结构抽取阶段使用多线程来读取和识别文档结构，标签解析阶段将利用GPGPU来获取每一个标签的名称和属性，这一阶段的工作将基于结构抽取阶段获取到的标签位置信息。
　　文中的算法改进了以前一些并行算法的缺陷，并且验证了使用 GPGPU来处理XML文档的可行性，在测试环节，我们使用4个CPU线程以及1536个GPU线程最终取得了与传统SAX方法相比2.5倍的解析效率。

著录项

作者
刘平;
展开▼
作者单位

华中科技大学;

展开▼
授予单位华中科技大学;
学科软件工程
授予学位硕士
导师姓名黄立群;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;TP311.52;
关键词
通用图形处理单元; 半结构化; XML文档; 并行算法; 软件开发;

相似文献

中文文献
外文文献
专利

1. 大型XML文档解析技术的应用与研究 [J] . 张太彪 ,曾文华 ,陈志伟 . 厦门大学学报（自然科学版） . 2009,第003期
2. 基于多CPU并行结构的神经网络集成算法研究 [J] . 许廷发 ,宋建中 ,乔双 . 光电子．激光 . 2003,第11期
3. 阻击GPGPU!Intel众核处理器发展战略解析与技术前瞻 [J] . 黄博文 . 微型计算机 . 2014,第003期
4. 两方程湍流模型混合隐式迭代/解析算法研究 [J] . 胡海洋 ,白鹏 . 力学学报 . 2011,第004期
5. 概率XML文档实例生成算法研究 [J] . 朱燕 ,马海涛 . 燕山大学学报 . 2013,第005期
6. WebGIS中基于.NET的XML文档解析 [C] . 和万礼 ,崔铁军 ,陈应东 . 中国地理信息系统协会第九届年会 . 2005
7. 基于SAX模型的XML文档更新算法研究及其在XML文档版本管理中的应用 [A] . 谭帅 . 2004

混合多CPU和GPGPU解析大型XML文档的算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅