首页> 中文学位 >基于P2P框架的数据库网格中若干关键技术的研究
【6h】

基于P2P框架的数据库网格中若干关键技术的研究

代理获取

目录

文摘

英文文摘

第一章 概述

1.1 研究背景

1.2 数据网格的产生与发展

1.3 数据库网格的发展现状

1.3 本文工作

1.3.1 研究动机

1.3.2 主要研究内容

1.3.3 本文组织结构

第二章 基于P2P模型的数据库网格的体系结构

2.1 五层沙漏结构

2.2 开放式网格服务体系结构OGSA

2.3 WEB服务资源框架(WSRF)

2.4 P2P模型

2.5 基于P2P模型的数据库网格的体系结构

2.5.1 三种网格体系结构的特点

2.5.2 基于OGSA体系结构的数据集成技术

2.5.3 P2P模型的引入

2.5.4 基于P2P模型的数据库网格的体系结构

2.6 本章小结

第三章 层次式的CHORD框架结构-MULTICHORD

3.1 问题的提出

3.2 P2P算法及研究现状

3.2.1 CAN算法

3.2.2 Pastry系统

3.2.3 Tapestry系统

3.2.4 Chord算法

3.3 基于CHORD的网格数据服务管理

3.4 改进的CHORD框架结构-MULTICHORD

3.4.1 MultiChord环结构

3.4.2 节点的加入和退出

3.4.3 MultiChord的复杂性分析

3.4.4 性能测试

3.5 本章小结

第四章 基于本体的模式集成与查询处理

4.1 问题的提出

4.2 本体概述

4.2.1 本体的概念

4.2.2 本体的作用

4.2.3 本体的种类

4.2.4 本体在信息系统中的应用

4.3 基于本体的数据集成策略

4.3.1 XML在数据集成中的作用和不足

4.3.2 数据集成的语义方法

4.3.3 基于本体的数据集成策略

4.4 全局模式本体的定义

4.5 基于本体的查询处理

4.5.1 全局查询处理

4.5.2 局部查询处理

3.6 本章小结

第五章 P2P模型下的查询执行优化策略

5.1 问题的提出

5.2 P2PDBQE查询执行框架

5.3 P2PDBQE查询执行策略

5.3.1 集中式查询执行策略(CDI)

5.3.2 分布式查询执行策略(DDI)

5.3.3 基于过滤器的查询执行策略(FDDI)

5.3.4 三种查询执行策略的比较与分析

5.4 实验测试

5.5 本章小结

第六章 副本管理策略

6.1 问题的提出

6.2 副本管理简介

6.2.1 使用副本的目的

6.2.2 副本管理问题

6.3 单根节点存在的问题

6.4 多根节点多点维护解决策略

6.4.1 多根节点多点维护策略的提出

6.4.2 方案比较

6.5 算法的设计

6.5.1 节点加入

6.5.2 节点退出

6.5.3 左或右邻居异常退出

6.5.4 邻居集中节点异常退出

6.6 模拟实验

6.6.1 测试目的、测量指标和方法

6.6.2 NS网络模拟器

6.6.3 测试结果与分析

6.7 本章小结

第七章 数据概要策略

7.1 问题的提出

7.2 基于特定属性的聚类挖掘算法的提出

7.3 集中式聚类分析时间代价

7.3.1 聚类分析的时间代价

7.3.2 测试结果分析

7.3.3 聚类分析性能改进讨论

7.4 分布的聚类分析策略

7.4.1 分布的聚类分析

7.4.2 性能测试

7.5 本章小结

第八章 DS_GRID数据库网格系统的设计与实现

8.1 DS_GRID数据库网格介绍

8.2 DS_GRID用户查询的执行流程

8.3 关键模块设计与实现

8.3.1 相关知识介绍

8.3.2 MultiChord组件的实现

8.3.3 查询处理过程

8.3.4 查询执行管理模块

8.3.5 副本管理器

8.3.6 基于聚类分析算法的可视化模块

8.4 本章小结

第九章 结束语

9.1 本文的主要贡献

9.2 有关结论

9.3 进一步的工作

参考文献

致谢

攻读博士学位期间发表论文

攻读博士学位期间参加研究的科研项目

作者简介

展开▼

摘要

随着信息技术的发展,各行业的信息量呈爆炸性增长,其中包括众多公共有效的数据库资源。地理上广泛分布的用户都希望能够按需透明地访问和使用这些丰富的数据资源。如高能物理、生物计算等科学研究领域、电子商务领域和深层Web数据查询领域等。数据网格是基于广域网对海量、分布异构的数据资源进行管理、访问和共享的系统。数据库网格概念是随着公有数据库资源的丰富而提出的,是以数据库为主要资源的一种数据网格系统,可为上述应用提供良好的支持。一方面,利用网格环境的高效处理能力实现海量数据的有效整合,有效地利用已有众多的数据库资源;同时也可以利用数据库管理系统高效的数据管理能力,为网格内实现数据库资源的有效管理、分布数据的优化集成以及海量数据的分析处理等提供强有力的支持。为此,本文针对目前支持数据库网格的若干关键技术进行研究,主要包括基于P2P模型的网格体系结构、P2P支持框架、资源管理、数据动态集成、资源副本管理、数据概要等进行深入研究。
   目前有关数据库网格的研究和开发还处于起步阶段。几年来,最具有代表性的工作是隶属于全球网格论坛(GGF:Global Grid Forum)的DAIS工作组(Database Access and Integration Services Working Group)制定的网格环境下访问数据库的协议和中间件,以及针对特定应用数据库进行处理的网格系统。已有工作大多是针对特定领域,基于静态环境构建的数据库网格系统,很少有如何适应网格环境内数据库资源的不确定性的相关讨论,也没有看到有关完善的支持动态数据集成的数据库网格的报道。虽然网格环境下针对数据库的处理技术同已有的多数据库、并行数据库以及分布式数据库的处理技术有很多相容的方面,但由于网格环境内数据资源的不确定性(动态性),已有支持技术不足以支持构建具有不确定性的数据库网格环境。这些不确定性给数据库网格中数据资源管理、资源查询处理、数据集成、事务调度、海量数据分析等带来了新的挑战。
   本文基于OGSA-DAI(Open Grid Service Architecture-Database Access and Integration)规范,采用面向服务的思想,基于P2P模型,研究构建一个面向多领域的、支持动态数据集成的数据库网格系统的若干关键技术。目的是在网格环境下,借用网格的高效处理能力,为分布、自治、异构的数据库资源的有效管理、动态数据集成和分析处理等提供一个良好的使能环境,透明地为用户按需提供服务。
   在支持数据库网格的框架结构方面,针对集中的资源管理方法具有一定的局限性,呈现出了Peer to Peer(P2P)体系结构。P2P方式,可避免单点失败,并具有可扩展性好等特点。为支持多领域的资源管理,在Chord结构基础上,提出了一种适用于数据库网格的P2P框架结构-MultiChord,可有效支持多领域的资源管理。
   在模式集成和查询处理方面,针对数据库网格内资源的自治、异构特性,定义全局模式本体,并提出了一种基于本体的查询处理策略,提高查询效率,实现异构查询。将查询处理分为全局查询和局部查询处理两部分。在全局查询处理阶段,基于本体实现语义转换、查询重写和生成查询执行计划。由局部查询处理解决数据层冲突和查询的语义扩展。
   在执行优化方面,为有效地减少数据传输代价,提出了一种基于关键字过滤的执行优化策略,并基于“能者多劳”的思想,动态协调数据资源的传输量,有效地提高了数据网格内的数据资源的获取效率。
   在副本管理方面,针对P2P系统中节点可随时加入和退出的动态特性,为保证基于P2P模型的数据网格系统的健壮性,提出了一种基于多根节点多点维护的副本管理策略,可有效地保证数据网格系统的健壮性,提高了资源的获取效率。
   在数据概要方面,为有效地从海量数据的查询结果信息中获取最多的知识,提出了一种基于聚类分析的分布式的数据概要策略。数据集成层保证合成的数据满足用户的模式需求,聚类分析层将概要数据展示给用户,以便于直观的数据分析。
   最后,在提出的关键技术基础上,设计并实现了一个支持多领域的、面向数据库资源动态集成的数据库网格系统DS-Grid。基于DAI将数据资源包装为Grid Services,基于JAXT构建MultiChord框架,采用XML数据库管理系统Shunsaku为XML数据资源仓,主要编程语言为Java。该系统是国家863项目子项目“面向CIMS领域的支持企业业务柔性集成的服务网格技术的研究”的一个子系统,经过测试评价,具有较高的效率,很好地达到了预期目标。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号