法律状态公告日
法律状态信息
法律状态
2018-07-10
未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20160420 终止日期:20170612 申请日:20120612
专利权的终止
2016-04-20
授权
授权
2013-11-20
专利申请权的转移 IPC(主分类):G06F17/30 变更前: 变更后: 登记生效日:20131101 申请日:20120612
专利申请权、专利权的转移
2013-02-27
专利申请权的转移 IPC(主分类):G06F17/30 变更前: 变更后: 登记生效日:20130118 申请日:20120612
专利申请权、专利权的转移
2012-12-26
实质审查的生效 IPC(主分类):G06F17/30 申请日:20120612
实质审查的生效
2012-11-07
公开
公开
查看全部
技术领域
本发明涉及计算机技术领域,特别涉及可扩展的XML数据节点标识号码的 编码方法及装置。
背景技术
XML(全称Extensible Markup Language),是一种专门为intemet而设计的 一种标记语言,且由于其具有有效的表达各种信息、数据和使各种应用协同工 作的能力,业已成为数据发布和数据交换的事实标准,因此,XML在近几年得 到了发展和广泛的应用。XML的重点不在于数据的形式本身,而在于管理数据 信息,因此,XML使得不同数据库模式的统一成为可能,为异构数据库的集成 问题提供了途径。XML数据库管理系统(XML数据库管理系统)也是近年来 发展迅速的一种新型的数据库管理系统,它以存储和检索符合W3C标准的XML 文档数据为目标的数据库管理系统,并且可以更新XML文档。由于它存储的对 象是XML文档库,因此XML数据库管理系统本质上就是一种XML文档库。
XML数据库管理系统(XML数据库管理系统)是近年来快速发展的一种新 型的数据库管理系统(DBMS),它存储和检索的数据是XML文档,并且支持 更新XML文档。随着XML标准被越来越多的行业采纳为数据交换标准,XML数 据的管理(存储,检索,更新等)需求会持续快速增长,特别是XML数据库管 理系统比关系数据库管理系统更加适合处理文本类数据和XML文档数据。而关 系数据库管理系统由于已经在IT行业广泛应用了几十年,不论在市场还是技术 方面其主导地位不可撼动,并且相比XML数据库管理系统,关系数据库管理系 统在处理关系数据时更加有优势。所以未来的DBMS市场上面,XML数据库管 理系统将与关系数据库管理系统(关系数据库管理系统)长期并存。在各种企 业和其他单位中,将出现XML数据库管理系统和关系数据库管理系统长期共存 并且协同工作的状况。
在XML数据库管理系统中,XML文档的存储方法主要有两种:
一种是直接将XML文档存储到XML数据库管理系统中。此种方法的优点在 于操作上简单易行,但是如果要对XML文档进行节点级的操作则一般较为困难。
另一种是将XML文档中的数据按照节点进行解析并存储。这种存储方法非 常利于对XML文档进行节点级的操作,但实现起来比较复杂。针对节点级的存 储方式,为了方便节点的查找和修改,在节点数据存储时,需要对节点进行标 识和编码。每一个节点通过编码得到一个可唯一标识的代码(NODE-ID),在 节点查找时就能快速辨别和定位。
由于XML数据库管理系统中存储的XML文档内容可能非常巨大,所以节点 的数目也就可能非常多。而且,通过XQUERY UPDATE,节点之间还可能增加 新的节点。因此,对节点ID的编码方式的就要达到两个要求:要尽量少的占用 存储的空间;能在不改变现有节点的标识编码的情况下载两个节点之间方便的 插入若干新的节点。
发明内容
为解决上述问题,本发明技术方案提供的一种可扩展的XML数据节点标识 号码的编码方法,包括:
存储一XML文档时,依照节点间关系为所述XML文档的所有节点按照顺 序产生一整数位字符串编码作为节点ID;
当所述XML文档有新增节点插入时,在所述整数位编码的基础上,为所述 新增节点产生小数位字符串编码方式扩展所述标识编码,产生所述新增节点的 节点ID。
可选地,所述新增节点的节点ID为整数位字符串编码加上所述小数位字符 串编码。
可选地,所述新增节点的整数位字符串编码与同级的前一节点的整数位字 符串编码相同。
可选地,所述新增节点的整数位字符串编码与同级的后一节点的整数位字 符串编码相同。
本发明还提供了一种XML数据节点标识号码的编码装置,包括:
整数位字符串编码模块,用于在存储一XML文档时,依照节点间关系为所 述XML文档的所有节点按照顺序产生一整数位字符串编码作为节点ID;
小数位字符串编码模块,用于当所述XML文档有新增节点插入时,在所述 整数位编码的基础上,为所述新增节点产生小数位字符串编码方式扩展所述标 识编码,产生所述新增节点的节点ID。
可选地,所述新增节点的节点ID为整数位字符串编码加上所述小数位字符 串编码。
可选地,所述新增节点的整数位字符串编码与同级的前一节点的整数位字 符串编码相同。
可选地,所述新增节点的整数位字符串编码与同级的后一节点的整数位字 符串编码相同。
与现有技术相比,上述技术方案具有下优点:
本发明的技术方案可以支持XML节点标识编码的动态更新,通过小数位标 识编码的产生和使用,在保持原有XML节点编码不变的情况下,实现了节点ID 的可扩展,在节省存储空间的同时,提高了编码的效率。
附图说明
图1是本发明实施方式的可扩展的XML数据节点标识号码的编码方法的的 流程图;
图2是本发明实施方式的可扩展的XML数据节点标识号码的编码装置的组 成结构框架示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对 本发明的具体实施方式做详细的说明。在以下描述中阐述了具体细节以便于充 分理解本发明。但是本发明能够以多种不同于在此描述的其它方式来实施,本 领域技术人员可以在不违背本发明内涵的情况下做类似推广。因此本发明不受 下面公开的具体实施方式的限制。
本领域的技术人员知道,一种是直接将XML文档存储到XML数据库管理系 统中。另一种是将XML文档中的数据按照节点进行解析并存储。
对于前一种方法来说,此种方法的优点在于操作上简单易行,但是如果要 对XML文档进行节点级的操作则一般较为困难。对于后一种XML文档存储方法 来说,其利于对XML文档进行节点级的操作,但实现起来比较复杂。
针对节点级的存储方式,为了方便节点的查找和修改,在节点数据存储时, 需要对节点进行标识和编码。每一个节点通过编码得到一个可唯一标识的代码 (NODE-ID),在节点查找时就能快速辨别和定位。由于XML数据库管理系统 中存储的XML文档内容可能非常巨大,所以节点的数目也就可能非常多。而且, 通过XQUERY UPDATE,节点之间还可能增加新的节点。因此,对节点ID的编 码方式的就要达到两个要求:要尽量少的占用存储的空间;能在不改变现有节 点的标识编码的情况下载两个节点之间方便的插入若干新的节点。
为解决现有技术中的问题,本发明的发明人经过研究,提出了一种关系数 据库管理系统与XML数据库管理系统之间数据交换的方法。参阅图1,图1是本 发明实施方式的关系数据库管理系统与XML数据库管理系统之间数据交换的方 法的流程图。本发明实施方式的关系数据库管理系统与XML数据库管理系统之 间数据交换的方法,包括:
存储一XML文档时,依照节点间关系为所述XML文档的所有节点按照顺 序产生一整数位字符串编码作为节点ID;
当所述XML文档有新增节点插入时,在所述整数位编码的基础上,为所述 新增节点产生小数位字符串编码方式扩展所述标识编码,产生所述新增节点的 节点ID。
下面结合具体的实例来对本发明进行进一步详细的阐述
本发明提出的一种可扩展的XML数据节点标识号码的编码方法中所采用变 长的的编码格式,具体如下:
长度:1字节 n字节 编码总长度-n-1
例如下面的XML文档:
首先,根据本发明的实施方式,存储一XML文档时,依照节点间关系为所 述XML文档的所有节点按照顺序产生一整数位字符串编码作为节点ID;上述 的XML文档实例中各节点对应的编码如下:
节点1:
节点2:
节点3:
节点4:
上述的XML文档插入新节点后如下:
当所述XML文档有新增节点插入时,在所述整数位编码的基础上,为所述 新增节点产生小数位字符串编码方式扩展所述标识编码,产生所述新增节点的 节点ID,也即新增节点后,上述的XML文档中各节点对应的编码如下:
节点1:
节点2:
节点3:
新增节点1:
新增节点2:
节点4:
其中,应该指出的是,上述的实施方式的所述新增节点的整数位字符串编 码与同级的前一节点的整数位字符串编码相同,当然,也可以根据实际的需要, 新增节点的整数位字符串编码也可与同级的后一节点的整数位字符串编码相 同。
参阅图2,图2为本发明的实施方式的可扩展的XML数据节点标识号码的编 码装置的组成框架示意图。本发明的实施方式的可扩展的XML数据节点标识号 码的编码装置,包括:
整数位字符串编码模块,用于在存储一XML文档时,依照节点间关系为所 述XML文档的所有节点按照顺序产生一整数位字符串编码作为节点ID;
小数位字符串编码模块,用于当所述XML文档有新增节点插入时,在所述 整数位编码的基础上,为所述新增节点产生小数位字符串编码方式扩展所述标 识编码,产生所述新增节点的节点ID。
优选地,所述新增节点的节点ID为整数位字符串编码加上所述小数位字符 串编码。
优选地,所述新增节点的整数位字符串编码与同级的前一节点的整数位字 符串编码相同。
优选地,所述新增节点的整数位字符串编码与同级的后一节点的整数位字 符串编码相同。
综上所述,本发明的技术方案具有如下的优点:
本发明的技术方案可以支持XML节点标识编码的动态更新,通过小数位标 识编码的产生和使用,在保持原有XML节点编码不变的情况下,实现了节点ID 的可扩展,在节省存储空间的同时,提高了编码的效率。
应当理解的是这里所描述的方法和系统可以以各种形式的硬件、软件、固 件、专用处理机或者它们的组合实现。尤其是,至少本发明的一部分包括程序 指令的应用程序优选实现。这些程序指令被确实地包括在一个或者多个程序存 储设备(包括但不限于硬盘,磁性软盘,RAM,ROM,CD,ROM等)里, 并且可由任何包括适当结构的设备或者机器,例如一种具有处理器、内存和输 入/输出接口的通用数字计算机执行。还应当理解由于附图中描述的一些系统的 组成部件和处理步骤优选地以软件实现,所以,系统模块(或者方法步骤的逻 辑流程)之间的连接可能不同,这取决于本发明的编程方式。根据这里给出的 指导,相关领域的普通技术人员将能够设计出本发明的这些以及类似的实施方 式。
以上公开了本发明的多个方面和实施方式,本领域的技术人员会明白本发明的 其它方面和实施方式。本发明中公开的多个方面和实施方式只是用于举例说明, 并非是对本发明的限定,本发明的真正保护范围和精神应当以权利要求书为准。
机译: XML数据的编码方法,XML数据的编码方法,XML数据的编码系统,XML数据的编码系统,程序和记录介质
机译: XML数据的编码方法,已编码的XML数据的解码方法,XML数据的编码系统,已编码的XML数据的解码系统,程序和记录介质
机译: 在XML数据库中使用前缀编码的节点标识符进行子文档并发控制的有效锁定协议