首页> 中国专利> 远程多点文件索引同步系统及方法

远程多点文件索引同步系统及方法

摘要

本发明提供一种远程多点文件索引同步系统,该系统包括:导出模块、创建模块及同步模块。本发明还提供一种远程多点文件索引同步方法,该方法包括:从一个数据库中导出特定格式文件记录;远程控制多个索引服务器为该特定格式文件记录创建索引;同步索引,即更新该多个索引服务器中的原有索引,并将新创建的索引合并到该更新后的原有索引中。本发明所提供的远程多点文件索引同步系统及方法,其可针对多点进行索引同步,能够提供实时备份及错误的恢复处理功能,安全性能较好,从而提供更好的检索效能。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-03-16

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20091118 终止日期:20150117 申请日:20060117

    专利权的终止

  • 2009-11-18

    授权

    授权

  • 2008-08-13

    实质审查的生效

    实质审查的生效

  • 2007-07-25

    公开

    公开

说明书

【技术领域】

本发明涉及一种远程多点文件索引同步系统及方法。

【背景技术】

索引是用来快速寻找某些具有特定值的记录,例如MySOL索引,该MySOL索引都是以B-树的形式保存。如果没有索引,执行查询时MySOL必须从第一个记录开始扫描整个表的所有记录,直至找到符合要求的记录,表中数据越多,查询操作的代价就越高。如果作为搜索条件的列上已经创建了索引,MySOL无需扫描任何记录即可迅速得到目标记录所在的位置。如果表中有1000个记录,通过索引查记录至少要比顺序扫描记录快100倍。韦伯斯特字典描述“索引”为材料的序列化的安排,该“索引”是一个较大的、不断增长的、有组织的网页页面的集合。因为索引文件每天都在增长,而且文件服务器上的文件需要经常更新才能满足用户对最新信息搜索的需求,所以有必要及时同步索引服务器中索引。目前大多数索引针对单点服务器同步,用户的查询效率较低,而且无相应的容错处理及恢复机制,风险较大。

【发明内容】

鉴于以上内容,有必要提供一种远程多点文件索引同步系统,其可针对多点进行索引同步,并提供实时备份及相应错误的恢复处理功能,安全性能较好。

鉴于以上内容,还有必要提供一种远程多点文件索引同步方法,其可针对多点进行索引同步,并提供实时备份及相应错误的恢复处理功能,安全性能较好。

一种远程多点文件索引同步系统,包括一个同步服务器、一个数据库及存储有相同信息的多个索引服务器,其中数据库用于存储多种文件。该同步服务器包括:导出模块,用于将该数据库中的存储文件导出为相应的特定格式文件记录,该特定格式文件记录与数据库中的相应文件具有相同的标识;创建模块,用于远程控制该多个索引服务器为该特定格式文件记录创建索引;同步模块,用于同步索引,即先更新索引服务器中原有的索引,并将新创建的索引合并到更新后的原有索引中。

所述同步服务器还包括判断模块,用于判断上述导出模块导出记录是否成功,判断创建模块创建索引是否成功,及判断同步模块更新索引是否成功。

一种远程多点文件索引同步方法,该方法利用一个同步服务器远程同步存储有相同信息的多个索引服务器中的索引,该同步服务器与一个存储有多种文件的数据库相连,该方法包括以下步骤(a)将该数据库中的存储文件导出为相应的特定格式文件记录,该特定格式文件记录与数据库中的相应文件具有相同的标识;(b)远程控制该多个索引服务器为该特定格式文件记录创建索引;(c)同步索引,即更新该多个索引服务器中的原有索引并将新创建的索引合并到更新后的原有索引中。

所述的远程多点文件索引同步系统及方法,其可针对多点进行索引同步,能够提供实时备份及错误的恢复处理功能,安全性能较好,从而提供更好的检索效能。

【附图说明】

图1是本发明远程多点文件索引同步系统较佳实施方式的硬体架构图。

图2本发明远程多点文件索引同步系统较佳实施方式中同步服务器的主要软件功能模块图。

图3是本发明远程多点文件索引同步方法较佳实施方式的具体实施流程图。

【具体实施方式】

参阅图1所示,是本发明远程多点文件索引同步系统较佳实施方式的硬体架构图。该远程多点文件索引同步系统可包含多个索引服务器,其中每个索引服务器根据用户需要被放置的物理位置不同,在本较佳实施方式中,以索引服务器1和索引服务器2为例进行介绍,该索引服务器1与索引服务器2可放置于中国、美国等地区。该远程多点文件索引同步系统还包括一个同步服务器4及一个数据库6。其中索引服务器1和索引服务器2分别通过内部网络3与同步服务器4相连。同步服务器4还通过连接5与数据库6相连。该连接5为一数据库连接,如开放式数据库连接(Open Database Connectivity,ODBC),或Java数据库连接(Java Database Connectivity,JDBC)等。

数据库6中存储有多种文件,在本较佳实施方式中,以专利信息文件为例进行说明,所述专利信息文件内容包括:权利要求书、说明书、图档、发明人信息、专利权人信息、申请日及申请号等。同步服务器4包括多个软件功能模块,用于每隔一定时间将数据库6中的专利信息文件导出,并保存为XML格式的文件记录,以便远程控制索引服务器1和索引服务器2为该XML格式文件记录创建索引,更新索引服务器1和索引服务器2中已存在的原有索引,并将新创建的索引合并到更新后的原有索引中。索引服务器1与索引服务器2中存储的数据信息是相同的,只是存放的物理位置不同,因而可平衡索引服务器1与索引服务器2所在的索引服务器集群的负载,提高用户的查询效率,并且还能够起到索引备份及索引容错的作用。所述XML格式的文件记录的ID(Identification,标识)与数据库6中对应的专利信息文件的ID相同,因此通过为该XML格式文件记录创建的索引能够搜索到数据库6中的对应的专利信息文件。

参阅图2所示,是本发明远程多点文件索引同步系统较佳实施方式中同步服务器4的主要软件功能模块图。该同步服务器4包括导出模块41、创建模块42、同步模块43及判断模块44。

其中,导出模块41用于先从数据库6中的参数配置文件中读取本次索引更新参数,包括上次索引更新成功的结束时间、索引时间间隔、XML格式文件存放路径等相关参数,然后判断所读取的每个参数是否正确,例如:若上次索引更新成功的结束时间在本次索引时间之后,则表明上次索引更新成功的结束时间发生错误,如果所有参数均正确,则可根据数据库6中的标志位信息,及参数中的日期区间等将数据库6中的存储文件导出为相应XML格式的文件记录,该XML格式的文件记录的内容包括:权利要求书、说明书、图档、发明人信息、专利权人信息、申请日及申请号等专利信息,其存取路径即为上述本次索引更新参数包含的XML格式文件存放路径。所述的数据库6中的标志位信息是指上述XML格式的文件记录导出成功与否的标志信息,若一批XML格式文件记录导出成功,则其标志位(Flag)被写入“成功”标志(Success)并存储到数据库6中,若一批XML格式文件记录导出失败,则其标志位(Flag)被写入“失败”标志(Fail)并存储到数据库6中。若所有记录导出成功,则更新数据库6中的参数配置文件,该参数配置文件内容主要包括上次索引更新成功的结束时间、索引时间间隔及XML格式文件的存放路径等。

创建模块42用于远程控制索引服务器1和索引服务器2为导出模块41导出的XML格式文件记录创建索引,若该XML格式文件记录中包含的专利信息在索引服务器1和索引服务器2中的原有索引中已存在,说明对应该XML格式文件记录的索引在索引服务器1和索引服务器2中已被创建过,则应为该XML格式文件记录的ID写日志并保存,所述日志是一个存储XML格式文件ID的记录列表,位于同步服务器4中,只要被导出的XML格式文件记录中包含的专利信息在索引服务器1和索引服务器2中的原有索引中已存在,则应将该XML格式文件的ID记录到日志中。若创建模块42创建索引过程中出现异常即没有创建成功,则向数据库6中的索引运行日志中写入创建索引异常记录。

同步模块43用于同步索引,即首先查看同步服务器4的日志中存在的所有XML格式文件记录的ID,然后将日志中存在的所有ID对应的XML格式文件记录从索引服务器1和索引服务器2中的原有索引中删除以进行原有索引的更新,最后将新创建的索引合并到更新后的原有索引(即目标索引)中,在索引合并前,首先应先将该目标索引进行备份,若索引合并成功,则再将备份的索引删除,若索引合并不成功,则将该备份的索引恢复为目标索引。若同步模块43更新原有索引过程中出现异常即索引更新没有成功,则向数据库6中的索引运行日志中写入索引更新异常记录。

判断模块44用于根据数据库6中存储的导出记录标志位信息(“Success”或“Fail”)判断导出模块41是否从数据库6中成功导出XML格式文件记录,根据数据库6中的索引运行日志中是否有创建索引异常记录判断创建索引是否成功,若无创建索引异常记录,则表明索引创建成功,及根据数据库6中的索引运行日志中是否有索引更新异常记录来判断更新索引是否成功,若索引运行日志中无更新索引异常记录,则表明更新索引成功。

参阅图3所示,是本发明远程多点文件索引同步方法较佳实施方式的具体实施流程图。首先,导出模块41从数据库6中导出XML格式文件记录,具体实施步骤如下:首先导出模块41先从数据库6中的参数配置文件中读取本次索引更新参数,包括上次索引更新成功的结束时间、索引时间间隔、XML格式文件存放路径等相关参数,然后判断所读取的每个参数是否正确,例如:若上次索引更新成功的结束时间在本次索引时间之后,则表明上次索引更新成功的结束时间发生错误,如果所有参数均正确,则可根据数据库6中的标志位信息(Success或Fail),及参数中的日期区间等将数据库6中的存储文件导出为具有相同标识的XML格式文件记录,其存取路径即为上述本次索引更新参数中包含的XML格式文件存放路径。每成功导出一笔XML格式文件记录,数据库6中相应记录的标志位(Flag)被写入“成功”(Success)标志,若所有记录导出成功,则更新参数配置文件,该参数配置文件内容主要包括上次索引更新成功的结束时间、索引时间间隔及XML格式文件的存放路径等(步骤S100)。判断模块44根据数据库6中存储的导出XML格式文件记录的标志位信息(“Success”或“Fail”)判断导出模块41是否从数据库6中成功导出XML格式文件记录(步骤S102)。若导出模块41从数据库6中导出XML格式文件记录成功,则创建模块42远程控制索引服务器1和索引服务器2为导出模块41导出的XML格式文件记录创建索引,若该XML格式文件记录中包含的专利信息在索引服务器1和索引服务器2中的原有索引中已存在,说明对应该XML格式文件记录的索引在索引服务器1和索引服务器2中已被创建过,则应为该XML格式文件记录的ID写日志并保存,所述日志是一个存储XML格式文件ID的记录列表,位于同步服务器4中,只要被导出的XML格式文件记录中包含的专利信息在索引服务器1和索引服务器2中的原有索引中已存在,则应将该XML格式文件记录的ID记录到日志中,若创建模块42创建索引过程中出现异常即没有创建成功,则向数据库6中的索引运行日志中写入创建索引异常记录(步骤S104)。判断模块44根据数据库6中的索引运行日志中是否有创建索引异常记录判断创建模块42创建索引是否成功,若无创建索引异常记录,则表明索引创建成功(步骤S106)。若索引创建成功,则同步模块43首先查看同步服务器4的日志中存在的ID,并将日志中存在的所有ID对应的XML格式文件记录从原有索引中删除以更新原有的索引成为目标索引,若同步模块43更新原有索引过程中出现异常即索引更新没有成功,则向数据库6中的索引运行日志中写入索引更新异常记录(步骤S108)。判断模块44根据数据库6中的索引运行日志中是否有索引更新异常记录来判断同步模块43进行的更新索引是否成功,若索引运行日志中无更新索引异常记录,则表明更新索引成功(步骤S110)。若索引更新成功,则同步模块43将创建模块42新创建的索引合并到更新后的原有索引即目标索引中,在索引合并前,首先应先将该目标索引进行备份,若索引合并成功,则将备份的索引删除,若索引合并不成功,则将该备份的索引恢复为目标索引(步骤S112)。

在步骤S102中,若判断导出模块41从数据库6中导出XML格式文件记录没有成功,则流程结束。

在步骤S106中,若判断创建模块42根据导出模块41导出的XML格式文件记录创建索引没有成功,则流程结束。

在步骤S110中,若判断同步模块43更新索引没有成功,则流程结束。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号