首页> 中国专利> 一种过期数据清理方法、装置和电子设备

一种过期数据清理方法、装置和电子设备

摘要

本申请提出了一种过期数据清理方法、装置和电子设备,涉及数据处理领域。其中,上述过期数据清理方法包括:响应于接收到的任务启动信息,启动多个工作进程。工作进程根据业务导航信息,确定对应的业务数据库。然后,工作进程从所对应的业务数据库中确定待操作的业务数据表。进一步的,工作进程根据数据清理规则,从待操作的业务数据表确定待清理数据。最后,工作进程对待清理数据备份存储之后,删除待清理数据。从而实现了在进行数据清理时,能够不间断提供售票服务。

著录项

说明书

【技术领域】

本申请涉及数据处理领域,尤其涉及一种过期数据清理方法、装置和电子设备。

【背景技术】

过期数据的清理对于任意一个信息系统来说都是至关重要的。对信息系统中的过期数据进行清理可以在一定程度上保持系统存储的剩余空间,保障系统的稳定运行。对于12306互联网售票系统这样拥有上亿注册用户的庞大信息系统来说,存在订单信息、存根信息和交易信息等大量过期数据。对这些过期数据的清理是系统维护过程中非常重要的环节。

目前,12306系统后台过期数据的清理会影响到前台业务的正常开展。因此,12306系统在进行过期数据清理时,无法提供售票服务。

【发明内容】

本申请实施例提供了一种过期数据清理方法、装置和电子设备,以在进行数据清理时不间断提供售票服务。

第一方面,本申请实施例提供一种过期数据清理方法,包括:响应于接收到的任务启动信息,启动多个工作进程;所述工作进程根据业务导航信息,确定对应的业务数据库;所述工作进程从所对应的业务数据库中确定待操作的业务数据表;所述工作进程根据数据清理规则,从待操作的所述业务数据表确定待清理数据;所述工作进程对所述待清理数据备份存储之后,删除所述待清理数据。

其中一种可能的实现方式中,所述业务导航信息包含进程标识和数据库标识的对应关系;所述工作进程根据业务导航信息,确定对应的业务数据库,包括:所述工作进程根据自身的进程标识和所述对应关系,确定所述业务数据库。

其中一种可能的实现方式中,所述工作进程从所对应的业务数据库中确定待操作的业务数据表,包括:所述工作进程确定所述业务数据库中的各业务数据表是否关联有清理任务标识;所述工作进程将关联有清理任务标识的业务数据表确定为待操作的业务数据表。

其中一种可能的实现方式中,所述数据清理规则包含保留天数阈值;所述工作进程根据数据清理规则,从待操作的所述业务数据表确定待清理数据,包括:确定待操作的所述业务数据表中各条业务数据的保留天数是否大于保留天数阈值;将保留天数大于保留天数阈值的第一业务数据确定为待清理数据。

其中一种可能的实现方式中,所述数据清理规则还包含可删除天数;将保留天数大于保留天数阈值的第一业务数据确定为待清理数据,包括:确定所述第一业务数据的产生日期;如果所述第一业务数据产生在不同的日期,则确定所述不同日期的个数是否超过所述可删除天数;如果所述不同日期的个数未超过所述可删除天数,则将所述第一业务数据确定为待清理数据;如果所述不同日期的个数超过所述可删除天数,则从所述第一业务数据选取满足所述可删除天数的数据作为待清理数据。

其中一种可能的实现方式中,所述数据清理规则还包含清理时间;所述工作进程对所述待清理数据备份存储之前,所述方法还包括:确定当前时间在所允许的所述清理时间内。

其中一种可能的实现方式中,所述工作进程对所述待清理数据备份存储之前,所述方法还包括:确定所述待清理数据的大小;根据所述待清理数据的大小,确定备份数据库的剩余空间可以存储所述待清理数据。

第二方面,本申请实施例提供一种过期数据清理装置,包括:启动模块,用于响应于接收到的任务启动信息,启动多个工作进程;第一确定模块,用于使所述工作进程根据业务导航信息,确定对应的业务数据库;第二确定模块,用于使所述工作进程从所对应的业务数据库中确定待操作的业务数据表;第三确定模块,用于使所述工作进程根据数据清理规则,从待操作的所述业务数据表确定待清理数据;清理模块,用于使所述工作进程对所述待清理数据备份存储之后,删除所述待清理数据。

第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如上所述的方法。

第四方面,本申请实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如上所述的方法。

以上技术方案中,响应于接收到的任务启动信息,启动多个工作进程。工作进程根据业务导航信息,确定对应的业务数据库。然后,工作进程从所对应的业务数据库中确定待操作的业务数据表。进一步的,工作进程根据数据清理规则,从待操作的业务数据表确定待清理数据。最后,工作进程对待清理数据备份存储之后,删除待清理数据。从而实现了在进行数据清理时,能够不间断提供售票服务。

【附图说明】

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本申请实施例提供的一种过期数据清理方法的流程图;

图2为本申请实施例提供的另一种过期数据清理方法的流程图;

图3为本申请实施例提供的另一种过期数据清理方法的流程图;

图4为本申请实施例提供的一种过期数据清理装置的结构示意图;

图5为本申请实施例提供的一种电子设备的结构示意图。

【具体实施方式】

为了更好的理解本申请的技术方案,下面结合附图对本申请实施例进行详细描述。

应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

图1为本申请实施例提供的一种过期数据清理方法的流程图。如图1所示,上述过期数据清理方法可以包括:

步骤101,响应于接收到的任务启动信息,启动多个工作进程。

本申请实施例中,在接收到系统发出的任务启动信息之后,多个工作进程可同时执行数据清理任务。系统发出任务启动信息可以是,通过设置定时任务,在预设的时间节点定时触发任务启动信息。还可以是,根据实际需求,通过管理员对系统的操作,触发任务启动信息。

步骤102,工作进程根据业务导航信息,确定对应的业务数据库。

本申请实施例中,可设置多个业务数据库。各个业务库中均可存放业务数据表。

一些实施例中,在多个数据库中存放业务数据表时,可通过对业务数据对应的用户名执行哈希算法。例如可以对用户名的首字母执行哈希算法。根据得到的哈希值的不同,将具有相同哈希值的业务数据表存放在相同的业务数据库中。

另一些实施例中,在多个数据库中存放业务数据表时,可先对业务数据表进行分类。根据分类结果,将相同类别的业务数据表存放在相同的业务数据库中。

本申请实施例中,可在业务导航信息中设置进程标识与数据库标识的对应关系。多个工作进程启动之后,可根据自身的进程标识,以及业务导航信息中的上述对应关系,确定各自对应的业务数据库。多个工作进程可同时对不同的业务库进行访问,执行数据清理。

步骤103,工作进程从所对应的业务数据库中确定待操作的业务数据表。

本申请实施例中,各业务数据库中可存放多个业务数据表。工作进程在访问业务数据库时,需要从该业务数据库中确定待操作的业务数据表。

一些实施例中,待操作的业务数据表可以是,包含的数据量超过了预设阈值的业务数据表。其中,预设阈值的类型和取值可根据实际情况的需求进行设定。例如可以是,预设阈值的类型为数据对应的天数;取值为50天。例如还可以是,预设阈值的类型为数据的条数;取值为10000条。

另一些实施例中,待操作的业务数据表可以是,不符合预设免清理条件的业务数据表。预设免清理条件例如可以是,新业务对应的业务数据表免清理。还可以是,特殊时期内的业务数据表免清理。其中,特殊时期可以是,因外界不可抗力引起大规模的、频繁的业务数据变更的时期。

本申请实施例中,可以将上述待操作的业务数据表与清理任务标识相关联。其中,相关联的方式可以为,在待操作的业务数据表上设置清理任务标识。相关联的方式还可以为,在与待操作的数据表关联的定义表中,设置清理任务标识。

基于上述说明,本申请实施例中,工作进程在业务数据库中确定待操作的业务数据表时,可确定各业务数据表是否关联有清理任务标识。将关联有清理任务标识的业务数据表确定为待操作的业务数据表。

步骤104,工作进程根据数据清理规则,从待操作的业务数据表确定待清理数据。

本申请实施例中,可预先建立数据清理规则与业务数据表之间的关联关系。具体的,不同的业务数据表可关联不同的数据清理规则。不同的业务数据表也可关联相同的数据清理规则。在确定好待操作的业务数据表之后,工作进程根据上述关联关系,确定与待操作的业务数据表对应的数据清理规则。根据数据清理规则,进一步确定该业务数据表中的待清理数据。

一些实施例中,数据清理规则可以包含保留天数阈值。保留天数阈值规定了数据可在业务数据库中保留的最长时限。工作进程确定待清理数据时,如图2所示,对待操作的业务数据表中各条业务数据的保留天数进行判断。如果保留天数大于保留天数阈值,则将对应的第一业务数据确定为待清理数据。如果待操作的业务数据表中,数据保留天数不大于保留天数阈值,则记录操作日志,重新确定待操作业务数据表。数据保留天数不大于保留天数阈值,说明该业务数据表中的数据还可以继续保留,直至保留天数大于保留天数阈值。本申请是实施例中,记录操作日志可以是,记录此次操作的业务数据表名、是否完成数据清理、未完成原因等。

另一些实施例中,数据清理规则可以包含保留天数阈值和可删除天数。保留天数阈值规定了数据可在业务数据库中保留的最长时限。可删除天数规定了每次可删除的数据对应的天数。工作进程确定待清理数据时,如图2所示,对待操作的业务数据表中各条业务数据的保留天数进行判断。如果保留天数大于保留天数阈值,则将对应的数据确定为第一业务数据。然后,确定第一业务数据的产生日期。如果第一业务数据产生在不同的日期,则确定不同日期的个数是否超过可删除天数。如果不同日期的个数未超过可删除天数,则将第一业务数据确定为待清理数据。如果不同日期的个数超过可删除天数,则从第一业务数据选取满足可删除天数的数据作为待清理数据。其中,在选取满足可删除天数的数据时,可优先选取保留天数较长的数据。

步骤105,工作进程对待清理数据备份存储之后,删除待清理数据。

本申请实施例中,在确定好待清理数据之后,为保证数据的可恢复性,需要对待清理数据进行备份。可选的,将待清理数据备份到备份数据库中。

进一步的,为保证备份的可靠性,本申请实施例在备份完成之后,可对备份情况进行检查。可选的,检查备份数据库中是否备份了完整的待清理数据。如图2所示,确定备份了完整的待清理数据之后,从业务数据表中删除待清理数据。如果没有将完整的待清理数据备份,则将备份数据库中不完整的待清理数据删除。

本申请实施例中,响应于接收到的任务启动信息,启动多个工作进程。工作进程根据业务导航信息,确定对应的业务数据库。然后,工作进程从所对应的业务数据库中确定待操作的业务数据表。进一步的,工作进程根据数据清理规则,从待操作的业务数据表确定待清理数据。最后,工作进程对待清理数据备份存储之后,删除待清理数据。从而实现了在进行数据清理时,能够不间断提供售票服务。

图3为本申请实施例提供的另一种过期数据清理方法的流程图。如图3所示,本申请图1所示实施例步骤105之前,还可以包括:

步骤1041,确定当前时间在所允许的清理时间内。

本申请实施例中,数据清理规则还包含清理时间。清理时间规定了可进行数据清理的时间。清理时间可根据实际情况的需要进行设定。一些实施例中,为保证数据清理的及时性,可将清理时间设置为00:00~24:00。另一些实施例中,为避开前台售票业务高峰期,保证后台数据清理以及前台业务的流畅性,可将清理时间设置为00:00~06:00。

在确定好待清理数据之后,需要先对当前时间进行判断。如图2所示,确定当前时间在清理时间之内,则执行下述步骤1042。确定当前时间不在清理时间之内,记录操作日志,重新确定待操作业务数据表。

步骤1042,确定待清理数据的大小。

本申请实施例中,确定好待清理数据之后,需要先将待清理数据备份至备份数据库中。为保证备份数据库有足够的空间存储待清理数据,需要确定待清理数据的大小,以及备份数据库的剩余空间。

如图2所示,确定备份数据库的剩余空间可以存储待清理数据之后,对待清理数据进行备份。备份完成之后,删除待清理数据。如果确定备份数据库的剩余空间不可以存储待清理数据,记录操作日志,重新确定待操作业务数据表。

本申请实施例中,在对待清理数据进行备份和删除之前,对当前时间和待清理数据的大小进行判断。一方面可以规定数据清理的时间,最大程度保证数据清理以及前台业务的流畅性;另一方面,可以确定备份数据库对待清理数据的存储能力,保证待清理数据可以完整备份。

图4为本申请过期数据清理装置一个实施例的结构示意图。本实施例中的过期数据清理装置可以作为过期数据清理设备实现本申请实施例提供的过期数据清理方法。如图4所示,上述过期数据清理装置可以包括:启动模块41、第一确定模块42、第二确定模块43、第三确定模块44和清理模块45。

启动模块41,用于响应于接收到的任务启动信息,启动多个工作进程。

第一确定模块42,用于使工作进程根据业务导航信息,确定对应的业务数据库。

第二确定模块43,用于使工作进程从所对应的业务数据库中确定待操作的业务数据表。

第三确定模块44,用于使工作进程根据数据清理规则,从待操作的业务数据表确定待清理数据。

清理模块45,用于使工作进程对待清理数据备份存储之后,删除待清理数据。

本申请实施例中,启动模块41响应于接收到的任务启动信息,启动多个工作进程。第一确定模块42根据业务导航信息,确定对应的业务数据库。然后,第二确定模块43从所对应的业务数据库中确定待操作的业务数据表。进一步的,第三确定模块44根据数据清理规则,从待操作的业务数据表确定待清理数据。最后,清理模块45对待清理数据备份存储之后,删除待清理数据。从而实现了在进行数据清理时,能够不间断提供售票服务。

图5为本申请电子设备一个实施例的结构示意图。如图5所示,上述电子设备可以包括至少一个处理器;以及与上述处理器通信连接的至少一个存储器,其中:存储器存储有可被处理器执行的程序指令,上述处理器调用上述程序指令能够执行本申请实施例提供的过期数据清理方法。

其中,上述电子设备可以为过期数据清理设备,本实施例对上述电子设备的具体形态不作限定。

图5示出了适于用来实现本申请实施方式的示例性电子设备的框图。图5显示的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示,电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:一个或者多个处理器410,存储器430,连接不同系统组件(包括存储器430和处理单元410)的通信总线440。

通信总线440表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。

电子设备典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

存储器430可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)和/或高速缓存存储器。电子设备可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read Only Memory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read Only Memory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与通信总线440相连。存储器430可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块的程序/实用工具,可以存储在存储器430中,这样的程序模块包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本申请所描述的实施例中的功能和/或方法。

电子设备也可以与一个或多个外部设备(例如键盘、指向设备、显示器等)通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过通信接口420进行。并且,电子设备还可以通过网络适配器(图5中未示出)与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide AreaNetwork;以下简称:WAN)和/或公共网络,例如因特网)通信,上述网络适配器可以通过通信总线440与电子设备的其它模块通信。应当明白,尽管图5中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Drives;以下简称:RAID)系统、磁带驱动器以及数据备份存储系统等。

处理器410通过运行存储在存储器430中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例提供的过期数据清理方法。

本申请实施例还提供一种非临时性计算机可读存储介质,上述非暂态计算机可读存储介质存储计算机指令,上述计算机指令使上述计算机执行本申请实施例提供的过期数据清理方法。

上述非临时性计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory;以下简称:ROM)、可擦式可编程只读存储器(ErasableProgrammable Read Only Memory;以下简称:EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network;以下简称:LAN)或广域网(Wide Area Network;以下简称:WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

需要说明的是,本申请实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer;以下简称:PC)、个人数字助理(Personal Digital Assistant;以下简称:PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号