首页> 中国专利> 准实时数据处理方法、装置、服务器及存储介质

准实时数据处理方法、装置、服务器及存储介质

摘要

本发明涉及数据处理,提供一种准实时数据处理方法、装置、服务器及存储介质。该方法能够确定并将数据库操作日志同步消息中间件,消费并解析数据库操作日志,得到准实时数据及更新时间,存储准实时数据至KUDU数据库中,获取预先创建的HIVE数据库并创建HIVE外部表,HIVE数据库中的HIVE内部表存储所述更新时间之前的数据,确定准实时数据在KUDU数据库中的存储路径,将存储路径存储至HIVE外部表,当查询终止时间为更新时间时,联合HIVE外部表与HIVE内部表,得到并查询目标数据表,得到响应数据。本发明提高准实时数据的查询性能。此外,本发明还涉及区块链技术,所述响应数据可存储于区块链中。

著录项

  • 公开/公告号CN112434062A

    专利类型发明专利

  • 公开/公告日2021-03-02

    原文格式PDF

  • 申请/专利权人 平安普惠企业管理有限公司;

    申请/专利号CN202011343327.0

  • 发明设计人 赵乐;

    申请日2020-11-26

  • 分类号G06F16/2453(20190101);G06F16/23(20190101);G06F16/28(20190101);

  • 代理机构44334 深圳市赛恩倍吉知识产权代理有限公司;

  • 代理人迟珊珊;杨毅玲

  • 地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)

  • 入库时间 2023-06-19 10:05:17

说明书

技术领域

本发明涉及数据处理技术领域,尤其涉及一种准实时数据处理方法、装置、服务器及存储介质。

背景技术

在目前的大数据平台中,通常利用HIVE数据仓库作为大数据平台的离线数据仓库,为了确保大数据平台的性能,目前的大数据平台不支持数据的准实时更新及删除,从而在大数据平台中无法将最新的数据准实时同步到HIVE数据仓库中,导致无法从HIVE数据仓库中查询到准实时的数据。

发明内容

鉴于以上内容,有必要提供一种准实时数据处理方法、装置、服务器及存储介质,在确保与HIVE数据库对应的大数据平台的性能时,仍然能够查询到准实时数据,提高查询性能。

一方面,本发明提出一种准实时数据处理方法,应用于服务器中,所述准实时数据处理方法包括:

当检测到数据库操作日志生成时,根据所述数据库操作日志确定与所述服务器连接的消息中间件,并将所述数据库操作日志同步至所述消息中间件;

消费并解析所述消息中间件中的所述数据库操作日志,得到准实时数据及所述准实时数据的更新时间,并将所述准实时数据存储至KUDU数据库中;

获取预先创建的HIVE数据库,并基于所述HIVE数据库创建HIVE外部表,其中,所述HIVE数据库中的HIVE内部表存储所述更新时间之前的数据;

确定所述准实时数据在所述KUDU数据库中的存储路径,并将所述存储路径存储至所述HIVE外部表中;

当接收到数据查询请求时,根据所述数据查询请求确定查询终止时间;

当检测到所述查询终止时间为所述更新时间时,联合所述HIVE外部表与所述HIVE内部表,得到目标数据表;

利用所述数据查询请求查询所述目标数据表,得到所述数据查询请求的响应数据。

根据本发明优选实施例,所述根据所述数据库操作日志确定与所述服务器连接的消息中间件包括:

确定所述数据库操作日志的日志类型;

获取与所述日志类型对应的日志请求,并获取与所述服务器连接的中间件;

利用所述中间件解析所述日志请求,得到解析结果;

将所述解析结果指示成功解析所述日志请求的中间件确定为目标中间件,并确定所述目标中间件的解析效率;

将所述解析效率最高的目标中间件确定为所述消息中间件。

根据本发明优选实施例,所述消费并解析所述消息中间件中的所述数据库操作日志,得到准实时数据及所述准实时数据的更新时间,并将所述准实时数据存储至KUDU数据库中包括:

从所述消息中间件中获取配置标签库,并从所述配置标签库中获取第一预设标签及第二预设标签,其中,所述第一预设标签用于指示数据,所述第二预设标签用于指示时间;

从所述数据库操作日志中提取与所述第一预设标签对应的信息作为目标数据,并将所述目标数据的数据格式转换为预设格式,得到所述准实时数据;

从所述数据库操作日志中提取与所述第二预设标签对应的信息作为所述更新时间;

将所述准实时数据及所述更新时间填充至配置映射表,得到实时数据表,并将所述实时数据表发送至所述KUDU数据库。

根据本发明优选实施例,所述确定所述准实时数据在所述KUDU数据库中的存储路径,并将所述存储路径存储至所述HIVE外部表中包括:

利用所述第一预设标签遍历所述KUDU数据库;

当在所述KUDU数据库中遍历到所述第一预设标签时,将遍历到所述第一预设标签的路径确定为所述存储路径;

根据所述存储路径生成路径链接,并将所述路径链接写入所述HIVE外部表中。

根据本发明优选实施例,所述联合所述HIVE外部表与所述HIVE内部表,得到目标数据表包括:

确定所述HIVE外部表指示的所述存储路径中的第一数据量,并确定所述HIVE内部表的第二数据量;

当所述第一数据量大于所述第二数据量时,获取所述HIVE内部表的历史数据,并将所述历史数据写入所述实时数据表中,得到所述目标数据表;或者

当所述第一数据量小于或者等于所述第二数据量时,将所述准实时数据写入所述HIVE内部表中,得到所述目标数据表。

根据本发明优选实施例,所述根据所述数据查询请求确定查询终止时间包括:

解析所述数据查询请求的报文信息,得到所述报文信息携带的数据信息;

从所述数据信息中提取查询时间;

将所述查询时间中取值最大的时间确定为所述查询终止时间。

根据本发明优选实施例,所述利用所述数据查询请求查询所述目标数据表,得到所述数据查询请求的响应数据包括:

将所述查询时间中取值最小的时间确定为所述查询起始时间;

从所述目标数据表中获取大于所述查询起始时间的第一时间,并从所述目标数据表中获取小于所述查询起始时间的第二时间;

确定所述第一时间与所述第二时间的交集,得到目标时间;

从所述目标数据表中获取与所述目标时间对应的数据作为所述响应数据。

另一方面,本发明还提出一种准实时数据处理装置,运行于服务器中,所述准实时数据处理装置包括:

确定单元,用于当检测到数据库操作日志生成时,根据所述数据库操作日志确定与所述服务器连接的消息中间件,并将所述数据库操作日志同步至所述消息中间件;

消费单元,用于消费并解析所述消息中间件中的所述数据库操作日志,得到准实时数据及所述准实时数据的更新时间,并将所述准实时数据存储至KUDU数据库中;

创建单元,用于获取预先创建的HIVE数据库,并基于所述HIVE数据库创建HIVE外部表,其中,所述HIVE数据库中的HIVE内部表存储所述更新时间之前的数据;

存储单元,用于确定所述准实时数据在所述KUDU数据库中的存储路径,并将所述存储路径存储至所述HIVE外部表中;

所述确定单元,还用于当接收到数据查询请求时,根据所述数据查询请求确定查询终止时间;

联合单元,用于当检测到所述查询终止时间为所述更新时间时,联合所述HIVE外部表与所述HIVE内部表,得到目标数据表;

查询单元,用于利用所述数据查询请求查询所述目标数据表,得到所述数据查询请求的响应数据。

另一方面,本发明还提出一种服务器,所述服务器包括:

存储器,存储计算机可读指令;及

处理器,执行所述存储器中存储的计算机可读指令以实现所述准实时数据处理方法。

另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被服务器中的处理器执行以实现所述准实时数据处理方法。

由以上技术方案可以看出,本发明通过确定出与所述服务器连接的所述消息中间件,确保所述消息中间件能够成功解析所述数据库操作日志,通过所述消息中间件能够实时解析所述数据库操作日志,进而能够实时得到所述准实时数据,从而将所述准实时数据存储至指定的数据库中,提高存储效率,通过直接将所述准实时数据存储至所述KUDU数据库,进而缩小了所述存储路径的确定范围,从而能够快速确定出所述存储路径,由于所述HIVE外部表存储了所述准实时数据的存储路径,因此,所述目标数据表包含所述准实时数据,通过对所述目标数据表进行数据查询,能够查询到实时更新的所述准实时数据,提高了查询性能。本发明通过将所述KUDU数据库用于存储实时更新的准实时数据,并将所述HIVE数据库中的HIVE内部表用于存储所述更新时间之前的数据,由于无需实时将最新的准实时数据更新至所述HIVE数据库中,能够确保与所述HIVE数据库对应的大数据平台的性能,同时,在所述准实时数据未更新至所述HIVE数据库时,仍然能够查询到准实时数据,提高了查询性能。

附图说明

图1是本发明准实时数据处理方法的较佳实施例的流程图。

图2是本发明确定准实时数据和更新时间以及存储准实时数据的一实施例的流程图。

图3是本发明准实时数据处理方法的另一实施例的流程图。

图4是本发明准实时数据处理装置的较佳实施例的功能模块图。

图5是本发明实现准实时数据处理方法的较佳实施例的服务器的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。

如图1所示,是本发明准实时数据处理方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。

所述准实时数据处理方法应用于一个或者多个服务器中,所述服务器是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(DigitalSignal Processor,DSP)、嵌入式设备等。

所述服务器可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能穿戴式设备等。

所述服务器可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云。

所述服务器所处的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。

S10,当检测到数据库操作日志生成时,根据所述数据库操作日志确定与所述服务器连接的消息中间件,并将所述数据库操作日志同步至所述消息中间件。

在本发明的至少一个实施例中,所述数据库操作日志是指记载数据库操作的日志,其中,所述数据库操作包括数据更新、数据删除及数据新增等。

进一步地,所述消息中间件可以是Kafka服务器。

在本发明的至少一个实施例中,所述服务器根据所述数据库操作日志确定与所述服务器连接的消息中间件包括:

确定所述数据库操作日志的日志类型;

获取与所述日志类型对应的日志请求,并获取与所述服务器连接的中间件;

利用所述中间件解析所述日志请求,得到解析结果;

将所述解析结果指示成功解析所述日志请求的中间件确定为目标中间件,并确定所述目标中间件的解析效率;

将所述解析效率最高的目标中间件确定为所述消息中间件。

通过上述实施方式,能够获取到与所述服务器连接的中间件,进而利用与所述日志类型对应的日志请求,能够确定出能够成功解析所述日志类型的请求的目标中间件,进而从所述目标中间件中确定出解析效果最高的消息中间件,从而能够提高所述数据库操作日志的解析效率。

在本发明的至少一个实施例中,当确定出所述消息中间件时,所述服务器将所述数据库操作日志发送至所述消息中间件中,以便解析所述数据库操作日志。

S11,消费并解析所述消息中间件中的所述数据库操作日志,得到准实时数据及所述准实时数据的更新时间,并将所述准实时数据存储至KUDU数据库中。

在本发明的至少一个实施例中,所述服务器通过从所述消息中间件中拉取所述数据库操作日志进行消费,能够获取到所述数据库操作日志中所指示的操作,进而根据所指示的操作对所述数据库操作日志进行解析。

在本发明的至少一个实施例中,所述更新时间是指所述准实时数据在与所述数据库操作日志对应的数据库的更新时间。

所述KUDU数据库是指关系型数据库,所述KUDU数据库中的每个表由多个字段组成,每个表必须指定至少一个字段组成的主键。

参见图2,图2是本发明确定准实时数据和更新时间以及存储准实时数据的一实施例的流程图。在本发明的至少一个实施例中,所述服务器消费并解析所述消息中间件中的所述数据库操作日志,得到准实时数据及所述准实时数据的更新时间,并将所述准实时数据存储至KUDU数据库中包括:

S110,从所述消息中间件中获取配置标签库,并从所述配置标签库中获取第一预设标签及第二预设标签,其中,所述第一预设标签用于指示数据,所述第二预设标签用于指示时间。

其中,所述配置标签库中存储多个预先定义好的标签。

S111,从所述数据库操作日志中提取与所述第一预设标签对应的信息作为目标数据,并将所述目标数据的数据格式转换为预设格式,得到所述准实时数据。

其中,所述预设格式是指用户需要的数据格式,所述预设格式可以由用户自由设定,例如,所述预设格式可以是num(K,Y),其中,K为小于Y的整数,例如,若K为1,Y可以是8。所述预设格式还可以是一种集合格式等。

S112,从所述数据库操作日志中提取与所述第二预设标签对应的信息作为所述更新时间。

S113,将所述准实时数据及所述更新时间填充至配置映射表,得到实时数据表,并将所述实时数据表发送至所述KUDU数据库。

其中,所述配置映射表包括多个键值对,进一步地,所述配置映射表中的信息包括所述第一预设标签及所述第二预设标签。

通过所述消息中间件能够实时解析所述数据库操作日志,进而能够实时得到所述准实时数据,从而将所述准实时数据存储至指定的KUDU数据库中,提高存储效率。

S12,获取预先创建的HIVE数据库,并基于所述HIVE数据库创建HIVE外部表,其中,所述HIVE数据库中的HIVE内部表存储所述更新时间之前的数据。

在本发明的至少一个实施例中,所述HIVE数据库中存储的数据并未包含所述HIVE外部表指示的路径存储的数据。

S13,确定所述准实时数据在所述KUDU数据库中的存储路径,并将所述存储路径存储至所述HIVE外部表中。

在本发明的至少一个实施例中,所述存储路径是指存储所述准实时数据的直接路径。

在本发明的至少一个实施例中,所述服务器确定所述准实时数据在所述KUDU数据库中的存储路径,并将所述存储路径存储至所述HIVE外部表中包括:

利用所述第一预设标签遍历所述KUDU数据库;

当在所述KUDU数据库中遍历到所述第一预设标签时,将遍历到所述第一预设标签的路径确定为所述存储路径;

根据所述存储路径生成路径链接,并将所述路径链接写入所述HIVE外部表中。

通过与所述准实时数据对应的所述第一预设标签,能够准确确定出存储所述准实时数据的存储路径,进而将所述存储路径生成路径链接,为后续的数据查询提供了便利。

S14,当接收到数据查询请求时,根据所述数据查询请求确定查询终止时间。

在本发明的至少一个实施例中,所述数据查询请求可以由任意用户触发。所述查询终止时间是指所述数据查询请求中的最大查询时间。

在本发明的至少一个实施例中,所述服务器根据所述数据查询请求确定查询终止时间包括:

解析所述数据查询请求的报文信息,得到所述报文信息携带的数据信息;

从所述数据信息中提取查询时间;

将所述查询时间中取值最大的时间确定为所述查询终止时间。

通过上述实施方式,由于无需解析整个所述数据查询请求,因此,能够提高所述数据查询请求的解析效率,进而能够快速获取到所述查询时间,此外,通过上述方式,能够准确确定出所述查询起始时间及所述查询终止时间。

S15,当检测到所述查询终止时间为所述更新时间时,联合所述HIVE外部表与所述HIVE内部表,得到目标数据表。

在本发明的至少一个实施例中,当所述查询终止时间为所述更新时间时,也就是说,在所述HIVE数据库中无法查询到所述数据查询请求中的完整数据。

所述目标数据表中融合所述HIVE数据库中存储的历史数据与所述KUDU数据库中存储的准实时数据。

在本发明的至少一个实施例中,所述服务器联合所述HIVE外部表与所述HIVE内部表,得到目标数据表包括:

确定所述HIVE外部表指示的所述存储路径中的第一数据量,并确定所述HIVE内部表的第二数据量;

当所述第一数据量大于所述第二数据量时,获取所述HIVE内部表的历史数据,并将所述历史数据写入所述实时数据表中,得到所述目标数据表;或者

当所述第一数据量小于或者等于所述第二数据量时,将所述准实时数据写入所述HIVE内部表中,得到所述目标数据表。

通过确定出的所述第一数据量与所述第二数据量的大小比较,从而确定出所述目标数据表的生成方式,进而能够以合适的方式提高所述目标数据表的生成效率。

S16,利用所述数据查询请求查询所述目标数据表,得到所述数据查询请求的响应数据。

需要强调的是,为进一步保证上述响应数据的私密和安全性,上述响应数据还可以存储于一区块链的节点中。

在本发明的至少一个实施例中,所述响应数据是指响应所述数据查询请求后得到的数据。

在本发明的至少一个实施例中,所述服务器利用所述数据查询请求查询所述目标数据表,得到所述数据查询请求的响应数据包括:

将所述查询时间中取值最小的时间确定为所述查询起始时间;

从所述目标数据表中获取大于所述查询起始时间的第一时间,并从所述目标数据表中获取小于所述查询起始时间的第二时间;

确定所述第一时间与所述第二时间的交集,得到目标时间;

从所述目标数据表中获取与所述目标时间对应的数据作为所述响应数据。

通过确定出所述目标时间,进而能够快速从所述目标数据表中获取到所述响应数据,提高所述响应数据的查询效率,此外,通过所述目标数据表能够查询到实时更新的所述准实时数据。

进一步地,参见图3,图3是本发明准实时数据处理方法的另一实施例的流程图。本实施例是在图1至图2所示的准实时数据处理方法的基础进行改进得到的,如图3所示,本实施例在图1所示的步骤S16得到所述数据查询请求的响应数据后,所述方法还可包括如下步骤:

S20,获取所述数据查询请求的请求编号。

所述服务器从所述数据信息中获取所述请求编号。

S21,根据所述请求编号及所述响应数据生成提示信息。

所述提示信息用于提示所述响应数据的生成。

S22,采用对称加密技术加密所述提示信息,得到密文。

S23,将所述密文发送至指定联系人的终端设备。

其中,所述指定联系人可以是触发所述数据查询请求的用户。

所述终端设备可以是所述指定联系人的手机、平板、电脑等。

通过上述实施方式,能够及时生成所述提示信息,进而能够及时提醒所述指定联系人接收所述响应数据。

由以上技术方案可以看出,本发明通过确定出与所述服务器连接的所述消息中间件,确保所述消息中间件能够成功解析所述数据库操作日志,通过所述消息中间件能够实时解析所述数据库操作日志,进而能够实时得到所述准实时数据,从而将所述准实时数据存储至指定的数据库中,提高存储效率,通过直接将所述准实时数据存储至所述KUDU数据库,进而缩小了所述存储路径的确定范围,从而能够快速确定出所述存储路径,由于所述HIVE外部表存储了所述准实时数据的存储路径,因此,所述目标数据表包含所述准实时数据,通过对所述目标数据表进行数据查询,能够查询到实时更新的所述准实时数据,提高了查询性能。本发明通过将所述KUDU数据库用于存储实时更新的准实时数据,并将所述HIVE数据库中的HIVE内部表用于存储所述更新时间之前的数据,由于无需实时将最新的准实时数据更新至所述HIVE数据库中,能够确保与所述HIVE数据库对应的大数据平台的性能,同时,在所述准实时数据未更新至所述HIVE数据库时,仍然能够查询到准实时数据,提高了查询性能。

如图4所示,是本发明准实时数据处理装置的较佳实施例的功能模块图。所述准实时数据处理装置11包括确定单元110、消费单元111、创建单元112、存储单元113、联合单元114、查询单元115、获取单元116、生成单元117、加密单元118及发送单元119。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。

当检测到数据库操作日志生成时,确定单元110根据所述数据库操作日志确定与服务器连接的消息中间件,并将所述数据库操作日志同步至所述消息中间件。

在本发明的至少一个实施例中,所述数据库操作日志是指记载数据库操作的日志,其中,所述数据库操作包括数据更新、数据删除及数据新增等。

进一步地,所述消息中间件可以是Kafka服务器。

在本发明的至少一个实施例中,所述确定单元110根据所述数据库操作日志确定与所述服务器连接的消息中间件包括:

确定所述数据库操作日志的日志类型;

获取与所述日志类型对应的日志请求,并获取与所述服务器连接的中间件;

利用所述中间件解析所述日志请求,得到解析结果;

将所述解析结果指示成功解析所述日志请求的中间件确定为目标中间件,并确定所述目标中间件的解析效率;

将所述解析效率最高的目标中间件确定为所述消息中间件。

通过上述实施方式,能够获取到与所述服务器连接的中间件,进而利用与所述日志类型对应的日志请求,能够确定出能够成功解析所述日志类型的请求的目标中间件,进而从所述目标中间件中确定出解析效果最高的消息中间件,从而能够提高所述数据库操作日志的解析效率。

在本发明的至少一个实施例中,当确定出所述消息中间件时,所述确定单元110将所述数据库操作日志发送至所述消息中间件中,以便解析所述数据库操作日志。

消费单元111消费并解析所述消息中间件中的所述数据库操作日志,得到准实时数据及所述准实时数据的更新时间,并将所述准实时数据存储至KUDU数据库中。

在本发明的至少一个实施例中,所述消费单元111通过从所述消息中间件中拉取所述数据库操作日志进行消费,能够获取到所述数据库操作日志中所指示的操作,进而根据所指示的操作对所述数据库操作日志进行解析。

在本发明的至少一个实施例中,所述更新时间是指所述准实时数据在与所述数据库操作日志对应的数据库的更新时间。

所述KUDU数据库是指关系型数据库,所述KUDU数据库中的每个表由多个字段组成,每个表必须指定至少一个字段组成的主键。

在本发明的至少一个实施例中,所述消费单元111消费并解析所述消息中间件中的所述数据库操作日志,得到准实时数据及所述准实时数据的更新时间,并将所述准实时数据存储至KUDU数据库中包括:

从所述消息中间件中获取配置标签库,并从所述配置标签库中获取第一预设标签及第二预设标签,其中,所述第一预设标签用于指示数据,所述第二预设标签用于指示时间。

其中,所述配置标签库中存储多个预先定义好的标签。

从所述数据库操作日志中提取与所述第一预设标签对应的信息作为目标数据,并将所述目标数据的数据格式转换为预设格式,得到所述准实时数据。

其中,所述预设格式是指用户需要的数据格式,所述预设格式可以由用户自由设定,例如,所述预设格式可以是num(K,Y),其中,K为小于Y的整数,例如,若K为1,Y可以是8。所述预设格式还可以是一种集合格式等。

从所述数据库操作日志中提取与所述第二预设标签对应的信息作为所述更新时间。

将所述准实时数据及所述更新时间填充至配置映射表,得到实时数据表,并将所述实时数据表发送至所述KUDU数据库。

其中,所述配置映射表包括多个键值对,进一步地,所述配置映射表中的信息包括所述第一预设标签及所述第二预设标签。

通过所述消息中间件能够实时解析所述数据库操作日志,进而能够实时得到所述准实时数据,从而将所述准实时数据存储至指定的KUDU数据库中,提高存储效率。

创建单元112获取预先创建的HIVE数据库,并基于所述HIVE数据库创建HIVE外部表,其中,所述HIVE数据库中的HIVE内部表存储所述更新时间之前的数据。

在本发明的至少一个实施例中,所述HIVE数据库中存储的数据并未包含所述HIVE外部表指示的路径存储的数据。

存储单元113确定所述准实时数据在所述KUDU数据库中的存储路径,并将所述存储路径存储至所述HIVE外部表中。

在本发明的至少一个实施例中,所述存储路径是指存储所述准实时数据的直接路径。

在本发明的至少一个实施例中,所述存储单元113确定所述准实时数据在所述KUDU数据库中的存储路径,并将所述存储路径存储至所述HIVE外部表中包括:

利用所述第一预设标签遍历所述KUDU数据库;

当在所述KUDU数据库中遍历到所述第一预设标签时,将遍历到所述第一预设标签的路径确定为所述存储路径;

根据所述存储路径生成路径链接,并将所述路径链接写入所述HIVE外部表中。

通过与所述准实时数据对应的所述第一预设标签,能够准确确定出存储所述准实时数据的存储路径,进而将所述存储路径生成路径链接,为后续的数据查询提供了便利。

当接收到数据查询请求时,所述确定单元110根据所述数据查询请求确定查询终止时间。

在本发明的至少一个实施例中,所述数据查询请求可以由任意用户触发。所述查询终止时间是指所述数据查询请求中的最大查询时间。

在本发明的至少一个实施例中,所述确定单元110根据所述数据查询请求确定查询终止时间包括:

解析所述数据查询请求的报文信息,得到所述报文信息携带的数据信息;

从所述数据信息中提取查询时间;

将所述查询时间中取值最大的时间确定为所述查询终止时间。

通过上述实施方式,由于无需解析整个所述数据查询请求,因此,能够提高所述数据查询请求的解析效率,进而能够快速获取到所述查询时间,此外,通过上述方式,能够准确确定出所述查询起始时间及所述查询终止时间。

当检测到所述查询终止时间为所述更新时间时,联合单元114联合所述HIVE外部表与所述HIVE内部表,得到目标数据表。

在本发明的至少一个实施例中,当所述查询终止时间为所述更新时间时,也就是说,在所述HIVE数据库中无法查询到所述数据查询请求中的完整数据。

所述目标数据表中融合所述HIVE数据库中存储的历史数据与所述KUDU数据库中存储的准实时数据。

在本发明的至少一个实施例中,所述联合单元114联合所述HIVE外部表与所述HIVE内部表,得到目标数据表包括:

确定所述HIVE外部表指示的所述存储路径中的第一数据量,并确定所述HIVE内部表的第二数据量;

当所述第一数据量大于所述第二数据量时,获取所述HIVE内部表的历史数据,并将所述历史数据写入所述实时数据表中,得到所述目标数据表;或者

当所述第一数据量小于或者等于所述第二数据量时,将所述准实时数据写入所述HIVE内部表中,得到所述目标数据表。

通过确定出的所述第一数据量与所述第二数据量的大小比较,从而确定出所述目标数据表的生成方式,进而能够以合适的方式提高所述目标数据表的生成效率。

查询单元115利用所述数据查询请求查询所述目标数据表,得到所述数据查询请求的响应数据。

需要强调的是,为进一步保证上述响应数据的私密和安全性,上述响应数据还可以存储于一区块链的节点中。

在本发明的至少一个实施例中,所述响应数据是指响应所述数据查询请求后得到的数据。

在本发明的至少一个实施例中,所述查询单元115利用所述数据查询请求查询所述目标数据表,得到所述数据查询请求的响应数据包括:

将所述查询时间中取值最小的时间确定为所述查询起始时间;

从所述目标数据表中获取大于所述查询起始时间的第一时间,并从所述目标数据表中获取小于所述查询起始时间的第二时间;

确定所述第一时间与所述第二时间的交集,得到目标时间;

从所述目标数据表中获取与所述目标时间对应的数据作为所述响应数据。

通过确定出所述目标时间,进而能够快速从所述目标数据表中获取到所述响应数据,提高所述响应数据的查询效率,此外,通过所述目标数据表能够查询到实时更新的所述准实时数据。

在本发明至少一个实施例中,在得到所述数据查询请求的响应数据后,获取单元116获取所述数据查询请求的请求编号。

所述服务器从所述数据信息中获取所述请求编号。

生成单元117根据所述请求编号及所述响应数据生成提示信息。

所述提示信息用于提示所述响应数据的生成。

加密单元118采用对称加密技术加密所述提示信息,得到密文。

发送单元119将所述密文发送至指定联系人的终端设备。

其中,所述指定联系人可以是触发所述数据查询请求的用户。

所述终端设备可以是所述指定联系人的手机、平板、电脑等。

通过上述实施方式,能够及时生成所述提示信息,进而能够及时提醒所述指定联系人接收所述响应数据。

由以上技术方案可以看出,本发明通过确定出与所述服务器连接的所述消息中间件,确保所述消息中间件能够成功解析所述数据库操作日志,通过所述消息中间件能够实时解析所述数据库操作日志,进而能够实时得到所述准实时数据,从而将所述准实时数据存储至指定的数据库中,提高存储效率,通过直接将所述准实时数据存储至所述KUDU数据库,进而缩小了所述存储路径的确定范围,从而能够快速确定出所述存储路径,由于所述HIVE外部表存储了所述准实时数据的存储路径,因此,所述目标数据表包含所述准实时数据,通过对所述目标数据表进行数据查询,能够查询到实时更新的所述准实时数据,提高了查询性能。本发明通过将所述KUDU数据库用于存储实时更新的准实时数据,并将所述HIVE数据库中的HIVE内部表用于存储所述更新时间之前的数据,由于无需实时将最新的准实时数据更新至所述HIVE数据库中,能够确保与所述HIVE数据库对应的大数据平台的性能,同时,在所述准实时数据未更新至所述HIVE数据库时,仍然能够查询到准实时数据,提高了查询性能。

如图5所示,是本发明实现准实时数据处理方法的较佳实施例的服务器的结构示意图。

在本发明的一个实施例中,所述服务器1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机可读指令,例如准实时数据处理程序。

本领域技术人员可以理解,所述示意图仅仅是服务器1的示例,并不构成对服务器1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务器1还可以包括输入输出设备、网络接入设备、总线等。

所述处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述服务器1的运算核心和控制中心,利用各种接口和线路连接整个服务器1的各个部分,及执行所述服务器1的操作系统以及安装的各类应用程序、程序代码等。

示例性的,所述计算机可读指令可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该计算机可读指令段用于描述所述计算机可读指令在所述服务器1中的执行过程。例如,所述计算机可读指令可以被分割成确定单元110、消费单元111、创建单元112、存储单元113、联合单元114、查询单元115、获取单元116、生成单元117、加密单元118及发送单元119。

所述存储器12可用于存储所述计算机可读指令和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机可读指令和/或模块,以及调用存储在存储器12内的数据,实现所述服务器1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。存储器12可以包括非易失性和易失性存储器,例如:硬盘、内存、插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。

所述存储器12可以是服务器1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。

所述服务器1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。

其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

结合图1,所述服务器1中的所述存储器12存储计算机可读指令实现一种准实时数据处理方法,所述处理器13可执行所述计算机可读指令从而实现:

当检测到数据库操作日志生成时,根据所述数据库操作日志确定与所述服务器连接的消息中间件,并将所述数据库操作日志同步至所述消息中间件;

消费并解析所述消息中间件中的所述数据库操作日志,得到准实时数据及所述准实时数据的更新时间,并将所述准实时数据存储至KUDU数据库中;

获取预先创建的HIVE数据库,并基于所述HIVE数据库创建HIVE外部表,其中,所述HIVE数据库中的HIVE内部表存储所述更新时间之前的数据;

确定所述准实时数据在所述KUDU数据库中的存储路径,并将所述存储路径存储至所述HIVE外部表中;

当接收到数据查询请求时,根据所述数据查询请求确定查询终止时间;

当检测到所述查询终止时间为所述更新时间时,联合所述HIVE外部表与所述HIVE内部表,得到目标数据表;

利用所述数据查询请求查询所述目标数据表,得到所述数据查询请求的响应数据。

具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:

当检测到数据库操作日志生成时,根据所述数据库操作日志确定与所述服务器连接的消息中间件,并将所述数据库操作日志同步至所述消息中间件;

消费并解析所述消息中间件中的所述数据库操作日志,得到准实时数据及所述准实时数据的更新时间,并将所述准实时数据存储至KUDU数据库中;

获取预先创建的HIVE数据库,并基于所述HIVE数据库创建HIVE外部表,其中,所述HIVE数据库中的HIVE内部表存储所述更新时间之前的数据;

确定所述准实时数据在所述KUDU数据库中的存储路径,并将所述存储路径存储至所述HIVE外部表中;

当接收到数据查询请求时,根据所述数据查询请求确定查询终止时间;

当检测到所述查询终止时间为所述更新时间时,联合所述HIVE外部表与所述HIVE内部表,得到目标数据表;

利用所述数据查询请求查询所述目标数据表,得到所述数据查询请求的响应数据。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。所述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号