首页> 中国专利> 一种区块链和数字金融的业务数据处理方法及大数据平台

一种区块链和数字金融的业务数据处理方法及大数据平台

摘要

本申请实施例提供的一种区块链和数字金融的业务数据处理方法及大数据平台,首先根据权限调用记录获取第一区块链节点在目标业务数据中所提取的业务行为信息的当前权限请求,其次基于预先配置的数据爬虫分布信息确定第二区块链节点相对于第一区块链节点的历史权限请求列表,然后在判断出历史权限请求列表中存在与当前权限请求相匹配的目标权限请求时,确定目标权限请求的调用环境参数,最后在基于调用环境参数检测出目标业务数据中存在数据爬虫脚本时,拦截第一区块链节点输出的数据处理结果。如此,能够准确可靠地检测出业务数据中存在的爬虫脚本并进行对应的防爬取操作,避免第一区块链节点的用户隐私数据随着输出的数据处理结果被非法爬取。

著录项

  • 公开/公告号CN112765434A

    专利类型发明专利

  • 公开/公告日2021-05-07

    原文格式PDF

  • 申请/专利权人 王红建;

    申请/专利号CN202110058249.8

  • 发明设计人 王红建;

    申请日2020-08-22

  • 分类号G06F16/951(20190101);G06F21/62(20130101);G06Q40/00(20120101);

  • 代理机构

  • 代理人

  • 地址 650106 云南省昆明市高新区海源中路1520号A幢6楼502号

  • 入库时间 2023-06-19 10:54:12

说明书

技术领域

本申请涉及区块链金融技术领域,尤其涉及一种区块链和数字金融的业务数据处理方法及大数据平台。

背景技术

随着网络科技的发展,数字金融服务已逐渐开始取代传统金融服务,为社会发展提供便捷、高效的服务。现如今,数字金融服务包括互联网支付、移动支付、网上银行、金融服务外包及网上贷款、网上保险、网上基金等金融服务。此外,将区块链技术应用到数字金融领域,能够利用区块链技术的去中心化、可追溯性以及不可篡改性实现相关的用户隐私数据的保护。

然而在实际运用时,进行业务行为处理的每个区块链节点虽然能够对用户的隐私数据的保护,但是无法应对越来越复杂的数字金融业务场景,这使得一些编写了异常爬虫的数据会对区块链节点的用户隐私数据进行爬取。这样以来,虽然区块链技术能够确保用户隐私数据和交易行为数据不被篡改,但是在一定程度上无法避免用户隐私数据被爬取。

发明内容

本申请提供一种区块链和数字金融的业务数据处理方法及大数据平台,以改善现有技术存在的上述技术问题。

第一方面,用以提供一种区块链和数字金融的业务数据处理方法,应用于大数据平台,所述方法至少包括:

根据第一区块链节点在处理第二区块链节点发送的目标业务数据时的权限调用记录,获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求;

基于预先配置的数据爬虫分布信息,确定所述第二区块链节点相对于所述第一区块链节点的历史权限请求列表;

判断所述历史权限请求列表中是否存在与所述当前权限请求相匹配的目标权限请求;

在判断出所述历史权限请求列表中存在与所述当前权限请求相匹配的目标权限请求时,根据所述目标权限请求对应的请求数据在所述第一区块链节点中的存储路径信息确定所述目标权限请求的调用环境参数;基于所述调用环境参数检测所述目标业务数据中是否存在数据爬虫脚本;在检测出所述调用环境参数检测所述目标业务数据中存在所述数据爬虫脚本时,拦截所述第一区块链节点基于所述目标业务数据所输出的数据处理结果。

第二方面,用以提供一种大数据平台,用于执行一种区块链和数字金融的业务数据处理方法,所述大数据平台至少用于:

根据第一区块链节点在处理第二区块链节点发送的目标业务数据时的权限调用记录,获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求;

基于预先配置的数据爬虫分布信息,确定所述第二区块链节点相对于所述第一区块链节点的历史权限请求列表;

判断所述历史权限请求列表中是否存在与所述当前权限请求相匹配的目标权限请求;

在判断出所述历史权限请求列表中存在与所述当前权限请求相匹配的目标权限请求时,根据所述目标权限请求对应的请求数据在所述第一区块链节点中的存储路径信息确定所述目标权限请求的调用环境参数;基于所述调用环境参数检测所述目标业务数据中是否存在数据爬虫脚本;在检测出所述调用环境参数检测所述目标业务数据中存在所述数据爬虫脚本时,拦截所述第一区块链节点基于所述目标业务数据所输出的数据处理结果。

本申请实施例提供的一种区块链和数字金融的业务数据处理方法及大数据平台,首先根据第一区块链节点在处理第二区块链节点发送的目标业务数据时的权限调用记录获取第一区块链节点在目标业务数据中所提取的业务行为信息的当前权限请求,其次基于预先配置的数据爬虫分布信息确定第二区块链节点相对于第一区块链节点的历史权限请求列表,然后在判断出历史权限请求列表中存在与当前权限请求相匹配的目标权限请求时,确定目标权限请求的调用环境参数,最后在基于调用环境参数检测出目标业务数据中存在数据爬虫脚本时,拦截第一区块链节点输出的数据处理结果。如此,能够准确可靠地检测出业务数据中存在的爬虫脚本并进行对应的防爬取操作,避免第一区块链节点的用户隐私数据随着输出的数据处理结果被非法爬取。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

图1是本申请根据一示例性实施例示出的一种区块链和数字金融的业务数据处理系统的示意图。

图2是本申请根据一示例性实施例示出的一种区块链和数字金融的业务数据处理方法的流程图。

图3是本申请根据一示例性实施例示出的一种区块链和数字金融的业务数据处理装置的一个实施例框图。

图4为本申请一种区块链和数字金融的业务数据处理装置所在的大数据平台的一种硬件结构图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

发明人对现有的区块链节点的业务流程进行分析发现,这些业务流程通常限于共识机制、加密算法以及不可伪造等功能。也就是说,区块链节点通常只能进行“被动”的数据防御,无法主动地对业务数据进行爬虫脚本的检测以实现“主动”的数据防御,因而难以避免用户隐私数据被非法爬取。

为了对业务数据进行爬虫脚本的检测以实现“主动”的数据防御,从而避免区块链节点的用户隐私数据被非法爬取,本发明实施例提供了一种区块链和数字金融的业务数据处理方法及大数据平台,能够将爬虫脚本的检测进行云端化,从而对区块链节点对应的业务数据进行统一的爬虫脚本检测,从而准确可靠地检测出业务数据中存在的爬虫脚本并进行对应的防爬取操作,这样能够避免区块链节点的用户隐私数据被非法爬取。

为了实现上述目的,请首先参阅图1,为一种区块链和数字金融的业务数据处理系统100的通信架构示意图,所述业务数据处理系统100可以包括大数据平台200和多个区块链节点400。其中,大数据平台200和多个区块链节点400互相之间通信连接。进一步地,请结合参阅图2,为一种区块链和数字金融的业务数据处理方法的流程图,所述方法可以应用于图1中的大数据平台200,具体可以包括步骤S21-步骤S24所描述的内容。

步骤S21,根据第一区块链节点在处理第二区块链节点发送的目标业务数据时的权限调用记录,获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求。

例如,目标业务数据可以是第二区块链节点与第一区块链节点进行在线支付行为或者其他金融服务行为的数据,包括但不限于支付验证数据、支付授权数据和支付查询数据等。

步骤S22,基于预先配置的数据爬虫分布信息,确定所述第二区块链节点相对于所述第一区块链节点的历史权限请求列表。

例如,数据爬虫分布信息是根据多个不同的数据爬虫脚本的脚本代码进行设置的,历史权限请求列表用于记录第二区块链节点请求第一区块链节点的权限开通的历史记录。

步骤S23,判断所述历史权限请求列表中是否存在与所述当前权限请求相匹配的目标权限请求。

例如,目标权限请求用于表征第二区块链节点对第一区块链节点的权限请求存在“越界”行为,换句话说,第二区块链节点对第一区块链节点的权限请求可能存在异常或者过度请求权限。

步骤S24,在判断出所述历史权限请求列表中存在与所述当前权限请求相匹配的目标权限请求时,根据所述目标权限请求对应的请求数据在所述第一区块链节点中的存储路径信息确定所述目标权限请求的调用环境参数;基于所述调用环境参数检测所述目标业务数据中是否存在数据爬虫脚本;在检测出所述调用环境参数检测所述目标业务数据中存在所述数据爬虫脚本时,拦截所述第一区块链节点基于所述目标业务数据所输出的数据处理结果。

例如,数据处理结果可以是第一区块链节点基于目标业务数据作出的响应数据对应的处理结果,数据处理结果中可能携带第一区块链节点的隐私信息例如用户身份信息、用户决策因子信息等。

在具体实施时,通过执行上述步骤S21-步骤S24所描述的内容,首先根据第一区块链节点在处理第二区块链节点发送的目标业务数据时的权限调用记录获取第一区块链节点在目标业务数据中所提取的业务行为信息的当前权限请求,其次基于预先配置的数据爬虫分布信息确定第二区块链节点相对于第一区块链节点的历史权限请求列表,然后在判断出历史权限请求列表中存在与当前权限请求相匹配的目标权限请求时,确定目标权限请求的调用环境参数,最后在基于调用环境参数检测出目标业务数据中存在数据爬虫脚本时,拦截第一区块链节点输出的数据处理结果。如此,能够准确可靠地检测出业务数据中存在的爬虫脚本并进行对应的防爬取操作,避免第一区块链节点的用户隐私数据随着输出的数据处理结果被非法爬取。

在实际应用时发明人发现,在确定调用环境参数时,通常会出现确定出的调用环境参数存在偏差的技术问题,这样会导致在检测数据爬虫脚本时出现漏检。为改善这一技术问题,步骤S24所描述的根据所述目标权限请求对应的请求数据在所述第一区块链节点中的存储路径信息确定所述目标权限请求的调用环境参数,具体可以包括以下步骤S241-步骤S243所描述的内容。

步骤S241,按照所述目标权限请求在预设映射列表中的类别映射值所对应的报文字段分布特征对所述目标权限请求进行请求报文的拆分,得到报文头信息和报文主体信息;从所述报文主体信息中获取存在指向性标识的目标信息段并提取所述目标信息段中的报文数据以作为所述目标权限请求对应的请求数据。

步骤S242,基于与所述第一区块链节点预先建立的数据传输通道的通道协议层文本确定所述第一区块链节点在所述大数据平台中的对应存储区;将所述对应存储区的存储地址列出得到存储地址序列,根据所述通道协议层文本对所述存储地址序列进行映射,得到在所述第一区块链节点中的映射地址序列;将所述请求数据中的多段报文数据按照时序先后依次与所述映射地址序列进行配对得到配对结果,基于所述配对结果确定所述请求数据在所述第一区块链节点中的存储路径信息。

步骤S243,提取所述存储路径信息中不随所述目标权限请求的请求优先级的变化而更新的路径参数集,通过所述路径参数集确定所述目标权限请求的调用环境参数。

可以理解,在应用上述步骤S241-步骤S243所描述的内容时,能够准确提取目标权限请求中的请求数据,并按照时序确定出存储路径信息,从而提取存储路径信息中不随所述目标权限请求的请求优先级的变化而更新的路径参数集,以确保确定出的调用环境参数不会存在偏差,这样可以避免在后续检测数据爬虫脚本时出现漏检的问题。

在一个具体的实施方式中,为了确保调用环境参数的完整性和特征区分度,步骤S243所描述的通过所述路径参数集确定所述目标权限请求的调用环境参数,具体可以包括以下内容:提取所述路径参数集中的第一路径分布轨迹和第二路径分布轨迹,根据所述第一路径分布轨迹和所述第二路径分布轨迹确定所述目标权限请求的调用环境参数;其中,所述第一路径分布轨迹用于表征所述路径参数集中的动态参数对应的分布轨迹,所述第二路径分布轨迹用于表征所述路径参数集中的静态参数对应的分布轨迹。这样以来,通过第一路径分布轨迹和第二路径分布轨迹能够确保调用环境参数的完整性和特征区分度。

进一步地,步骤S2431-步骤S2434给出了提取所述路径参数集中的第一路径分布轨迹和第二路径分布轨迹,根据所述第一路径分布轨迹和所述第二路径分布轨迹确定所述目标权限请求的调用环境参数的具体实现方式。

步骤S2431,根据所述路径参数集对应的参数分布标签确定所述路径参数集对应的多个路径节点;其中,每个路径节点中所封装的路径参数不同,每个路径节点具有不同的路径优先级。

步骤S2432,按照所述路径优先级的由大到小的顺序将所述路径节点进行排序得到路径节点排序序列,并按照所述路径节点中所封装的路径参数的参数特征间隔抓取所述路径节点排序序列中的多个第一路径节点以作为第一节点集,然后将所述路径节点排序序列中的剩余的第二路径节点确定为第二节点集;根据所述路径节点排序序列在所述第一节点集中的路径节点以及所述路径节点的队列信息确定所述路径节点排序序列在所述第二节点集中的各路径节点与所述路径节点排序序列在所述第一节点集中的各路径节点之间的节点重定向系数,并根据所述节点重定向系将所述路径节点排序序列在所述第二节点集中的与在所述第一节点集中的路径节点之间存在重定向配对标识的路径节点迁移到所述第一节点集中;根据完成节点迁移的第一节点集以及完成节点迁移的第二节点集生成所述第一路径分布轨迹以及所述第二路径分布轨迹。

步骤S2433,构建所述第一路径分布轨迹的第一轨迹描述信息以及所述第二路径分布轨迹的第二轨迹描述信息,并判断所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数是否低于预设系数;若所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数不低于所述预设系数则根据第一轨迹描述信息的互动轨迹数据对所述第二轨迹描述信息进行迭代更新,直至所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数低于所述预设系数;其中,在所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数低于所述预设系数时所述第一轨迹描述信息和所述第二轨迹描述信息中分别包括多个具有不同环境指标因子的调用数据。

步骤S2434,从所述第一轨迹描述信息中选取出任意一个调用数据作为待检测调用数据并将所述待检测调用数据的调用权限特征映射到所述第二轨迹描述信息中具有最大环境指标因子的目标调用数据中,以在所述目标调用数据中计算所述调用权限特征的特征区分度;根据所述特征区分度、所述第一轨迹描述信息中的调用数据和所述第二轨迹描述信息中的调用数据确定所述目标权限请求的调用环境参数。

如此,基于上述步骤S2431-步骤S2434,能够确保调用环境参数的完整性和特征区分度。

在一种可能的情况下,发明人发现,在检测数据爬虫脚本时,可能会由于数据爬虫脚本与目标业务数据中的正常数据脚本之间的相似性过高而导致数据爬虫脚本的“隐蔽性”较强,因而可能无法准确可靠地检测出数据爬虫脚本,为改善这一技术问题,步骤S24所描述的基于所述调用环境参数检测所述目标业务数据中是否存在数据爬虫脚本,示例性地可以包括以下步骤a-步骤e所描述的内容。

步骤a,在需要对所述调用环境参数进行数据调用模拟的情况下,获得所述目标业务数据的数据转码配置信息。

步骤b,当所述数据转码配置信息中的数据转码标识符对应的满载字段长度小于所述目标业务数据中的满载字段长度时,确定是否存在有需要忽略的处于可调用状态的第一数据字段;其中,所述第一数据字段为所述目标业务数据中的数据字段。

步骤c,当存在有需要忽略的第一数据字段时,针对每个第一数据字段生成对应的字段忽略标识符,并将所述字段忽略标识符的当前状态调整为激活状态以使得所述目标业务数据中仅保留可调用的第二数据字段。

步骤d,开启数据调用模拟,将预设的样本数据放入调用池中;其中,所述样本数据包括第一样本数据和第二样本数据,所述第一样本数据为非隐私数据,所述第二样本数据为隐私数据。

步骤e,执行所述第二数据字段对应的业务线程以对所述调用池中的样本数据进行调用并获得调用结果;判断所述调用结果中是否存在所述第二样本数据;若存在,则判定所述目标业务数据中存在数据爬虫脚本;若不存在,则返回确定是否存在有需要忽略的处于可调用状态的第一数据字段的步骤,直至对所述目标业务数据的所有数据字段完成遍历。

可以理解,通过上述步骤a-步骤e,能够在检测数据爬虫脚本时,避免对数据爬虫脚本与目标业务数据中的正常数据脚本进行相似性比较,而是通过数据调用模拟来侧面规避数据爬虫脚本的“隐蔽性”较强的问题,从而基于样本数据中隐私数据的调用情况来准确可靠地检测出数据爬虫脚本。

在一种可替换的实施方式中,步骤S21所描述的根据第一区块链节点在处理第二区块链节点发送的目标业务数据时的权限调用记录,获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求,示例性地可以包括以下步骤S211-步骤S214所描述的内容。

步骤S211,获取所述第一区块链节点在处理第二区块链节点发送的目标业务数据时的线程运行记录,以及所述第二区块链节点对应的业务请求记录;将所述线程运行记录和所述业务请求记录按照时序配对关系进行整合,得到两组记录队列。

步骤S212,获取每个所述记录队列的权限执行数据以及与所述记录队列对应的局部线程运行记录;其中,所述局部线程运行记录是所述线程运行记录的一部分。

步骤S213,根据每个所述记录队列的权限执行数据和所述局部线程运行记录,计算将每个所述记录队列仿射变换至所述线程运行记录中时的权限授权系数,所述权限授权系数包括业务行为授权系数。

步骤S214,在所述业务行为授权系数落入设定系数区间时,根据所述两组记录队列中队列集中度较大的记录队列获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求;在所述业务行为授权系数未落入设定系数区间时,根据所述两组记录队列中队列集中度较小的记录队列获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求。

如此,能够基于上述步骤S211-步骤S214确保当前权限请求的实时性和可信度。

在实际应用时,为了完整地确定历史权限请求列表,步骤S22所描述的基于预先配置的数据爬虫分布信息,确定所述第二区块链节点相对于所述第一区块链节点的历史权限请求列表,具体可以通过以下步骤S221-步骤S223所描述的内容实现。

步骤S221,确定所述数据爬虫分布信息的URL队列,根据所述URL队列,从预设数据库中查找满足所述URL队列的多个文本分类器的样本分布信息、属性分布信息和决策因子信息;所述样本分布信息包括正样本信息和负样本信息。

步骤S222,基于所述多个文本分类器的样本分布信息、属性分布信息和决策因子信息分析所述第二区块链节点的业务互动报表,从所述第二区块链节点的业务互动报表中分析出同时满足所述样本分布信息、属性分布信息和决策因子信息之间的互动相关度的互动行为数据。

步骤S223,根据所述互动行为数据中的第二区块链节点主动发起的链接请求数据确定所述历史权限请求列表。

这样,能够通过应用上述步骤S221-步骤S223完整地确定历史权限请求列表。

在一个可能的实施方式中,步骤S23所描述的判断所述历史权限请求列表中是否存在与所述当前权限请求相匹配的目标权限请求,具体可以包括以下步骤S231和步骤S232所描述的内容。

步骤S231,将所述历史权限请求列表中的每个待匹配权限请求列出,并计算每个待匹配权限请求的请求响应度。

步骤S232,根据所述待匹配权限请求的请求响应度与所述当前权限请求的关联系数判断所述待匹配权限请求是否为所述目标权限请求;若所述待匹配权限请求的请求响应度与所述当前权限请求的关联系数大于目标系数,则确定所述待匹配权限请求为所述目标权限请求;若所述待匹配权限请求的请求响应度与所述当前权限请求的关联系数小于等于所述目标系数,则确定所述待匹配权限请求不为所述目标权限请求。

可以理解,基于上述步骤S231和步骤S232,能够准确判断历史权限请求列表中是否存在与当前权限请求相匹配的目标权限请求。

基于上述同样的发明构思,提供一种大数据平台,具体描述如下。

一种大数据平台,用于执行一种区块链和数字金融的业务数据处理方法,所述大数据平台至少用于:

根据第一区块链节点在处理第二区块链节点发送的目标业务数据时的权限调用记录,获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求;

基于预先配置的数据爬虫分布信息,确定所述第二区块链节点相对于所述第一区块链节点的历史权限请求列表;

判断所述历史权限请求列表中是否存在与所述当前权限请求相匹配的目标权限请求;

在判断出所述历史权限请求列表中存在与所述当前权限请求相匹配的目标权限请求时,根据所述目标权限请求对应的请求数据在所述第一区块链节点中的存储路径信息确定所述目标权限请求的调用环境参数;基于所述调用环境参数检测所述目标业务数据中是否存在数据爬虫脚本;在检测出所述调用环境参数检测所述目标业务数据中存在所述数据爬虫脚本时,拦截所述第一区块链节点基于所述目标业务数据所输出的数据处理结果。

可替换地,所述大数据平台根据所述目标权限请求对应的请求数据在所述第一区块链节点中的存储路径信息确定所述目标权限请求的调用环境参数具体包括:

按照所述目标权限请求在预设映射列表中的类别映射值所对应的报文字段分布特征对所述目标权限请求进行请求报文的拆分,得到报文头信息和报文主体信息;从所述报文主体信息中获取存在指向性标识的目标信息段并提取所述目标信息段中的报文数据以作为所述目标权限请求对应的请求数据;

基于与所述第一区块链节点预先建立的数据传输通道的通道协议层文本确定所述第一区块链节点在所述大数据平台中的对应存储区;将所述对应存储区的存储地址列出得到存储地址序列,根据所述通道协议层文本对所述存储地址序列进行映射,得到在所述第一区块链节点中的映射地址序列;将所述请求数据中的多段报文数据按照时序先后依次与所述映射地址序列进行配对得到配对结果,基于所述配对结果确定所述请求数据在所述第一区块链节点中的存储路径信息;

提取所述存储路径信息中不随所述目标权限请求的请求优先级的变化而更新的路径参数集,通过所述路径参数集确定所述目标权限请求的调用环境参数。

可替换地,所述大数据平台通过所述路径参数集确定所述目标权限请求的调用环境参数进一步包括:

提取所述路径参数集中的第一路径分布轨迹和第二路径分布轨迹;

根据所述第一路径分布轨迹和所述第二路径分布轨迹确定所述目标权限请求的调用环境参数;其中,所述第一路径分布轨迹用于表征所述路径参数集中的动态参数对应的分布轨迹,所述第二路径分布轨迹用于表征所述路径参数集中的静态参数对应的分布轨迹。

可替换地,所述大数据平台提取所述路径参数集中的第一路径分布轨迹和第二路径分布轨迹,根据所述第一路径分布轨迹和所述第二路径分布轨迹确定所述目标权限请求的调用环境参数更进一步包括:

根据所述路径参数集对应的参数分布标签确定所述路径参数集对应的多个路径节点;其中,每个路径节点中所封装的路径参数不同,每个路径节点具有不同的路径优先级;

按照所述路径优先级的由大到小的顺序将所述路径节点进行排序得到路径节点排序序列,并按照所述路径节点中所封装的路径参数的参数特征间隔抓取所述路径节点排序序列中的多个第一路径节点以作为第一节点集,然后将所述路径节点排序序列中的剩余的第二路径节点确定为第二节点集;根据所述路径节点排序序列在所述第一节点集中的路径节点以及所述路径节点的队列信息确定所述路径节点排序序列在所述第二节点集中的各路径节点与所述路径节点排序序列在所述第一节点集中的各路径节点之间的节点重定向系数,并根据所述节点重定向系将所述路径节点排序序列在所述第二节点集中的与在所述第一节点集中的路径节点之间存在重定向配对标识的路径节点迁移到所述第一节点集中;根据完成节点迁移的第一节点集以及完成节点迁移的第二节点集生成所述第一路径分布轨迹以及所述第二路径分布轨迹;

构建所述第一路径分布轨迹的第一轨迹描述信息以及所述第二路径分布轨迹的第二轨迹描述信息,并判断所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数是否低于预设系数;若所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数不低于所述预设系数则根据第一轨迹描述信息的互动轨迹数据对所述第二轨迹描述信息进行迭代更新,直至所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数低于所述预设系数;其中,在所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数低于所述预设系数时所述第一轨迹描述信息和所述第二轨迹描述信息中分别包括多个具有不同环境指标因子的调用数据;

从所述第一轨迹描述信息中选取出任意一个调用数据作为待检测调用数据并将所述待检测调用数据的调用权限特征映射到所述第二轨迹描述信息中具有最大环境指标因子的目标调用数据中,以在所述目标调用数据中计算所述调用权限特征的特征区分度;根据所述特征区分度、所述第一轨迹描述信息中的调用数据和所述第二轨迹描述信息中的调用数据确定所述目标权限请求的调用环境参数。

可替换地,所述大数据平台基于所述调用环境参数检测所述目标业务数据中是否存在数据爬虫脚本包括:

在需要对所述调用环境参数进行数据调用模拟的情况下,获得所述目标业务数据的数据转码配置信息;

当所述数据转码配置信息中的数据转码标识符对应的满载字段长度小于所述目标业务数据中的满载字段长度时,确定是否存在有需要忽略的处于可调用状态的第一数据字段;其中,所述第一数据字段为所述目标业务数据中的数据字段;

当存在有需要忽略的第一数据字段时,针对每个第一数据字段生成对应的字段忽略标识符,并将所述字段忽略标识符的当前状态调整为激活状态以使得所述目标业务数据中仅保留可调用的第二数据字段;

开启数据调用模拟,将预设的样本数据放入调用池中;其中,所述样本数据包括第一样本数据和第二样本数据,所述第一样本数据为非隐私数据,所述第二样本数据为隐私数据;

执行所述第二数据字段对应的业务线程以对所述调用池中的样本数据进行调用并获得调用结果;判断所述调用结果中是否存在所述第二样本数据;若存在,则判定所述目标业务数据中存在数据爬虫脚本;若不存在,则返回确定是否存在有需要忽略的处于可调用状态的第一数据字段的步骤,直至对所述目标业务数据的所有数据字段完成遍历。

基于上述同样的发明构思,还提供了如图3所示的一种区块链和数字金融的业务数据处理装置300的示意图,关于该业务数据处理装置300的描述如下。

A1.一种区块链和数字金融的业务数据处理装置300,应用于大数据平台,所述装置至少包括:

请求获取模块310,用于根据第一区块链节点在处理第二区块链节点发送的目标业务数据时的权限调用记录,获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求;具体用于:获取所述第一区块链节点在处理第二区块链节点发送的目标业务数据时的线程运行记录,以及所述第二区块链节点对应的业务请求记录;将所述线程运行记录和所述业务请求记录按照时序配对关系进行整合,得到两组记录队列;获取每个所述记录队列的权限执行数据以及与所述记录队列对应的局部线程运行记录;其中,所述局部线程运行记录是所述线程运行记录的一部分;根据每个所述记录队列的权限执行数据和所述局部线程运行记录,计算将每个所述记录队列仿射变换至所述线程运行记录中时的权限授权系数,所述权限授权系数包括业务行为授权系数;在所述业务行为授权系数落入设定系数区间时,根据所述两组记录队列中队列集中度较大的记录队列获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求;在所述业务行为授权系数未落入设定系数区间时,根据所述两组记录队列中队列集中度较小的记录队列获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求;

列表确定模块320,用于基于预先配置的数据爬虫分布信息,确定所述第二区块链节点相对于所述第一区块链节点的历史权限请求列表;

请求判断模块330,用于判断所述历史权限请求列表中是否存在与所述当前权限请求相匹配的目标权限请求;

爬虫检测模块340,用于在判断出所述历史权限请求列表中存在与所述当前权限请求相匹配的目标权限请求时,根据所述目标权限请求对应的请求数据在所述第一区块链节点中的存储路径信息确定所述目标权限请求的调用环境参数;基于所述调用环境参数检测所述目标业务数据中是否存在数据爬虫脚本;在检测出所述调用环境参数检测所述目标业务数据中存在所述数据爬虫脚本时,拦截所述第一区块链节点基于所述目标业务数据所输出的数据处理结果。

A2.根据A1所述的装置,爬虫检测模块340,用于:

按照所述目标权限请求在预设映射列表中的类别映射值所对应的报文字段分布特征对所述目标权限请求进行请求报文的拆分,得到报文头信息和报文主体信息;从所述报文主体信息中获取存在指向性标识的目标信息段并提取所述目标信息段中的报文数据以作为所述目标权限请求对应的请求数据;

基于与所述第一区块链节点预先建立的数据传输通道的通道协议层文本确定所述第一区块链节点在所述大数据平台中的对应存储区;将所述对应存储区的存储地址列出得到存储地址序列,根据所述通道协议层文本对所述存储地址序列进行映射,得到在所述第一区块链节点中的映射地址序列;将所述请求数据中的多段报文数据按照时序先后依次与所述映射地址序列进行配对得到配对结果,基于所述配对结果确定所述请求数据在所述第一区块链节点中的存储路径信息;

提取所述存储路径信息中不随所述目标权限请求的请求优先级的变化而更新的路径参数集,通过所述路径参数集确定所述目标权限请求的调用环境参数。

A3.根据A2所述的装置,爬虫检测模块340,进一步用于:

提取所述路径参数集中的第一路径分布轨迹和第二路径分布轨迹;

根据所述第一路径分布轨迹和所述第二路径分布轨迹确定所述目标权限请求的调用环境参数;其中,所述第一路径分布轨迹用于表征所述路径参数集中的动态参数对应的分布轨迹,所述第二路径分布轨迹用于表征所述路径参数集中的静态参数对应的分布轨迹。

A4.根据A3所述的装置,爬虫检测模块340,更进一步用于:

根据所述路径参数集对应的参数分布标签确定所述路径参数集对应的多个路径节点;其中,每个路径节点中所封装的路径参数不同,每个路径节点具有不同的路径优先级;

按照所述路径优先级的由大到小的顺序将所述路径节点进行排序得到路径节点排序序列,并按照所述路径节点中所封装的路径参数的参数特征间隔抓取所述路径节点排序序列中的多个第一路径节点以作为第一节点集,然后将所述路径节点排序序列中的剩余的第二路径节点确定为第二节点集;根据所述路径节点排序序列在所述第一节点集中的路径节点以及所述路径节点的队列信息确定所述路径节点排序序列在所述第二节点集中的各路径节点与所述路径节点排序序列在所述第一节点集中的各路径节点之间的节点重定向系数,并根据所述节点重定向系将所述路径节点排序序列在所述第二节点集中的与在所述第一节点集中的路径节点之间存在重定向配对标识的路径节点迁移到所述第一节点集中;根据完成节点迁移的第一节点集以及完成节点迁移的第二节点集生成所述第一路径分布轨迹以及所述第二路径分布轨迹;

构建所述第一路径分布轨迹的第一轨迹描述信息以及所述第二路径分布轨迹的第二轨迹描述信息,并判断所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数是否低于预设系数;若所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数不低于所述预设系数则根据第一轨迹描述信息的互动轨迹数据对所述第二轨迹描述信息进行迭代更新,直至所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数低于所述预设系数;其中,在所述第一轨迹描述信息与所述第二轨迹描述信息之间的相关性系数低于所述预设系数时所述第一轨迹描述信息和所述第二轨迹描述信息中分别包括多个具有不同环境指标因子的调用数据;

从所述第一轨迹描述信息中选取出任意一个调用数据作为待检测调用数据并将所述待检测调用数据的调用权限特征映射到所述第二轨迹描述信息中具有最大环境指标因子的目标调用数据中,以在所述目标调用数据中计算所述调用权限特征的特征区分度;根据所述特征区分度、所述第一轨迹描述信息中的调用数据和所述第二轨迹描述信息中的调用数据确定所述目标权限请求的调用环境参数。

A5.根据权利要求1所述的装置,爬虫检测模块340,用于:

在需要对所述调用环境参数进行数据调用模拟的情况下,获得所述目标业务数据的数据转码配置信息;

当所述数据转码配置信息中的数据转码标识符对应的满载字段长度小于所述目标业务数据中的满载字段长度时,确定是否存在有需要忽略的处于可调用状态的第一数据字段;其中,所述第一数据字段为所述目标业务数据中的数据字段;

当存在有需要忽略的第一数据字段时,针对每个第一数据字段生成对应的字段忽略标识符,并将所述字段忽略标识符的当前状态调整为激活状态以使得所述目标业务数据中仅保留可调用的第二数据字段;

开启数据调用模拟,将预设的样本数据放入调用池中;其中,所述样本数据包括第一样本数据和第二样本数据,所述第一样本数据为非隐私数据,所述第二样本数据为隐私数据;

执行所述第二数据字段对应的业务线程以对所述调用池中的样本数据进行调用并获得调用结果;判断所述调用结果中是否存在所述第二样本数据;若存在,则判定所述目标业务数据中存在数据爬虫脚本;若不存在,则返回确定是否存在有需要忽略的处于可调用状态的第一数据字段的步骤,直至对所述目标业务数据的所有数据字段完成遍历。

基于上述相似的发明构思,还提供了一种区块链和数字金融的业务数据处理系统,关于所述系统的功能性描述如下。

一种区块链和数字金融的业务数据处理系统,包括互相之间通信连接的大数据平台和多个区块链节点;

第一区块链节点用于:

处理第二区块链节点发送的目标业务数据;

大数据平台用于:

根据第一区块链节点在处理第二区块链节点发送的目标业务数据时的权限调用记录,获取所述第一区块链节点在所述目标业务数据中所提取的业务行为信息的当前权限请求;

基于预先配置的数据爬虫分布信息,确定所述第二区块链节点相对于所述第一区块链节点的历史权限请求列表;

判断所述历史权限请求列表中是否存在与所述当前权限请求相匹配的目标权限请求;

在判断出所述历史权限请求列表中存在与所述当前权限请求相匹配的目标权限请求时,根据所述目标权限请求对应的请求数据在所述第一区块链节点中的存储路径信息确定所述目标权限请求的调用环境参数;基于所述调用环境参数检测所述目标业务数据中是否存在数据爬虫脚本;在检测出所述调用环境参数检测所述目标业务数据中存在所述数据爬虫脚本时,拦截所述第一区块链节点基于所述目标业务数据所输出的数据处理结果。

在上述基础上,请结合参阅图4,提供了一种大数据平台200,包括:处理器210,以及与处理器210连接的内存220和网络接口230;所述网络接口230与大数据平台200中的非易失性存储器240连接;所述处理器210在运行时通过所述网络接口230从所述非易失性存储器240中调取计算机程序,并通过所述内存220运行所述计算机程序,以执行上述的方法。

在上述基础上,还提供一种应用于计算机的可读存储介质,所述可读存储介质烧录有计算机程序,所述计算机程序在大数据平台200的内存220中运行时实现上述的方法。

上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号