首页> 中国专利> 基于云计算的5G互联大数据处理方法及大数据推送系统

基于云计算的5G互联大数据处理方法及大数据推送系统

摘要

本公开实施例提供一种基于云计算的5G互联大数据处理方法及大数据推送系统,通过从用户自身行为和实际投放业务场景互动行为这两个维度确定出的目标投放业务中的后续投放业务兴趣点以及对应的兴趣点属性,并基于投放业务的业务节点顺序,通过业务窗口依次从综合投放业务兴趣数据中选取处于业务窗口中的后续投放业务兴趣点以及对应的兴趣点属性,并根据该业务窗口选取的兴趣点属性对后续投放业务兴趣点进行聚类,确定目标投放业务中针对服务注册用户的投放业务兴趣点,从而能够将多维度兴趣信息进行综合,提高大数据分析的准确性,进而提高投放业务兴趣点的确定准确性。

著录项

  • 公开/公告号CN113312557A

    专利类型发明专利

  • 公开/公告日2021-08-27

    原文格式PDF

  • 申请/专利权人 包万友;

    申请/专利号CN202110682292.1

  • 发明设计人 包万友;

    申请日2021-06-20

  • 分类号G06F16/9535(20190101);G06F16/951(20190101);G06F16/906(20190101);G06F16/36(20190101);G06Q30/02(20120101);G06Q50/00(20120101);G06N20/00(20190101);

  • 代理机构

  • 代理人

  • 地址 650051 云南省昆明市盘龙区白塔路131号汇都国际B座1209室

  • 入库时间 2023-06-19 12:22:51

说明书

技术领域

本公开涉及大数据技术领域,具体而言,涉及一种基于云计算的5G互联大数据处理方法及大数据推送系统。

背景技术

随着云计算技术的发展,互联网服务提供商拥有大量的线上数据,而且随着5G互联时代的到来,数据量还在快速增长,除了利用大数据提升自己的业务之外,互联网服务提供商已经开始实现数据业务化,利用大数据发现新的商业价值。

用户的所有行为都会在互联网平台上留下痕迹,所以互联网服务提供商可以方便地获取大量的用户行为信息。由互联网平台产生的信息一般具有真实性和确定性,通过运用大数据技术对这些数据进行分析,可以帮助互联网服务提供商制定出具有针对性的信息投放服务策略,从而获取更大的效益。

然而,当前大数据挖掘过程中,从单向单一维度进行确定出的目标投放业务中的投放业务兴趣点,其准确性难以达到预估效果,导致大数据分析的准确性难以反映实际的业务行为。

发明内容

为了至少克服现有技术中的上述不足,本公开的目的在于提供一种基于云计算的5G互联大数据处理方法及大数据推送系统。

第一方面,本公开提供一种基于云计算的5G互联大数据处理方法,应用于大数据推送系统,所述大数据推送系统与多个5G互联网终端通信连接,所述方法包括:

获取所述5G互联网终端的服务注册用户的用户行为爬取程序和场景互动行为爬取程序分别爬取的用户行为大数据和场景互动行为大数据,其中,所述用户行为爬取程序和场景互动行为爬取程序基于预先注册的云计算服务实现;

根据所述用户行为大数据确定对应目标投放业务的第一投放业务兴趣信息,根据所述场景互动行为大数据确定所述目标投放业务的第二投放业务兴趣信息;

通过所述第一投放业务兴趣信息和所述第二投放业务兴趣信息确定所述目标投放业务的综合投放业务兴趣数据;

基于投放业务的业务节点顺序,通过业务窗口依次从所述综合投放业务兴趣数据中选取处于所述业务窗口中的后续投放业务兴趣点以及对应的兴趣点属性;

根据所述业务窗口选取的兴趣点属性对后续投放业务兴趣点进行聚类,确定所述目标投放业务中针对所述服务注册用户的投放业务兴趣点。

譬如,本公开提供一种基于5G互联大数据处理的投放画像确定方法,应用于大数据推送系统,所述大数据推送系统与多个5G互联网终端通信连接,所述方法包括:

利用所述服务信息投放策略对所述投放业务兴趣点进行投放策略规则更新,得到投放策略规则更新结果;

在所述投放策略规则更新结果表征所述投放业务兴趣点不存在业务更新冲突时,获取针对所述目标投放业务的信息投放流程数据集合,所述信息投放流程数据集合包括至少两条信息投放流程数据;

获得所述信息投放流程数据集合中的各条信息投放流程数据与所述目标投放业务之间的历史投放更新信息;

根据所述各条信息投放流程数据对应的历史投放更新信息,以及所述各条信息投放流程数据的投放行为特征,对所述各条信息投放流程数据进行解析,得到相应的信息投放流程图谱;

基于所述信息投放流程图谱生成针对所述目标投放业务的目标投放画像信息,所述目标投放画像信息包括至少两个目标投放画像日志。

第二方面,本公开实施例还提供一种基于云计算的5G互联大数据处理系统,所述基于云计算的5G互联大数据处理系统包括大数据推送系统以及与所述大数据推送系统通信连接的多个5G互联网终端;

所述大数据推送系统,用于:

获取所述5G互联网终端的服务注册用户的用户行为爬取程序和场景互动行为爬取程序分别爬取的用户行为大数据和场景互动行为大数据;

根据所述用户行为大数据确定对应目标投放业务的第一投放业务兴趣信息,根据所述场景互动行为大数据确定所述目标投放业务的第二投放业务兴趣信息;

通过所述第一投放业务兴趣信息和所述第二投放业务兴趣信息确定所述目标投放业务的综合投放业务兴趣数据;

基于投放业务的业务节点顺序,通过业务窗口依次从所述综合投放业务兴趣数据中选取处于所述业务窗口中的后续投放业务兴趣点以及对应的兴趣点属性;

根据所述业务窗口选取的兴趣点属性对后续投放业务兴趣点进行聚类,确定所述目标投放业务中针对所述服务注册用户的投放业务兴趣点。

根据上述任意一个方面,本公开提供的实施方式中,为了能够在尽可能降低数据处理压力的同时,提高用户针对投放业务的行为兴趣确定的准确度,本公开可以获取服务注册用户的用户行为大数据和场景互动行为大数据,其中用户行为大数据能够从用户自身行为的维度体现兴趣信息,场景互动行为大数据能够从场景互动行为的维度来体现兴趣信息。根据该用户行为大数据和场景互动行为大数据能够分别确定出对应目标投放业务的第一投放业务兴趣信息和第二投放业务兴趣信息,通过该第一投放业务兴趣信息和第二投放业务兴趣信息可以确定该目标投放业务的综合投放业务兴趣数据,该投放业务兴趣综合数据中包括从用户自身行为和实际投放业务场景互动行为这两个维度确定出的目标投放业务中的后续投放业务兴趣点以及对应的兴趣点属性。为了全面的对目标投放业务上的实际投放业务兴趣进行确定,可以基于投放业务的业务节点顺序,通过业务窗口依次从综合投放业务兴趣数据中选取处于业务窗口中的后续投放业务兴趣点以及对应的兴趣点属性,并根据该业务窗口选取的兴趣点属性对后续投放业务兴趣点进行聚类,确定目标投放业务中针对所述服务注册用户的投放业务兴趣点,从而能够将多维度兴趣信息进行综合,提高兴趣点确定准确性。

附图说明

图1为本公开实施例提供的基于云计算的5G互联大数据处理系统的应用场景示意图;

图2为本公开实施例提供的基于云计算的5G互联大数据处理方法的流程示意图;

图3为本公开实施例提供的基于云计算的5G互联大数据处理装置的功能模块示意图;

图4为本公开实施例提供的用于实现上述的基于云计算的5G互联大数据处理方法的大数据推送系统的结构示意框图。

具体实施方式

下面结合说明书附图,对本公开实施例的方案进行详细说明。以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本公开具体实施例。

图1是本公开一种实施例提供的基于云计算的5G互联大数据处理系统10的场景示意图。基于云计算的5G互联大数据处理系统10可以包括大数据推送系统100以及与大数据推送系统100通信连接的5G互联网终端200。图1所示的基于云计算的5G互联大数据处理系统10仅为一种可行的示例,在其它可行的实施例中,该基于云计算的5G互联大数据处理系统10也可以仅包括图1所示组成部分的其中的至少部分或者还可以包括其它的组成部分。

本实施例中,基于云计算的5G互联大数据处理系统10中的大数据推送系统100和5G互联网终端200可以通过配合执行以下方法实施例所描述的基于云计算的5G互联大数据处理方法,具体大数据推送系统100和5G互联网终端200的执行步骤部分可以参照以下方法实施例的详细描述。

为了解决前述背景技术中的技术问题,图2为本公开实施例提供的基于云计算的5G互联大数据处理方法的流程示意图,本实施例提供的基于云计算的5G互联大数据处理方法可以由图1中所示的大数据推送系统100执行,下面对该基于云计算的5G互联大数据处理方法进行详细介绍。

步骤S110,获取5G互联网终端200的服务注册用户的用户行为爬取程序和场景互动行为爬取程序分别爬取的用户行为大数据和场景互动行为大数据。

为了在一定程度上避免基于单一维度的行为大数据进行识别所造成识别精度不足的问题,在本公开实施例中,可以通过多种方式爬取多个维度的行为大数据,并综合这些行为大数据进行投放业务兴趣点的确定,从而实现不同维度行为大数据之间的联动考虑效果。

例如,首先,用户行为爬取程序可以爬取该服务注册用户在行为操作过程中所对应的用户行为大数据,该用户行为大数据是指能够体现出用户行为状态的数据,例如可以包括用户行为在各个业务板块上的操作对象数据和操作流程数据等;场景互动行为爬取程序可以爬取该服务注册用户在行为操作过程中所对应的场景互动行为大数据,该场景互动行为大数据是指能够以场景互动行为方式体现出场景互动状态的数据,例如该场景互动行为大数据可以为场景互动行为在各个业务板块上的操作对象数据和操作流程数据等。

也即,为了能够基于多维度的投放业务信息进行投放业务兴趣点的确定,可以获取服务注册用户的用户行为爬取程序和场景互动行为爬取程序分别爬取的用户行为大数据和场景互动行为大数据。

步骤S120,根据用户行为大数据确定对应目标投放业务的第一投放业务兴趣信息,根据场景互动行为大数据确定目标投放业务的第二投放业务兴趣信息。

基于获取到的用户行为大数据,可以从用户自身行为情况的维度,确定对应目标投放业务的第一投放业务兴趣信息,该第一投放业务兴趣信息包括对应于该用户行为大数据的后续投放业务兴趣点;基于获取到的场景互动行为大数据,可以从投放业务场景互动行为的维度,确定出目标投放业务的第二投放业务兴趣信息,该第二投放业务兴趣信息包括对应于该场景互动行为大数据的后续投放业务兴趣点。

其中,目标投放业务可以为服务注册用户在行为操作过程中可能所经过的任意一条投放业务,或者预先设置的投放业务等,后续投放业务兴趣点是指由各个维度的分析方式所分析出、还未进行综合确定的投放业务兴趣点。

步骤S130,通过第一投放业务兴趣信息和第二投放业务兴趣信息确定目标投放业务的综合投放业务兴趣数据。

为了实现不同维度大数据信息之间的关联考虑,可以综合第一投放业务兴趣信息和第二投放业务兴趣信息,确定对应该目标投放业务的综合投放业务兴趣数据,该投放业务兴趣综合数据中包括基于各个维度大数据信息所确定出的后续投放业务兴趣点以及各个后续投放业务兴趣点对应的兴趣点属性。例如,通过对多维度后续投放业务兴趣点的合并处理,可以扩大确定目标投放业务中针对服务注册用户的投放业务兴趣点所依据的数据范围。例如,当通过用户行为大数据无法挖掘到目标投放业务上某一服务注册用户未经过的投放业务兴趣点时,虽然该投放业务兴趣点可能没有体现在第一投放业务兴趣信息对应的后续投放业务兴趣点中,但是该投放业务兴趣点可以被场景互动行为爬取程序所爬取到,从而体现在第二投放业务兴趣对应的后续投放业务兴趣点中,最终也能够体现在综合投放业务兴趣数据中,实现了对投放业务兴趣点更加全面的挖掘和分析。

可以理解的是,由于爬取不同维度大数据信息所用方式不同,因此基于不同维度大数据信息所确定出的后续投放业务兴趣点可能对应于不同的兴趣属性信息。

由此可见,基于第一投放业务兴趣信息和第二投放业务信息所确定出的后续投放业务兴趣点的初始位置信息可能对应于不同的兴趣属性信息,为了方便进行后续处理,使能够对投放业务兴趣点进行准确聚类,在确定综合投放业务兴趣数据时,可以将基于不同维度大数据信息确定出的后续投放业务兴趣点统一至同一信息投放服务中。

步骤S140,基于投放业务的业务节点顺序,通过业务窗口依次从综合投放业务兴趣数据中选取处于业务窗口中的后续投放业务兴趣点以及对应的兴趣点属性。

可以理解的是,由于在爬取不同维度的投放业务信息时,各个爬取流程都是独立进行爬取的,因此在爬取某一后续投放业务兴趣点相关的投放业务信息时并不会考虑到其它流程是否已经对该后续投放业务兴趣点进行爬取。因此,在包括有基于多维度大数据信息所确定后续投放业务兴趣点的综合投放业务兴趣数据中,有较大概率存在多个后续投放业务兴趣点实际上对应目标投放业务中的同一投放业务兴趣点。

基于此,为了最终输出一个较为准确的投放业务检测结果,可以对综合投放业务兴趣数据中的后续投放业务兴趣点进行聚类处理,即从多个后续投放业务兴趣点中确定出对应同一投放业务兴趣点的后续投放业务兴趣点。

可以理解的是,由于通过多维度大数据信息所确定出的后续投放业务兴趣点可能数量较大,若同时对综合投放业务兴趣数据中的全部后续投放业务兴趣点进行聚类处理,可能会导致数据处理量过大,且难以进行较为精确的聚类。基于此,为了尽可能全面且准确的对综合投放业务兴趣数据中的后续投放业务兴趣点进行聚类,可以引入业务窗口的方式,每一次通过业务窗口爬取综合投放业务兴趣数据中的部分后续投放业务兴趣点进行聚类处理,通过多次业务窗口爬取和聚类实现对综合投放业务兴趣数据中全部后续投放业务兴趣点的聚类处理。

为了避免遗漏从目标投放业务中确定出的后续投放业务兴趣点,可以基于投放业务的业务节点顺序来获取综合投放业务兴趣数据中的后续投放业务兴趣点。其中,业务窗口可以是指由用于归纳业务服务范围的比对窗口。在本公开实施例中,可以基于投放业务的业务节点顺序,通过业务窗口依次从综合投放业务兴趣数据中选取处于该业务窗口中的后续投放业务兴趣点以及对应的兴趣点属性,即获取所对应兴趣点属性处于该业务窗口所对应范围中的待识别投放业务兴趣点。

步骤S150,根据业务窗口选取的兴趣点属性对后续投放业务兴趣点进行聚类,确定目标投放业务中针对服务注册用户的投放业务兴趣点。

针对于每一个业务窗口中的后续投放业务兴趣点,基于多种聚类标准,例如后续投放业务兴趣点之间的属性匹配度、后续投放业务兴趣点的数量等,对该后续投放业务兴趣点进行聚类处理。最终,可以得到聚类处理后确定出的投放业务兴趣点,该投放业务兴趣点即为目标投放业务中针对服务注册用户的投放业务兴趣点。

由上述技术方案可以看出,为了能够在尽可能降低数据处理压力的同时,提高用户针对投放业务的行为兴趣确定的准确度,本公开可以获取服务注册用户的用户行为爬取程序和场景互动行为爬取程序分别爬取的用户行为大数据和场景互动行为大数据,其中用户行为大数据能够从用户自身行为的维度体现兴趣信息,场景互动行为大数据能够从场景互动行为的维度来体现兴趣信息。根据该用户行为大数据和场景互动行为大数据能够分别确定出对应目标投放业务的第一投放业务兴趣信息和第二投放业务兴趣信息,通过该第一投放业务兴趣信息和第二投放业务兴趣信息可以确定该目标投放业务的综合投放业务兴趣数据,该投放业务兴趣综合数据中包括从用户自身行为和实际投放业务场景互动行为这两个维度确定出的目标投放业务中的后续投放业务兴趣点以及对应的兴趣点属性。为了全面的对目标投放业务上的实际投放业务兴趣进行确定,可以基于投放业务的业务节点顺序,通过业务窗口依次从综合投放业务兴趣数据中选取处于业务窗口中的后续投放业务兴趣点以及对应的兴趣点属性,并根据该业务窗口选取的兴趣点属性对后续投放业务兴趣点进行聚类,确定目标投放业务中针对服务注册用户的投放业务兴趣点,从而能够将爬取到的多维度兴趣信息进行综合,提高兴趣点确定准确性。

上已述及,可以通过多种聚类标准来进行聚类处理,接下来将展开说明具体的聚类动作。

在基于投放业务的业务节点顺序,通过业务窗口获取数据后,可以得到N个包括后续投放业务兴趣点和对应兴趣点属性的业务窗口,可以针对其中每一个业务窗口进行聚类处理,接下来将以其中的第i个业务窗口为例进行描述,i≤N。

可以理解的是,在不同流程对目标投放业务上的投放业务兴趣点进行确定时,虽然可能确定出的兴趣点属性有所差别,但是总体上差别要小于对不同投放业务兴趣点确定出的兴趣点属性之间的差别。因此,若两个后续投放业务兴趣点之间的属性匹配度较小,可以将这两个后续投放业务兴趣点确定为同一投放业务兴趣点。

一种实施例中,针对第i个业务窗口,在进行聚类时,可以预设一个预设属性匹配度,该预设属性匹配度用于判断后续投放业务兴趣点之间的属性匹配度是否较小。可以根据第i个业务窗口选取的兴趣点属性,确定第i个业务窗口所选取的后续投放业务兴趣点间的属性匹配度。若该属性匹配度中有超出预设属性匹配度的属性匹配度,则说明在第i个业务窗口选取的后续投放业务兴趣点中存在间隔较远的后续投放业务兴趣点,这些间隔较远的后续投放业务兴趣点属于不同投放业务兴趣点的可能性较高,属于同一投放业务兴趣点的可能性较低,因此说明需要对该后续投放业务兴趣点进行聚类处理,确定对应同一投放业务兴趣点的后续投放业务兴趣点,然后才能够基于对应同一投放业务兴趣点的后续投放业务兴趣点准确的确定出该投放业务兴趣点。

可以通过第i个业务窗口选取的兴趣点属性对该后续投放业务兴趣点进行聚类,从而确定出对应不同投放业务兴趣点的多个后续投放业务兴趣点。在进行聚类后,可以基于对应同一投放业务兴趣点的多个后续投放业务兴趣点,确定目标投放业务在第i个业务窗口中的投放业务兴趣点,最终,通过N个业务窗口所确定出的投放业务兴趣点集合即为服务注册用户此次投放业务检测所检测出的全部目标投放业务上的投放业务兴趣点。

例如,在判断是否有属性匹配度超出预设属性匹配度时,可以计算第i个业务窗口中后续投放业务兴趣点之间属性匹配度的方差是否大于阈值,若超出阈值,则判断该第i个业务窗口中的后续投放业务兴趣点为对应于2个投放业务兴趣点,可以以两个投放业务兴趣点作为聚类基准进行聚类,得到对应两个不同投放业务兴趣点的多个后续投放业务兴趣点。

除了后续投放业务兴趣点之间的属性匹配度外,同一业务窗口中后续投放业务兴趣点的数量同样可以作为聚类标准之一。可以理解的是,上述N个业务窗口中的后续投放业务兴趣点都是同一批元件所确定出的,由于目标投放业务上不同部分所存在的投放业务兴趣点数量不同,而业务窗口是基于投放业务的业务节点顺序对后续投放业务兴趣点进行采样的,因此,不同业务窗口中获取到的后续投放业务兴趣点数量也可能有所不同。若同一业务窗口中有较多的后续投放业务兴趣点,则该业务窗口所对应目标投放业务段存在多个投放业务兴趣点的概率较大。

基于此,在通过属性匹配度进行聚类的基础上,还可以进一步增加对后续投放业务兴趣点数量的判断。一种实施例中,若属性匹配度中有超出预设属性匹配度的属性匹配度,可以进一步判断后续投放业务兴趣点的数量是否超过预设的数量阈值。若通过第i个业务窗口所选取的后续投放业务兴趣点的数量超出数量阈值,则进一步说明该第i个业务窗口中对应目标投放业务上多个投放业务兴趣点的可能性较高。可以通过第i个业务窗口选取的兴趣点属性对后续投放业务兴趣点进行聚类,确定该目标投放业务在第i个业务窗口中的投放业务兴趣点。

例如,在一种实际应用场景中,可以统计第i个业务窗口中后续投放业务兴趣点的个数和后续投放业务兴趣点之间属性匹配度的方差,若方差超过预设属性匹配度且个数超过数量阈值,则可以确定该第i个业务窗口对应于目标投放业务中的2个投放业务兴趣点,并基于2个投放业务兴趣点这一聚类基准进行聚类,例如可以采用K均值聚类算法,以K=2为基准进行聚类。

上已述及,当同一业务窗口中的后续投放业务兴趣点之间存在较大的属性匹配度,且后续投放业务兴趣点的数量较多时,该业务窗口中对应多个投放业务采样点的概率较大;反之,若后续兴趣点之间的属性匹配度都较小,且后续投放业务兴趣点的数量较少时,同一业务窗口中后续投放业务兴趣点对应同一投放业务兴趣点的概率就较高,此时,可以无需对该业务窗口中的后续投放业务兴趣点进行聚类处理,进一步提高投放业务兴趣点确定的效率。

一种实施例中,若通过第i个业务窗口所选取的后续投放业务兴趣点的数量小于数量阈值,且属性匹配度小于预设属性匹配度,则可以说明第i个业务窗口中的后续投放业务兴趣点对应多个投放业务兴趣点的可能性较低。此时,可以无需进行聚类,直接将通过第i个业务窗口所选取的后续投放业务兴趣点确定为同一个投放业务兴趣点。

在经过上述对第i个业务窗口中后续投放业务兴趣点的处理后,能够确定出对应于同一投放业务兴趣点的多个后续投放业务兴趣点。通过这些后续投放业务兴趣点的兴趣点属性、兴趣点跨度以及兴趣点数量等信息,可以确定出所对应目标投放业务上投放业务兴趣点的相关信息。例如,基于聚类筛选出的针对某一投放业务兴趣点的后续投放业务兴趣点的数量和深度,能够确定出该投放业务兴趣点所对应的兴趣点类型和兴趣程度等信息;基于后续投放业务点之间属性匹配度的方差、数量等信息,可以确定出该投放业务兴趣点的置信度,例如若对应该投放业务兴趣点的后续投放业务兴趣点数量较多、方差较小,则该投放业务兴趣点真实存在于目标投放业务上的可能性就较高,该投放业务兴趣点对应的置信度也就较高。可以将确定出的相关信息进行信息投放更新。

上述内容主要针对于对综合投放业务兴趣数据的聚类处理、确定投放业务兴趣点的过程,接下来,将对各个维度的投放业务信息进行详细的介绍。

一种实施例中,可以通过其他方式爬取的相关数据,对该用户行为爬取程序所爬取的用户行为大数据进行修正。

一种实施例中,可以根据该场景互动行为数据确定服务注册用户的第一行为迁移参数,该第一行为迁移参数用于体现在场景互动行为维度上的行为迁移变化。

另一方面,可以根据在该目标时间段内的用户行为大数据,确定该服务注册用户的第二行为迁移参数,该第二行为迁移参数用于体现在用户自身行为维度上的行为迁移变化。

在确定出基于不同维度数据所确定出的行为迁移参数后,可以通过该第一行为迁移参数和第二行为迁移参数,确定该用户行为爬取程序的行为迁移节点序列,该行为迁移节点序列为用户行为爬取程序在确定过程中出现的误差。可以根据该行为迁移节点序列对该用户行为大数据进行行为特征纠正,然后根据行为特征纠正后的用户行为大数据确定对应目标投放业务的第一投放业务兴趣信息,从而能够进一步提高该第一投放业务兴趣信息的信息精度,最终确定出准确度更高的投放业务兴趣点。

上已述及,场景互动行为爬取程序可以包括多种组成方式,不同的组成方式在爬取场景互动行为大数据时的方式也可能有所不同,下面将对多种组成方式的场景互动行为爬取程序进行展开介绍。

一种实施例中,该场景互动行为爬取程序可以由多组爬取程序组成,例如可以包括第一爬取程序和第二爬取程序。其中,第一爬取程序可以包括第一场景互动行为爬取线程和第二场景互动行为爬取线程,该第一场景互动行为爬取线程和第二场景互动行为爬取线程的数据爬取参数不同。从而,两个场景互动行为爬取线程可以从不同的视角对场景互动行为进行爬取,实现场景互动行为信息上的联动考虑效果,使最终爬取到的场景互动行为大数据更加全面,可信度更高,对投放业务兴趣点的识别也更加准确。

可以基于深度学习技术,利用模型对该互动行为数据进行分析和处理。首先可以根据第一场景互动行为爬取线程爬取的第一互动行为数据,确定第一兴趣子信息,以及根据第二场景互动行为爬取线程爬取的第二互动行为数据,确定第二兴趣子信息,该第一兴趣子信息和第二兴趣子信息中分别包括基于第一互动行为数据和第二互动行为数据确定出的后续投放业务兴趣点。

可以理解的是,在通过场景互动行为确定后续投放业务兴趣点时,由于多种因素的干扰,所确定出的后续投放业务兴趣点中可能会存在个别置信度较低的兴趣点。基于此,在确定第一兴趣子信息和第二兴趣子信息后,可以通过分类模型从第一兴趣子信息和第二兴趣子信息中筛除不可信的后续投放业务兴趣点,然后将筛除后的第一兴趣子信息和第二兴趣子信息确定第二投放业务兴趣信息中该第一爬取程序所对应的投放业务兴趣子信息。

场景互动行为爬取程序中除了可以包括上述第一爬取程序外,为了进一步提高检测的多样性和全面性,还可以包括第二爬取程序,该第二爬取程序可以为由两个动态协调的场景互动行为爬取线程构成的组合场景互动行为爬取程序。

在利用组合场景互动行为爬取程序对投放业务兴趣点进行检测时,可以分别利用其中的两个动态协调的场景互动行为爬取程序爬取协调方互动行为数据和被协调方互动行为数据,场景互动行为大数据中可以包括该协调方互动行为数据和被协调方互动行为数据,协调方互动行为数据是指组合场景互动行为爬取程序中位于左侧的动态协调的场景互动行为爬取线程爬取出的场景互动行为,被协调方互动行为数据是指组合场景互动行为爬取程序中位于右侧的动态协调的场景互动行为爬取线程爬取出的场景互动行为。

可以理解的是,若两个动态协调的场景互动行为爬取线程同时爬取到了同一互动行为,则在通常情况下,该对象在协调方互动行为数据和被协调方互动行为数据中对应互动行为节点的互动集中对象应当一致。基于该规律,通过分析协调方互动行为数据和被协调方互动行为数据中互动行为节点的互动集中对象,可以确定出协调方互动行为数据和被协调方互动行为数据中对应同一互动行为的互动行为节点。

基于此,在本公开实施例中,为了确定出第二爬取程序所对应的投放业务兴趣子信息,可以通过分析协调方互动行为数据和被协调方互动行为数据中的互动行为节点的互动集中对象来进行。一种实施例中,可以根据第二爬取程序爬取的协调方互动行为数据和被协调方互动行为数据,通过机器学习网络确定该第二投放业务兴趣信息中第二爬取程序对应的投放业务兴趣子信息,该投放业务兴趣子信息中包括基于该协调方互动行为数据和被协调方互动行为数据确定出的后续投放业务兴趣点。

其中,示例性地,该机器学习网络是通过如下方式训练得到的:

可以基于同一互动行为关联于协调方互动行为数据和被协调方互动行为数据中互动行为节点的互动集中对象一致的训练规则,确定训练参考神经网络的网络评估指标(损失函数)。可以根据基于组合场景互动行为爬取程序确定的训练数据组合,以及该网络评估指标训练该参考神经网络确定该训练数据组合中分别对应同一互动行为的互动数据组合,该训练数据组合包括协调方互动样本数据和被协调方互动样本数据。

一种实施例中,本公开实施例提供一种基于5G互联大数据的信息投放更新方法,该方法基于前述获得的目标投放业务中针对服务注册用户的投放业务兴趣点进行后续步骤的执行,该方法可以包括以下步骤。

步骤S100,获取投放业务兴趣点在第一产品资讯推送服务的第一产品资讯相关数据和在第二产品资讯推送服务的第二产品资讯相关数据。

一种实施例中,投放业务兴趣点可以是指针对目标投放业务下服务注册用户可能感兴趣的投放业务单元,如某个新增功能单元、某个商品、某个新闻链接、某个应用软件服务等等。

进一步地,第一产品资讯推送服务和第二产品资讯推送服务分别为服务注册用户所在的服务社交关系圈对应的本地产品资讯推送服务和远程产品资讯推送服务。第一产品资讯推送服务和第二产品资讯推送服务为云服务器预设的产品资讯推送服务,第一产品资讯推送服务和第二产品资讯推送服务的推送重点可以不同。比如,第一产品资讯推送服务可以侧重于服务注册用户所在的服务社交关系圈对应的本地服务,第二产品资讯推送服务可以侧重于服务注册用户所在的服务社交关系圈对应的远程服务。又比如,第一产品资讯推送服务可以侧重于服务注册用户所在的服务社交关系圈对应的远程服务,第二产品资讯推送服务可以侧重于服务注册用户所在的服务社交关系圈对应的本地服务。

相应地,第一产品资讯相关数据和第二产品资讯相关数据也可以不同,关于第一产品资讯相关数据和第二产品资讯相关数据的说明可以参阅后续内容。

步骤S200,对第一产品资讯相关数据和第二产品资讯相关数据进行分析,确定投放业务兴趣点与预设的信息投放计划之间的第一业务匹配信息以及投放业务兴趣点与预设的信息挖掘计划之间的第二业务匹配信息。

一种实施例中,信息投放计划和信息挖掘计划可以理解为基于信息投放策略更新的服务计划,比如,信息投放计划用于表征投放业务兴趣点相对于目标投放服务的投放行为数据的处理,信息挖掘计划用于表征云服务器相对于目标投放服务的投放内容数据挖掘的处理。

进一步地,投放业务兴趣点与预设的信息投放计划之间的第一业务匹配信息可以理解为投放业务兴趣点与信息投放计划在服务计划执行层面的匹配信息,投放业务兴趣点与预设的信息挖掘计划之间的第二业务匹配信息可以理解为投放业务兴趣点与信息挖掘计划在服务计划执行层面的匹配信息。一般而言,第一业务匹配信息和第二业务匹配信息之间可以部分相关,第一业务匹配信息和第二业务匹配信息能够反映投放业务兴趣点与不同服务计划之间的适配情况,从而便于后续进行服务信息投放策略的确定。

在一些可能的示例中,第一产品资讯相关数据包括基于与信息投放计划之间的业务匹配信息预设的第一资讯投放接口信息,第二产品资讯相关数据包括基于与信息挖掘计划之间的业务匹配信息预设的第二资讯投放接口信息。基于此,上述步骤“对第一产品资讯相关数据和第二产品资讯相关数据进行分析,确定投放业务兴趣点与预设的信息投放计划之间的第一业务匹配信息以及投放业务兴趣点与预设的信息挖掘计划之间的第二业务匹配信息”,可以包括以下步骤S211和步骤S212所描述的内容。

步骤S211,对目标产品资讯相关数据进行分析,确定投放业务兴趣点在目标产品资讯相关数据中的兴趣投放接口,作为目标兴趣投放接口。

一种实施例中,目标产品资讯相关数据包括第一产品资讯相关数据和第二产品资讯相关数据。兴趣投放接口可以是投放业务兴趣点对应的投放业务的API接口。

步骤S212,根据目标兴趣投放接口与资讯投放接口信息中的资讯投放接口对象的兴趣投放接口关系,确定投放业务兴趣点与投放规则之间的目标业务匹配信息。

一种实施例中,在目标产品资讯相关数据为第一产品资讯相关数据的情况下,资讯投放接口信息为第一资讯投放接口信息,投放规则为信息投放计划,目标业务匹配信息为第一业务匹配信息。

另一种实施例中,在目标产品资讯相关数据为第二产品资讯相关数据的情况下,资讯投放接口信息为第二资讯投放接口信息,投放规则为信息挖掘计划,目标业务匹配信息为第二业务匹配信息。

一种实施例中,目标兴趣投放接口与资讯投放接口信息中的资讯投放接口对象的兴趣投放接口关系可以理解为目标兴趣投放接口与每条资讯投放接口对象的匹配结果,兴趣投放接口关系可以有三类,第一类是匹配成功,第二类是待进行匹配校验,第三类是匹配失败。通过上述三类兴趣投放接口关系可以完整确定出投放业务兴趣点与投放规则之间的目标业务匹配信息。从而便于后续的服务信息投放策略的确定。

另一种实施例中,上述步骤S212所描述的“根据目标兴趣投放接口与资讯投放接口信息中的资讯投放接口对象的兴趣投放接口关系,确定投放业务兴趣点与投放规则之间的目标业务匹配信息”,可以通过以下实施方式a实现。

实施方式a,确定目标兴趣投放接口对应的资讯投放接口信息中的资讯投放接口对象,作为目标资讯投放接口对象;根据兴趣投放信息特征与预设特征之间的映射关系,确定目标兴趣投放接口对应的映射兴趣投放接口;基于目标资讯投放接口对象的接口对象属性对应的映射兴趣投放接口与投放规则之间的业务匹配信息以及目标兴趣投放接口及目标资讯投放接口对象的接口对象属性对应的映射兴趣投放接口,确定投放业务兴趣点与投放规则之间的目标业务匹配信息。

在实施方式a中,兴趣投放信息特征可以理解为兴趣投放信息对应的特征向量,预设特征可以理解为在先的兴趣投放信息对应的特征向量,通过兴趣投放信息特征与预设特征之间的映射关系,能够对目标兴趣投放接口进行兴趣投放层面的映射,从而得到映射兴趣投放接口,这样可以将目标资讯投放接口对象的接口对象属性与映射兴趣投放接口进行综合考虑,从而确定目标资讯投放接口对象的接口对象属性对应的映射兴趣投放接口与投放规则之间的业务匹配信息,此外,通过目标资讯投放接口对象的接口对象属性对应的映射兴趣投放接口与投放规则之间的业务匹配信息、目标兴趣投放接口、目标资讯投放接口对象的接口对象属性对应的映射兴趣投放接口,能够准确确定投放业务兴趣点与投放规则之间的目标业务匹配信息。

在另外的一些示例中,资讯投放接口信息匹配于投放规则,资讯投放接口信息中每一条资讯投放接口对象的接口覆盖业务信息对应的当前业务匹配信息相同。其中,接口覆盖业务信息用于对兴趣投放的发起方的身份验证结果进行记录,当前业务匹配信息可以理解为当前时段的业务匹配信息。在此基础上,上述步骤S212所描述的“根据目标兴趣投放接口与资讯投放接口信息中的资讯投放接口对象的兴趣投放接口关系,确定投放业务兴趣点与投放规则之间的目标业务匹配信息”,可以通过以下实施方式b实现。

实施方式b:确定目标兴趣投放接口对应的资讯投放接口信息中的资讯投放接口对象,作为目标资讯投放接口对象;确定目标兴趣投放接口与目标资讯投放接口对象的接口对象属性之间的局部业务匹配信息,其中,局部业务匹配信息为匹配投放规则对应的投放接口资源的业务匹配信息;基于局部业务匹配信息以及资讯投放接口信息中每一条资讯投放接口对象的接口覆盖业务信息对应的当前业务匹配信息,确定目标兴趣投放接口及目标资讯投放接口对象的接口对象属性对应的映射兴趣投放接口之间的当前业务匹配信息,作为目标当前业务匹配信息;基于目标资讯投放接口对象的接口对象属性对应的映射兴趣投放接口与投放规则之间的业务匹配信息以及目标当前业务匹配信息,确定投放业务兴趣点与投放规则之间的目标业务匹配信息。

可以理解,在实施方式b中,可以对匹配投放规则对应的投放接口资源的业务匹配信息进行分析,从而确定出目标兴趣投放接口及目标资讯投放接口对象的接口对象属性对应的映射兴趣投放接口之间的当前业务匹配信息,这样能够对投放接口资源进行业务关联分析,进而准确确定投放业务兴趣点与投放规则之间的目标业务匹配信息。

在一些可能的实施例中,第一产品资讯相关数据包括基于与信息投放计划之间的业务匹配信息预设的第一组资讯发布载体,第二产品资讯相关数据包括基于与信息挖掘计划之间的业务匹配信息预设的第二组资讯发布载体,每组资讯发布载体包括多条存在相关性的资讯发布事项。在此基础上,上述步骤“对第一产品资讯相关数据和第二产品资讯相关数据进行分析,确定投放业务兴趣点与预设的信息投放计划之间的第一业务匹配信息以及投放业务兴趣点与预设的信息挖掘计划之间的第二业务匹配信息”,可以包括以下步骤S221和步骤S222。

步骤S221,对目标产品资讯相关数据进行分析,确定投放业务兴趣点在目标产品资讯相关数据中的兴趣投放接口,作为目标兴趣投放接口。

一种实施例中,目标产品资讯相关数据包括第一产品资讯相关数据和第二产品资讯相关数据。

步骤S222,根据目标兴趣投放接口与多条资讯发布载体的兴趣投放接口关系,确定投放业务兴趣点与投放规则之间的目标业务匹配信息。

一种实施例中,在目标产品资讯相关数据为第一产品资讯相关数据的情况下,多条资讯发布载体为第一组资讯发布载体中的资讯发布事项,投放规则为信息投放计划,目标业务匹配信息为第一业务匹配信息。

一种实施例中,在目标产品资讯相关数据为第二产品资讯相关数据的情况下,多条资讯发布载体为第二组资讯发布载体中的资讯发布事项,投放规则为信息挖掘计划,目标业务匹配信息为第二业务匹配信息。

步骤S300,基于第一业务匹配信息、第二业务匹配信息以及信息投放计划与信息挖掘计划之间的业务匹配信息,确定投放业务兴趣点的目标业务匹配信息。

一种实施例中,投放业务兴趣点的目标业务匹配信息包括:(1)投放业务兴趣点作为服务执行主动方的服务计划执行情况,(2)投放业务兴趣点作为服务执行被动方的服务计划执行情况,(3)投放业务兴趣点作为第三方服务执行方的服务计划执行情况。因此,通过对第一业务匹配信息、第二业务匹配信息以及信息投放计划与信息挖掘计划之间的业务匹配信息进行分析,能够完整准确地确定出投放业务兴趣点的目标业务匹配信息。

步骤S400,根据目标业务匹配信息及业务兴趣知识图谱信息,确定投放业务兴趣点的服务信息投放策略。

可以理解,在应用上述步骤S100-步骤S400所描述的内容时,能够对投放业务兴趣点在不同产品资讯推送服务下的不同产品资讯相关数据进行分析,以确定投放业务兴趣点与信息投放计划之间的第一业务匹配信息以及与信息挖掘计划之间的第二业务匹配信息,这样可以对第一业务匹配信息、第二业务匹配信息以及不同服务执行计划之间的业务匹配信息进行综合分析,以实现与当前服务执行计划的高度匹配,进而精确地确定出目标业务匹配信息。如此,可以结合目标业务匹配信息及业务兴趣知识图谱信息确定出尽可能适合当前服务执行计划的服务信息投放策略,以确保服务信息投放策略的信息推送精准度,这样能够通过服务信息投放策略对投放业务兴趣点进行准确有效的投放策略规则更新,避免服务信息投放策略的可信度过低导致的用户投诉行为。

譬如,一种实施例中,本公开实施例还提供一种基于5G互联大数据处理的投放画像确定方法,该方法还可以包括以下内容:利用服务信息投放策略对投放业务兴趣点进行投放策略规则更新,得到投放策略规则更新结果;在投放策略规则更新结果表征投放业务兴趣点不存在业务更新冲突时,获取针对目标投放业务的信息投放流程数据集合,信息投放流程数据集合包括至少两条信息投放流程数据;获得信息投放流程数据集合中的各条信息投放流程数据与目标投放业务之间的历史投放更新信息;根据各条信息投放流程数据对应的历史投放更新信息,以及各条信息投放流程数据的投放行为特征,对各条信息投放流程数据进行解析,得到相应的信息投放流程图谱;基于信息投放流程图谱生成针对目标投放业务的目标投放画像信息,目标投放画像信息包括至少两个目标投放画像日志。

一种实施例中,在以上描述的基础上,本公开实施例还可以包括以下步骤。

步骤A110,根据服务注册用户的投放业务兴趣点确定的服务信息投放策略,生成对应的投放云业务数据,并获取服务注册用户对投放云业务数据的业务反馈数据。

本实施例中,服务注册用户的投放业务兴趣点可以依据服务注册用户的用户行为爬取程序和场景互动行为爬取程序分别爬取的用户行为大数据和场景互动行为大数据进行确定,具体将在后文进行描述。

本实施例中,可以根据服务信息投放策略中所指示的每个投放业务的投放策略规则,获取与之匹配的投放云业务数据并推送给5G互联网终端,之后在服务注册用户的服务使用过程中,可以实时获取服务注册用户对投放云业务数据的业务反馈数据,这些业务反馈数据可以表征服务注册用户针对投放云业务数据的倾向意图的情况,如持续关注行为、分享行为等。

步骤A120,根据预设社交关系特征对业务反馈数据进行特征提取,得到目标社交影响特征。

其中,业务反馈数据中包括目标知识实体。例如,在智慧在线教育场景下,该业务反馈数据为在线学习行为业务数据,该目标知识实体为某一在线学习知识点。预设社交关系特征包括多个社交关系影响度,每个社交关系影响度用于表示一个社交用户在任一用户业务数据中倾向于任一知识实体所在云业务的置信度,目标社交影响特征用于表示该业务反馈数据中包含的特征信息。

步骤A130,根据所述目标社交影响特征确定所述业务反馈数据的挖掘云业务信息,以基于所述挖掘云业务信息对所述服务信息投放策略中的目标投放云业务的信息推送权重进行更新。

例如,挖掘云业务信息中可以包括每个挖掘云业务的业务反馈数据受到关注的倾向信息,进而可以基于每个挖掘云业务的业务反馈数据受到关注的倾向信息获取对应的信息推送权重的更新规则信息,然后基于对应的信息推送权重的更新规则信息对服务信息投放策略中的目标投放云业务的信息推送权重进行更新。

基于上述步骤,本实施例在对业务反馈数据进行业务挖掘的过程中,通过引入用于表示多个社交用户的倾向行为的社交关系影响度,以指示目标知识实体在业务反馈数据中所影响的目标云业务,即转换出了多个社交用户对业务反馈数据的多种倾向信息,之后,根据目标社交影响特征确定业务反馈数据的挖掘云业务信息,以基于挖掘云业务信息对服务信息投放策略中的目标投放云业务的信息推送权重进行更新,使得挖掘云业务信息中融入了多个社交用户对应的倾向信息,保证挖掘云业务信息的准确性,从而提高了用户业务数据挖掘和业务信息推送的准确性。

一种实施例中,对于步骤A130而言,可以通过以下示例性的子步骤实现,详细描述如下。

步骤A131,对目标社交影响特征进行特征还原,得到业务反馈数据的第一挖掘云业务信息。

其中,第一挖掘云业务信息用于指示目标知识实体在业务反馈数据中所影响的目标云业务。由于目标社交影响特征中包含了业务反馈数据的特征信息,且该目标社交影响特征中融入了预设社交关系特征,采用特征还原的方式来获取的第一挖掘云业务信息,相当于是多个社交关系影响度所对应的社交用户的倾向信息融合后的挖掘云业务信息。

步骤A132,根据预设社交关系特征,对第一挖掘云业务信息进行用户业务数据转换,得到多个基准挖掘云业务信息。

其中,每个基准挖掘云业务信息与一个社交关系影响度对应,每个基准挖掘云业务信息用于指示对应的社交用户所倾向的目标云业务,由于不同的社交用户的倾向情况不同,则多个基准挖掘云业务信息中所指示的目标云业务可能存在差异。第一挖掘云业务信息相当于是多个社交用户的倾向信息融合后的挖掘云业务信息,通过该预设社交关系特征中的多个社交关系影响度及第一挖掘云业务信息,转换出与多个社交用户相匹配的基准挖掘云业务信息,以指示目标知识实体在业务反馈数据中所影响的目标云业务,以便后续能够基于转换出的多个基准挖掘云业务信息来更新业务反馈数据的挖掘云业务信息,提高挖掘云业务信息的准确性。

步骤A133,基于多个基准挖掘云业务信息对目标社交影响特征进行处理,得到业务反馈数据的第二挖掘云业务信息。

由于每个基准挖掘云业务信息对应于一个社交关系影响度,每个基准挖掘云业务信息表示对应的社交用户对业务反馈数据进行关注的倾向信息,则基于该多个基准挖掘云业务信息对目标社交影响特征进行处理,以提高第二挖掘云业务信息的准确性。

如此,在对业务反馈数据进行业务挖掘的过程中,通过引入用于表示多个社交用户的倾向行为的社交关系影响度,转换出与多个社交用户相匹配的基准挖掘云业务信息,以指示目标知识实体在业务反馈数据中所影响的目标云业务,即转换出了多个社交用户对业务反馈数据的多种倾向信息,之后,通过多个基准挖掘云业务信息及业务反馈数据的目标社交影响特征来获取业务反馈数据的第二挖掘云业务信息,使得第二挖掘云业务信息中融入了多个社交用户对应的倾向信息,保证第二挖掘云业务信息的准确性,从而提高了用户业务数据挖掘的准确性。

图3为本公开实施例提供的基于云计算的5G互联大数据处理装置300的功能模块示意图,下面分别对该基于云计算的5G互联大数据处理装置300的各个功能模块的功能进行详细阐述。

获取模块310,用于获取5G互联网终端200的服务注册用户的用户行为爬取程序和场景互动行为爬取程序分别爬取的用户行为大数据和场景互动行为大数据。

第一确定模块320,用于根据用户行为大数据确定对应目标投放业务的第一投放业务兴趣信息,根据场景互动行为大数据确定目标投放业务的第二投放业务兴趣信息。

第二确定模块330,用于通过第一投放业务兴趣信息和第二投放业务兴趣信息确定目标投放业务的综合投放业务兴趣数据。

选取模块340,用于基于投放业务的业务节点顺序,通过业务窗口依次从综合投放业务兴趣数据中选取处于业务窗口中的后续投放业务兴趣点以及对应的兴趣点属性。

第三确定模块350,用于根据业务窗口选取的兴趣点属性对后续投放业务兴趣点进行聚类,确定目标投放业务中针对服务注册用户的投放业务兴趣点。

图4示出了本公开实施例提供的用于实现上述的基于云计算的5G互联大数据处理方法的大数据推送系统100的硬件结构示意图,如图4所示,大数据推送系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。

在具体实现过程中,至少一个处理器110执行机器可读存储介质120存储的计算机执行指令,使得处理器110可以执行如上方法实施例的基于云计算的5G互联大数据处理方法,处理器110、机器可读存储介质120以及通信单元140通过总线130连接,处理器110可以用于控制通信单元140的收发动作,从而可以与前述的5G互联网终端200进行数据收发。

处理器110的具体实现过程可参见上述大数据推送系统100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。

此外,本公开实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上基于云计算的5G互联大数据处理方法。

最后,应当理解的是,本说明书中实施例仅用以说明本说明书实施例的原则。其它的变形也可能属于本说明书范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导匹配。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号