首页> 中国专利> 归因分析系统、训练方法、归因分析方法以及装置

归因分析系统、训练方法、归因分析方法以及装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明实施例公开了一种归因分析系统、训练方法、归因分析方法以及装置。该系统包括：触点编码模块，用于对分析对象的行为数据进行触点编码，得到触点编码数据；触点分析模块，用于对分析对象数据和操作对象数据进行触点贡献分析，得到初始触点贡献数据，其中，所述分析对象数据包括所述分析对象的行为数据和分析对象标签；数据融合模块，用于将所述触点编码数据和所述初始触点贡献数据进行数据融合，得到所述分析对象的触点贡献数据。通过本发明实施例公开的技术方案，实现了在保证归因结果准确的前提下，提升归因分析的效率。

著录项

公开/公告号CN114841747A

专利类型发明专利
公开/公告日2022-08-02

原文格式PDF
申请/专利权人北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司;
展开▼

申请/专利号CN202210515139.4
发明设计人徐岱;
展开▼

申请日2022-05-11
分类号G06Q30/02(2012.01);G06K9/62(2022.01);G06F40/30(2020.01);
代理机构北京品源专利代理有限公司 11332;
代理人岳晓萍
地址 100176 北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室
入库时间 2023-06-19 16:14:25

法律信息

法律状态公告日

法律状态信息

法律状态
2022-08-19

实质审查的生效 IPC(主分类):G06Q30/02 专利申请号:2022105151394 申请日:20220511

实质审查的生效

说明书

技术领域

本发明实施例涉及人工智能技术，尤其涉及一种归因分析系统、训练方法、归因分析方法以及装置。

背景技术

在互联网购物过程中，用户从搜索商品到下单成功可以成为用户转化的过程。通常用户转化是由多种因素造成的，每个行为都有一定的贡献度。商家和平台希望通过归因分析，即分析用户行为，确定各个行为对最终转化的贡献度，从而指导更高效的营销策略和资源配置。

现有技术中常用的归因分析方法有两类，一类基于规则，一类是多触点归因模型。

在现有技术的实施过程中，基于规则方法进行归因存在考虑特征单一的问题，从而导致归因结果不准确。多触点归因模型通过使用正负样本等多特征的训练模型能够避免上述缺陷。但是现有的多触点归因模型的一个主要问题是计算量大，比较耗时，从而导致归因分析的效率较低。

发明内容

本发明提供了一种归因分析系统、训练方法、归因分析方法以及装置，以实现在保证归因结果准确的前提下，提升归因分析的效率。

根据本发明的一方面，提供了一种归因分析系统，该系统包括：

触点编码模块，用于对分析对象的行为数据进行触点编码，得到触点编码数据；

触点分析模块，用于对分析对象数据和操作对象数据进行触点贡献分析，得到初始触点贡献数据，其中，所述分析对象数据包括所述分析对象的行为数据和分析对象标签；

数据融合模块，用于将所述触点编码数据和所述初始触点贡献数据进行数据融合，得到所述分析对象的触点贡献数据。

根据本发明的另一方面，提供了一种归因分析方法，该方法包括：

获取分析对象数据和操作对象数据，将所述分析对象数据和操作对象数据输入至如任一实施例所述的归因分析系统，得到所述归因分析系统输出的触点贡献数据。

根据本发明的另一方面，提供了一种归因分析系统的训练方法，该训练方法包括：

获取样本数据，其中，所述样本数据包括操作成功的正样本数据和操作失败的负样本数据，所述分析对象数据和操作对象数据；

基于所述样本数据对待训练的归因分析系统进行迭代训练，直到满足训练结束条件，得到训练完成的归因分析系统：

将所述样本数据输入至所述归因分析系统中，得到所述样本数据中分析对象的触点贡献数据，其中，所述触点贡献数据中包括所述样本数据中存在的行为触点的第一数据和所述样本数据中不存在的行为触点的第二数据；

基于所述第一数据和第二数据，以及其分别对应的标准数据，确定损失函数，并基于损失函数对所述归因分析系统进行参数调节。

根据本发明的另一方面，提供了一种归因分析系统的训练装置，该心理装置包括：

数据获取模块，用于获取样本数据，其中，所述样本数据包括操作成功的正样本数据和操作失败的负样本数据，所述分析对象数据和操作对象数据；

归因分析系统训练模块，用于基于所述样本数据对待训练的归因分析系统进行迭代训练，直到满足训练结束条件，得到训练完成的归因分析系统：

触点贡献数据获取模块，用于将所述样本数据输入至所述归因分析系统中，得到所述样本数据中分析对象的触点贡献数据，其中，所述触点贡献数据中包括所述样本数据中存在的行为触点的第一数据和所述样本数据中不存在的行为触点的第二数据；

归因分析系统调节模块，用于基于所述第一数据和第二数据，以及其分别对应的标准数据，确定损失函数，并基于损失函数对所述归因分析系统进行参数调节。

根据本发明的另一方面，提供了一种电子设备，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例所述的归因分析方法；和/或，执行任一实施例所述的归因分析系统的训练方法。

根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本发明任一实施例所述的归因分析方法；和/或，执行任一实施例所述的归因分析系统的训练方法。

本发明实施例的技术方案具体包括：触点编码模块，用于对分析对象的行为数据进行触点编码，得到触点编码数据；触点分析模块，用于对分析对象数据和操作对象数据进行触点贡献分析，得到初始触点贡献数据，其中，所述分析对象数据包括所述分析对象的行为数据和分析对象标签；数据融合模块，用于将所述触点编码数据和所述初始触点贡献数据进行数据融合，得到所述分析对象的触点贡献数据。本发明实施例的技术方案通过将行为数据直接输入至上述归因分析系统中，并直接得到归因分析系统输出的各行为的触点贡献数据，实现了在保证归因结果准确的前提下，提升归因分析的效率。

应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例中提供的一种归因分析系统的结构图；

图2是本发明实施例中提供的另一种归因分析系统的结构图；；

图3是本发明实施例中提供的一种归因分析方法的流程图；

图4是本发明实施例中提供的一种归因分析系统训练方法的流程图；

图5是本发明实施例中提供的另一种归因分析系统训练方法的流程图；

图6是本发明实施例中提供的另一种归因分析系统的结构图；

图7是本发明实施例中提供的一种归因分析系统训练装置的结构图；

图8是本发明实施例中提供的一种电子设备的结构图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1为本发明实施例提供的一种归因分析系统的结构图，本实施例可适用于对分析对象在完成某一操作的过程中各操作行为对操作完成所做出的贡献程度进行分析情况，尤其可适用于在网络购物过程中对成功下单的用户在下单之前的各行为对下单的贡献程度进行分析的场景中；同时也可以适用于其他场景中对操作行为的贡献程度进行分析的场景。具体的，该系统包括如下模块：

触点编码模块110，用于对分析对象的行为数据进行触点编码，得到触点编码数据；

触点分析模块120，用于对分析对象数据和操作对象数据进行触点贡献分析，得到初始触点贡献数据，其中，所述分析对象数据包括所述分析对象的行为数据和分析对象标签；

数据融合模块130，用于将所述触点编码数据和所述初始触点贡献数据进行数据融合，得到所述分析对象的触点贡献数据。

在本发明实施例中，分析对象可以理解为执行了至少一项行为触点而达成预设执行结果的行为对象，该分析对象可以包括但不限于人和电子设备等，在一些实施例中，分析对象可以是执行操作的操作用户。通常达成预设执行结果是有多种影响因素导致的，每种影响因素都做出了或大或小的贡献。为了分析各影响因素在达成预设执行结果的过程中所做出的贡献程度，即贡献度，需要对各影响因素进行归因分析。具体的，可以对分析对象、该分析对象所执行的行为触点以及执行行为触点过程中涉及的操作对象进行触点分析，从而得到分析对象的触点贡献数据。本实施例中，触点贡献数据可以包括各触点和各触点分别对应的贡献数据。

需要说明的是，本实施例中触点可以理解为是导致达成预设执行结果的影响因素，相应的，触点可以理解为用户在达成预设执行结果过程中影像该预设行为结果的用户行为，或者触点还可以理解为任务执行过程中的操作节点等。示例性的，以用户行为为例，如果有多项用户行为，则相应有多个行为触点；即每一项用户行为可以理解为一个行为触点，并且在执行用户行为过程中按照执行的顺序可以生成行为序列。

进一步的，对上述行为序列进行分析，从而确定各影响因素的贡献度的过程还可以理解为对行为序列中的各行为触点进行归因分析，从而确定分析对象的触点贡献数据的过程。

可选的，得到分析对象的触点贡献数据的方法可以包括获取分析对象的分析对象数据、和分析对象执行用户行为的操作对象的操作对象数据，其中，分析对象数据包括在用户行为的执行过程对应的行为数据以及分析对象标签，并对上述数据进行数据分析处理从而得到分析对象的触点贡献数据。

本实施例中，分析对象在用户行为执行过程中，系统采集各用户行为所生成的数据可以作为行为数据。其中，行为数据的存储可以是基于各用户行为被执行的顺序依次存储的，从而基于行为数据可以确定用户在达成预设执行结果的过程中用户行为的执行顺序，即得到用户行为序列。具体的，根据不同的业务场景会执行不同的用户行为，从而生成不同的行为数据。例如在互联网购物场景中，分析对象可以包括下单的用户，相应的，用户行为可以理解为进行商品搜索、打开商品详情查看页以及查看购物平台或者商家设置的优惠活动等行为。再例如在金融场景中，分析对象可以包括进行理财的用户，相应的，用户行为可以理解为搜索理财产品、查看理财产品等行为。

可选的，获取各用户行为分别对应的行为数据，并基于触点编码模块110对该行为数据进行触点编码，得到触点编码数据，通过触点编码数据可确定用户行为数据中的行为触点类型，即用户行为中存在的行为触点类型，实现在一次归因分析过程中，对行为数据中存在多个行为触点进行同步分析，以减少对多个行为触点的分析次数，提高多行为触点的归因分析效率。

具体的，编码数据可以理解为基于各行为触点以及各行为触点对应的行为数据所组成的一维向量矩阵。触点编码可以理解为基于在达成预设执行结果的过程中识别到的行为触点对初始编码数据中行为触点分别对应的编码数据进行编码更新，从而得到各行为数据分别对应的编码向量。

本实施例中，触点编码模块可以是二值编码器，相应的，进行触点编码的方法可以理解为对获取到的行为数据中所包含的行为触点对应的编码值进行二值化编码更新，从而确定在达成当前预设行为结果的过程中执行了那些用户行为，即确定对当前预设行为结果存在贡献的用户行为。

在本发明实施例中，基于触点编码模块110对分析对象的行为数据进行触点编码，具体的，基于触点编码模块识别行为数据中的行为触点类型；在初始编码数据中，将识别出的行为触点类型对应的编码值设置为预设编码值，以及将未识别出的行为触点类型对应的编码值保持为初始编码值。

本实施例中，在基于各用户行为生成行为数据的过程中，任一用户行为在被执行时会生成一串标识符作为该用户行为的行为触点标识，并将该用户行为的行为触点标识存储于行为数据中。可选的，行为触点标识可以是基于行为执行时间和行为类型所生成的字符串；当然还可以是其他形式的标识符，本实施例对此不加以限制。

具体的，在触点编码模块110对行为数据进行识别的过程中，若识别到任一行为触点标识，则基于该行为触点标识更新触点编码中的对应编码值。本实施例中，初始编码数据包括各行为触点对应的初始编码值，例如初始触点编码为一一维向量，该一维向量中包括多个行为触点对应的初始编码值。具体的，基于识别到的行为触点类型，更新初始触点编码中该行为触点类型对应的编码值；例如将该行为触点类型的初始编码值更新为预设编码值。进一步的，若分析对象的行为数据识别完毕后还有未识别出的行为触点类型，则其对应的编码值保持初始编码值。需要说明的是，本实施例中的初始编码值可以是0，预设编码值可以为1；当然，预设编码值可以是除0以外的其他数值，本实施例中不加以限制。通过将未识别处理的行为触点类型对应的编码值设置为0，避免行为数据中不存在的行为触点的非零贡献值的错误干扰。

本实施例中，对于基于触点编码模块确定的行为触点，基于触点分析模块120对用户对象数据和操作对象数据处理，确定初始触点贡献数据，该初始触点贡献数据中包括行为数据中存在行为触点的初始贡献数据和行为数据中不存在的行为触点的初始贡献值，通过初始触点贡献数据与触点编码的融合，确定最终的触点贡献数据。

需要说明的是，分析对象数据包括分析对象的行为数据和分析对象的分析对象标签。分析对象标签可以理解为预先为分析对象设置的标签，并且该标签和其所应用的业务场景有关联，比如在互联网购物场景下，分析对象标签可以包括但不限于下单用的年龄、性别、地域、购买偏好等标签。再例如在金融场景下，分析对象标签可以包括但不限于理财用户的账户、职业等标签。操作对象可以理解为分析对象执行用户行为的对象。操作对象数据可以包括操作对象的属性数据；例如，在互联网购物场景下，操作对象可以是用户下单的商品，相应的，操作对象数据包括但不限于商品的品牌质量和历史用户评价等数据。再例如在金融场景下，用户申请的理财产品；相应的，操作对象数据包括但不限于产品的收益和适应职业等数据。

在一些实施例中，触点分析模块120可以是网络结构模块，该触点分析模块120的网络结构可以是诸如卷积神经网络、多层感知器等的结构，对此不作限定。该触点分析模块120预先经过训练，具有贡献数据分析功能，对于输入的用户对象数据和操作对象数据处理进行分析处理，以得到初始触点贡献数据。

在一些实施例中，触点分析模块120可以包括预先训练的编码器和贡献数据分析器，编码器和贡献数据分析器可以分别为预先训练的网络结构，不限定编码器和贡献数据分析器的具体结构。在获取到分析对象的行为数据之后，可以基于预先训练好的编码器提取上述行为数据中的行为特征，该编码器可以是具有语义提取功能的编码器，贡献数据分析器基于该行为特征、分析对象标签和操作对象数据进行触点贡献分析，得到初始触点贡献数据。即可以确定上述行为数据中哪些用户行为在达成预设执行结果的过程中做出了贡献。

进一步的，在获取初始触点贡献数据之后，基于数据融合模块将触点编码数据和初始触点贡献数据进行数据融合处理，从而得到分析对象的触点贡献数据。具体的，可以是将触点编码数据和初始触点贡献数据进行內积，得到分析对象的触点贡献数据。

本实施例中的归因分析系统为端到端的处理系统，其中，触点编码模块和触点分析模块的输入端作为归因分析系统的输入端，触点编码模块对应的输入数据为分析对象的行为数据，触点分析模块的输入信息包括分析对象数据和操作对象数据，归因分析系统对上述输入数据自动进行处理，输出分析对象的分析结果，即触点贡献数据。该端到端的归因分析系统，对于操作用户而言，处理方式简单，降低了对操作用户的技能需求。

本发明实施例的技术方案中，通过触点编码模块对分析对象的行为数据进行触点编码，得到触点编码数据；通过触点分析模块对分析对象数据和操作对象数据进行触点贡献分析，得到初始触点贡献数据，以及通过数据融合模块，将所述触点编码数据和所述初始触点贡献数据进行数据融合，得到所述分析对象的触点贡献数据。本发明实施例的技术方案通过提取行为数据中的全部行为触点，对多个行为触点，基于分析对象数据和操作对象数据进行同步归因分析，并直接得到归因分析系统输出的各行为触点的触点贡献数据，实现了在保证归因结果准确的前提下，提升归因分析的效率。

图2为本发明实施例提供的另一种归因分析系统的结构图，本发明实施例与上述实施例中各个可选方案可以结合。在上述实施例的基础上，可选地，触点分析模块120包括：语义特征提取单元121，用于对分析对象的行为数据进行语义提取，得到行为语义特征；特征交互单元122，用于对行为语义特征、分析对象标签和操作对象数据处理，得到交互特征；贡献处理单元123，用于对交互特征进行处理，得到初始触点贡献数据。

如图2所示，本发明实施例具体包括如下内容：

本实施例中，行为语义提取单元121可以包括预先训练好的编码器；具体的，基于该训练好的编码器对行为数据进行语义提取，从而得到行为数据中的行为语义特征。特征交互单元122可以包括预先训练好的多层感知器网络；具体的，采用多层感知器网络对提取到的行为语义特征和获取到的分析对象标签和操作对象数据进行特征交互处理，得到分析对象的交互特征。

贡献处理单元123中包括处理层1231和激活函数层1232，其中，激活函数层中的激活函数的数值范围大于0，用于将处理层的处理结果转换为非负数。处理层1231可以理解为预先训练的全连接层网络；具体的，基于全连接层网络对上述得到的交互特征进行特征处理，从而到贡献层输出的处理结果。激活函数层1232中的激活函数的数值范围大于0，用于将处理层的处理结果转换为非负数，从而得到分析对象的初始触点贡献数据，示例性的，激活函数层1232中的激活函数可以是Sigmoid函数，该Sigmoid函数的数值范围大于0，且小于1，即：

采用上述激活函数层1232对处理层1231的输出结果进行处理的有益效果在于可以可以直接规避掉输出结果中的负值。因为通常情况下负值表示该行为触点在达成预设执行结果的过程中起反作用。所以，上述技术方案避免了处理结果中出现负值而导致解释性不好的情况。

需要说明的是，触点分析模块120中的各单元的实现方式只是作为可选实施例进行介绍，在具体应用中还可以根据实际情况采用其他实现方式实现触点分析，本实施例对上述各单元的实现方式不加以限制。

本发明实施例的技术方案，通过对分析对象的行为数据进行语义提取，得到行为语义特征，通过特征交互单元对行为语义特征、分析对象标签和操作对象数据处理，得到交互特征；通过贡献处理单元对交互特征进行处理，得到初始触点贡献数据，以及通过将初始触点贡献数据与触点编码数据进行融合，得到目标触点贡献数据。本发明实施例的技术方案通过将行为数据直接输入至上述归因分析系统中，并直接得到归因分析系统输出的各行为的触点贡献数据，并且归因分析系统中的贡献处理单元通过特定的激活函数，保证所有贡献都是非负的，避免了处理结果中出现负值而导致解释性不好的情况。

在上述实施例基础上，图3为本发明实施例提供的一种归因分析方法的流程图，本实施例可适用于对分析对象在完成某一操作的过程中各操作行为对操作完成所做出的贡献程度进行分析情况，尤其可适用于在网络购物过程中对成功下单的用户在下单之前的各行为对下单的贡献程度进行分析的场景中；同时也可以适用于其他场景中对操作行为的贡献程度进行分析的场景。该方法可以由上述归因分析系统来执行，该归因分析系统可以由软件和/或硬件来实现，该归因分析系统可以配置在电子计算设备上。

如图3所示，该方法具体包括以下步骤：

S310、获取分析对象数据和操作对象数据。

S320、将分析对象数据和操作对象数据输入至归因分析系统，得到归因分析系统输出的触点贡献数据。

在本实施例中，分析对象数据可以包括分析对象的行为数据和分析对象标签。具体的，分析对象标签可以理解为预先为分析对象设置的用户标签，并且该标签和其所应用的业务场景有关联，比如在互联网购物场景下，分析对象标签可以包括但不限于下单用的年龄、性别、地域、购买偏好等标签。再例如在金融场景下，分析对象标签可以包括但不限于理财用户的年龄、地域、职业等标签。操作对象可以理解为分析对象执行用户行为的对象。操作对象数据可以包括操作对象的属性数据；例如，在互联网购物场景下，操作对象可以是用户下单的商品，相应的，操作对象数据包括但不限于商品的品牌质量和历史用户评价等数据。再例如在金融场景下，用户申请的理财产品；相应的，操作对象数据包括但不限于产品的收益和适应职业等数据。

进一步的，将获取到的分析对象数据和操作对象数据输入至归因分析系统中，从而得到该归因分析系统输出的触点贡献数据。本实施例中，触点贡献数据可以包括各触点和各触点分别对应的贡献数据。归因分析系可以理解为上述实施例中任一的归因分析系统，再次本实施例不再赘述。采用上述归因分析系统确定触点贡献数据的有益效果在于在将输入数据输入系统之后，可以直接到得到输入数据的各行为触点所对应的触点贡献数据，这样对每个分析对象的输入数据，只需要通过上述系统计算一次，就能得到各行为触点的贡献数据；在保证计算结果准确性的前提下，减小了系统的计算量，从而提高了归因分析的分析效率。

本发明实施例的技术方案通过将行为数据直接输入至上述归因分析系统中，并直接得到归因分析系统输出的各行为的触点贡献数据，实现了在保证归因结果准确的前提下，提升归因分析的效率。

在上述实施例基础上，图4为本发明实施例提供的一种归因分析系统训练方法的流程图，本实施例可适用于对分析对象在完成某一操作的过程中各操作行为对操作完成所做出的贡献程度进行分析情况，尤其可适用于在网络购物过程中对成功下单的用户在下单之前的各行为对下单的贡献程度进行分析的场景中；同时也可以适用于其他场景中对操作行为的贡献程度进行分析的场景。该方法可以由上述归因分析系统训练装置来执行，该归因分析系统训练装置可以由软件和/或硬件来实现，该归因分析系统训练装置可以配置在电子计算设备上。

如图4所示，该方法具体包括以下步骤：

S410、获取样本数据，其中，样本数据包括操作成功的正样本数据和操作失败的负样本数据，分析对象数据和操作对象数据。

S420、将样本数据输入至归因分析系统中，得到样本数据中分析对象的触点贡献数据，其中，触点贡献数据中包括样本数据中存在的行为触点的第一数据和样本数据中不存在的行为触点的第二数据。

S430、基于第一数据和第二数据，以及其分别对应的标准数据，确定损失函数，并基于损失函数对归因分析系统进行参数调节。

在满足训练结束条件的情况下，得到训练完成的归因分析系统，在不满足训练训练结束条件的情况下，返回执行步骤S420，直到满足训练结束条件。

在本发明实施例中，样本数据可以理解为分析对象为达到预设执行结果而执行行为触点的历史行为数据。对于不同的业务场景，执行的行为触点不同，从而得到的样本数据也不相同。具体的，样本数据包括操作成功的正样本数据和操作失败的负样本数据。例如在互联网购物场景中，样本数据可以包括购物用户在购物下单过程中的样本数据。相应的，操作成功的正样本数据可以理解为用户浏览商品之后成功下单的样本数据。操作失败的负样本数据可以理解为用户浏览商品之后未成功下单的样本数据。

分析对象数据可以包括分析对象的行为数据和分析对象标签。具体的，分析对象标签可以理解为预先为分析对象设置的用户标签，并且该标签和其所应用的业务场景有关联，比如在互联网购物场景下，分析对象标签可以包括但不限于下单用的年龄、性别、地域、购买偏好等标签。再例如在金融场景下，分析对象标签可以包括但不限于理财用户的年龄、地域、职业等标签。操作对象可以理解为分析对象执行用户行为的对象。操作对象数据可以包括操作对象的属性数据；例如，在互联网购物场景下，操作对象可以是用户下单的商品，相应的，操作对象数据包括但不限于商品的品牌质量和历史用户评价等数据。再例如在金融场景下，用户申请的理财产品；相应的，操作对象数据包括但不限于产品的收益和适应职业等数据。

进一步的，获取待训练的归因分析系统，基于样本数据对该待训练的归因分析系统进行迭代训练，得到训练完成的归因分析系统。具体的，训练过程可以包括：将样本数据输入至待训练的归因分析系统中，得到该系统输出的样本预测结果。样本预测结果包括样本数据中分析对象的触点贡献数据，其中，触点贡献数据中包括样本数据中存在的行为触点的第一数据和样本数据中不存在的行为触点的第二数据。上述技术方案通过分别获取样本数据中存在的行为触点的第一数据和样本数据中不存在的行为触点的第二数据，可以直接获知在达成预设执行行为的过程中做出贡献的行为触点，以及未做出贡献的行为触点，可以更加准确的确定各行为触点分别对应的触点贡献数据。

进一步的，获取第一数据和第二数据分别对应的标准数据，并基于第一数据和第二数据，以及其分别对应的标准数据，确定损失函数，并基于损失函数对归因分析系统进行参数调节。其中，标准数据可以是预先设置的目标数据，即将该目标数据可以作为标签数据，与待训练的模型输出的预测数据生成损失函数，从而完成对归因分析系统进行参数调节。示例性的，对于正样本数据，第一数据对应的目标数据可以是1，第二数据可以是0；对于负样本数据，第一数据对应的目标数据可以是0，第二数据可以是0。

具体的，可以是基于上述确定的损失函数对待训练的归因分析系统进行重复训练，直至上述归因分析系统在训练过程中收敛，即归因分析系统的损失值趋于零或者长时间趋于稳定不再随着训练次数的增加而改变，确定此时的归因分析系统满足训练停止条件，即完成模型训练，得到训练完成的归因分析系统。

本实施例的技术方案，通过获取样本数据，其中，所述样本数据包括操作成功的正样本数据和操作失败的负样本数据，所述分析对象数据和操作对象数据；基于所述样本数据对待训练的归因分析系统进行迭代训练，直到满足训练结束条件，得到训练完成的归因分析系统：将所述样本数据输入至所述归因分析系统中，得到所述样本数据中分析对象的触点贡献数据，其中，所述触点贡献数据中包括所述样本数据中存在的行为触点的第一数据和所述样本数据中不存在的行为触点的第二数据；基于所述第一数据和第二数据，以及其分别对应的标准数据，确定损失函数，并基于损失函数对所述归因分析系统进行参数调节。上述技术方案通过采用样本数据中存在的行为触点的第一数据和所述样本数据中不存在的行为触点的第二数据对归因分析系统进行训练，得到训练完成的模，以实现可以直接获知在达成预设执行行为的过程中做出贡献的行为触点，以及未做出贡献的行为触点，可以更加准确的确定各行为触点分别对应的触点贡献数据从而实现了在保证归因结果准确的前提下，提升归因分析的效率。

在上述实施例的基础上，图5为本发明实施例提供的另一种归因分析系统训练方法的流程图，本发明实施例与上述实施例中各个可选方案可以结合。在本发明实施例中，可选地，归因分析系统中的语义特征提取单元为预先训练得到的编码器；

相应的，基于损失函数对归因分析系统进行参数调节，包括：基于损失函数对归因分析系统中的特征交互单元和贡献处理单元进行参数调节。

如图5所示，该方法具体包括以下步骤：

S510、获取样本数据，其中，样本数据包括操作成功的正样本数据和操作失败的负样本数据，分析对象数据和操作对象数据；

S520、将样本数据输入至归因分析系统中，得到样本数据中分析对象的触点贡献数据，其中，触点贡献数据中包括样本数据中存在的行为触点的第一数据和样本数据中不存在的行为触点的第二数据；

S530、基于第一数据和第二数据，以及其分别对应的标准数据，确定损失函数，并基于损失函数对归因分析系统中的特征交互单元和贡献处理单元进行参数调节。

在满足训练结束条件的情况下，得到训练完成的归因分析系统，在不满足训练训练结束条件的情况下，返回执行步骤S520，直到满足训练结束条件。

在本发明实施例的过程中，归因分析系统包括触点分析模块，触点分析模块包括语义特征提取单元、特征交互单元和贡献处理单元。其中，语义特征提取单元为预先训练得到的编码器。

在上述实施例的基础上，本实施例在对归因分析系统进行训练的过程中可以直接使用预先训练好的语义特征提取单元对触点分析模块中的特征交互单元和贡献处理单元进行参数调节，从而得到训练完成的归因分析系统。

值得注意的是，在对归因分析系统进行训练之前，因为直接采用训练好的语义特征提取单元，所以需要预先对语义特征提取单元进行训练。

可选的，语义特征提取单元的训练方法包括：获取样本数据中分析对象的行为数据，提取行为数据中的行为序列；基于行为序列确定训练输入数据和标准输出数据，其中，训练输入数据为行为数据中的局部连续子序列，标准输出数据为相对于训练输入数据错后一位的局部连续子序列；将训练输入数据输入至训练模型中，得到训练模型输出的训练输出数据，其中，训练模型包括编码器和解码器；基于标准输出数据和训练输出数据对训练模型进行参数调节，迭代执行训练模型的训练过程，直到满足训练完成条件时，将训练完成的编码器确定为语义特征提取单元。

具体的，获取行为数据中的行为序列的方法可以包括：依照各行为触点的执行顺序，提取各行为触点的触点数据，得到行为数据中的行为序列。示例性的，在互联网购物场景中，用户通过一系列的浏览、点击、输入等交互行为，最终下单购买。在上述的用户行为所对应的行为数据中，提取到的行为序列可以包括搜索-推荐-广告-商品详情页-下单。其可以表示用户先搜索，然后浏览了广告，到了商品详情页，最后下单的执行顺序。

进一步的，基于获取到的行为序列确定训练输入数据和标准输出数据。可选的，可以通过对获取到的行为序列进行序列编码，从而得到具有时序关系的各子序列。其中，各子序列之间可以表示出分析对象的前置行为是后置行为的一个必要条件，比如上述互联网购物场景中，搜索就是推荐的前置行为，反之推荐是搜索的后置行为。从而可以使得到的训练模型更准确的提取行为数据的语义特征。

需要解释的是，训练输入数据为行为数据中的局部连续子序列；标准输出数据为相对于训练输入数据错后一位的局部连续子序列。

具体的，局部连续子序列可以理解为行为序列中连续的部分序列。例如，在上述互联网购物场景中，获取到的行为数据中的行为序列包括搜索-推荐-广告-商品详情页-下单。则局部连续子序列可以包括搜索-推荐、搜索-推荐-广告以及推荐-广告-商品详情页等连续子序列。但是，需要注意的是，为了可以得到错后一位的标准输出数据，训练输入数据中的局部连续子序列不包括行为序列中最后一个行为。进一步的，若确定当前训练输入数据为推荐-广告-商品详情页，则标准输出的局部连续子序列可以是广告-商品详情页-下单。

进一步的，将训练输入数据输入至训练模型中，得到训练模型输出的训练输出数据。具体的，将训练输出数据作为样本预测结果，将基于样本子序列上述标准输出结果作为标签数据，从而基于样本预测结果进而标签数据生成训练模型的损失函数，并基于损失函数对该训练模型的参数进行调节，得到训练完成的训练模型。

需要说明的是，训练模型包括编码器和解码器。具体的，编码器和解码器都采用单向而不是双向的循环神经网络，其效果在于可以更加准确的学习上述行为序列中各子序列之间的时序关系。

本实施例的技术方案，通过预先对归因分析系统中的语义特征提取单元进行训练，并采用训练完成的语义特征提取单元对归因分析系统中的其他单元进行训练，提高了系统的训练速度，从而调高了采用系统进行归因分析的效率。

在上述技术方案的基础上，本实施例还提供了一个优选实施例，该实施例具体介绍了在互联网购物场景下采用上述归因分析系统对分析对象的行为触点进行归因分析，从而得到分析对象的触点贡献数据。具体的参见图6，该技术方案包括如下内容：

基于图6可知，图中具体包括三部分：第一部分为编码器训练模块、第二部分为归因分析系统和其对应的训练模块。其中，归因分析系统仅在训练时会更新系统参数，在预测时仅用于输入数据之后直接得到输出的触点贡献数据。本实施例中，归因分析系统是端到端系统，其主要体现在输入数据后，直接得到输出结果中各个触点的贡献度，不需要重复调用系统进行计算。本实施例中贡献处理层包含一一对应的行为触点和触点贡献数据。这样对每组输入数据，只需要通过上述归因分析系统计算一次，就能得到该组输入数据中各个行为触点的贡献度。

可选的，在对归因分析系统进行训练之前，先对系统中的编码器进行训练，即基于用户行为序列对第一部分中的编码器和解码器进行训练。其中，图中的用户行为可以理解为分析对象的行为数据。具体的，对用户行为序列进行编码处理，据得到用于对编码器训练的训练输入数据和输出序列；进一步的，将得到的训练输入数据输入至待训练的编码器和解码器中，得到解码器输出的训练输出结果，并将该训练输出结果作为样本预测数据与作为标签数据的输出序列生成损失函数，对编码器和解码器中的参数进行调节，得到训练完成的编码器和解码器。

进一步的，编码器训练好以后，基于训练好的解码器对当前的归因分析系统进行训练。其中，该归因分析系统的输入数据包括三种数据，包括：分析对象的行为数据、分析对象的分析对象数据中的分析对象标签和分析对象的操作对象数据。其中，分析对象的行为数据可以理解为用户行为序列，分析对象的分析对象数据中的分析对象标签可以理解为用户画像标签，分析对象的操作对象数据可以理解为品类品牌特征。具体的，用户行为序列是指类似搜索-推荐-广告-下单的序列，这构成了一条购物路径，表示用户先搜索，再被推荐曝光，又被广告曝光，然后下单购买。用户画像标签指打在用户身上的标签，且与购买有关联，比如用户的年龄、性别、地域、购买偏好等。品类品牌特征是指用户浏览、点击、购买了哪些品类哪些品牌的商品。

具体的，采用训练好的编码器对用户行为序列进行编码，输出128维向量。用户画像标签采用离散值向量，品类品牌特征都使用了64维嵌入向量，这三类数据输入到特征交互层，即归因分析系统中的特征交互单元。特征交互层使用简单的多层感知器网络，该层用来分析不同用户在不同品类上的交互行为。触点贡献输出层即贡献处理层用于输出各个触点的初始贡献度，输出的结果数等于要归因的触点数目。为了使得每个触点的功劳非负，我们使用激活函数Sigmoid：

其中，0

进一步的，本实施例中的二值编码器是保证触点贡献层中的贡献值与触点一一对应的核心。二值编码器目的是对用户行为序列做二值化，使出现的触点对应位置为1，没出现为0。从而可以表示用户行为序列中出现了哪些触点。例如，当前用户行为序列中有100个触点，用户行为序列的类型包括为搜索-推荐-广告-搜索，则可以生成一个100维的零值向量(0,0,0,…,0)。进一步的，如果搜索、推荐、广告分别对应向量的前三个索引，那么置这三个索引位置为1，其他都为0，得到向量b＝(1,1,1,…,0)，即为二值编码器的输出。如果触点贡献层输出向量为y＝(a_1,a_2,…,a_100)，那么向量内积b·y＝a_1+a_2+a_3表示序列存在触点的贡献和。从而可以计算序列不存在触点的贡献和(1-b)·y＝a_4+a_5+(…+a)_100。从而为构建归因分析系统的优化目标做准备。

再一步的，归因分析系统的目标是行为序列中所有出现的触点分享功劳，未出现的触点没有功劳。即假设某个样本包含触点a

其中，a

进一步的，基于目标和样本数据对归因分析系统进行训练，得到训练好的归因分析系统之后，只需要使用归因分析系统做归因分析。其中，输入可以是用户行为序列、用户画像标签和品类品牌特征，输出结果可以是各个触点的贡献度。实际应用中，各个触点的贡献和并不等于1，所以需要标准化，即对各触点的贡献进行归一化处理。具体的，归一化处理可以采用现有归一化处理方法，本实施例对归一化方法不加以限定。

图7为本发明实施例提供的一种归因分析系统的训练装置的结构图，本实施例可适用于对分析对象在完成某一操作的过程中各操作行为对操作完成所做出的贡献程度进行分析情况，尤其可适用于在网络购物过程中对成功下单的用户在下单之前的各行为对下单的贡献程度进行分析的场景中；同时也可以适用于其他场景中对操作行为的贡献程度进行分析的场景。参见图7，该归因分析系统的训练装置的具体结构包括：

数据获取模块610，用于获取样本数据，其中，所述样本数据包括操作成功的正样本数据和操作失败的负样本数据，所述分析对象数据和操作对象数据；

触点贡献数据获取模块620，用于将所述样本数据输入至所述归因分析系统中，得到所述样本数据中分析对象的触点贡献数据，其中，所述触点贡献数据中包括所述样本数据中存在的行为触点的第一数据和所述样本数据中不存在的行为触点的第二数据；

归因分析系统调节模块630，用于基于所述第一数据和第二数据，以及其分别对应的标准数据，确定损失函数，并基于损失函数对所述归因分析系统进行参数调节。

在满足训练结束条件的情况下，得到训练完成的归因分析系统，在不满足训练训练结束条件的情况下，返回执行触点贡献数据获取模块620，直到满足训练结束条件。

可选的，所述归因分析系统中的语义特征提取单元为预先训练得到的编码器；

相应的，所述归因分析系统调节模块630，包括：

归因分析系统调节单元，用于基于损失函数对所述归因分析系统中的特征交互单元和贡献处理单元进行参数调节。

可选的，所述语义特征提取单元的训练方法包括：

获取样本数据中分析对象的行为数据，提取所述行为数据中的行为序列；

基于所述行为序列确定训练输入数据和标准输出数据，其中，所述训练输入数据为所述行为数据中的局部连续子序列，所述标准输出数据为相对于所述训练输入数据错后一位的局部连续子序列；

将所述训练输入数据输入至训练模型中，得到所述训练模型输出的训练输出数据，其中，所述训练模型包括编码器和解码器；

基于所述标准输出数据和所述训练输出数据对所述训练模型进行参数调节，迭代执行所述训练模型的训练过程，直到满足训练完成条件时，将训练完成的编码器确定为语义特征提取单元。

本发明实施例所提供的归因分析系统的训练装置可执行本发明任意实施例所提供的归因分析系统的训练方法，具备执行方法相应的功能模块和有益效果。

值得注意的是，上述归因分析系统的训练装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

图8示出了可以用来实施本发明的实施例的电子设备10的结构图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图8所示，电子设备10包括至少一个处理器11，以及与至少一个处理器11通信连接的存储器，如只读存储器(ROM)12、随机访问存储器(RAM)13等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序，来执行各种适当的动作和处理。在RAM 13中，还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。

电子设备10中的多个部件连接至I/O接口15，包括：输入单元16，例如键盘、鼠标等；输出单元17，例如各种类型的显示器、扬声器等；存储单元18，例如磁盘、光盘等；以及通信单元19，例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理，例如归因分析方法和/或归因分析训练方法。

在一些实施例中，归因分析方法和归因分析系统的训练方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元18。在一些实施例中，计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时，可以执行上文描述的归因分析方法和/或归因分析训练方法的一个或多个步骤。备选地，在其他实施例中，处理器11可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行归因分析方法和/或归因分析训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 归因分析系统、训练方法、归因分析方法以及装置 [P] . 中国专利： CN114841747A . 2022-08-02
2. 基于知识图谱的睡眠障碍归因分析方法、装置和系统 [P] . 中国专利： CN114141379A . 2022-03-04
3. SYSTEMS, METHODS, AND APPARATUS FOR IN-STORE ANALYTICS AND OFFLINE ATTRIBUTION [P] . 美国专利： US2015371256A1 . 2015-12-24

机译：店内分析和离线归因的系统，方法和装置
4. Systems and methods for attributing value to data analytics-driven system components [P] . 美国专利： US11210823B1 . 2021-12-28

机译：用于归因于数据分析驱动系统组件的值的系统和方法
5. TRAFFIC ANALYSIS METHOD, PUBLIC SERVICE TRAFFIC ATTRIBUTION METHOD AND CORRESPONDING COMPUTER SYSTEM [P] . 欧洲知识产权局专利： EP3697042A1 . 2020-08-19

机译：交通分析方法，公共服务交通归因方法及对应的计算机系统