首页> 中国专利> 一种用户分类模型的训练、用户分类处理的方法及装置

一种用户分类模型的训练、用户分类处理的方法及装置

摘要

本说明书实施例提供一种用户分类模型的训练、用户分类处理的方法及装置,用户分类模型包括图神经网络、第一分类网络和第二分类网络,该用户分类模型的训练方法包括:获取样本用户,其具有标签数据;在用户关系网络图中,以样本用户为目标节点,利用图神经网络对目标节点进行聚合;将所得的用户表征输入第一分类网络和第二分类网络,得到第一预测值和第二预测值,第一预测值表征样本用户属于由第一类用户和第二类用户构成的第一用户群的概率,第二预测值表征样本用户属于由第二类用户和第三类用户构成的第二用户群的概率;基于第一预测值和/或第二预测值,及标签数据,确定当前损失值;以最小化当前损失值为目标,调整用户分类模型的参数。

著录项

  • 公开/公告号CN114971742A

    专利类型发明专利

  • 公开/公告日2022-08-30

    原文格式PDF

  • 申请/专利权人 支付宝(杭州)信息技术有限公司;

    申请/专利号CN202210756065.3

  • 发明设计人 朱定元;王岱鑫;张志强;周俊;

    申请日2022-06-29

  • 分类号G06Q30/02(2012.01);G06Q30/06(2012.01);

  • 代理机构北京亿腾知识产权代理事务所(普通合伙) 11309;北京亿腾知识产权代理事务所(普通合伙) 11309;

  • 代理人陈霁;周良玉

  • 地址 310000 浙江省杭州市西湖区西溪路556号8层B段801-11

  • 入库时间 2023-06-19 16:34:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-16

    实质审查的生效 IPC(主分类):G06Q30/02 专利申请号:2022107560653 申请日:20220629

    实质审查的生效

说明书

技术领域

本说明书涉及数据处理技术领域,尤其涉及一种用户分类模型的训练、用户分类处理的方法及装置。

背景技术

目前,电商以及金融等服务平台为了促进用户在平台的活跃度,一般会制定一些激励政策和激励行为,以提高平台用户针对目标业务的响应积极性,进而提升用户在平台的活跃度。那么,如何确定出对激励政策和激励行为的认同度较高的用户,并对其进行定制化服务至关重要。相应的,如何提供一种用户分类模型的训练方法成为亟待解决的问题。

发明内容

本说明书一个或多个实施例提供了一种用户分类模型的训练、用户分类处理的方法及装置,以实现训练得到用户分类结果准确的用户分类模型。

根据第一方面,提供一种用户分类模型的训练方法,其中,所述用户分类模型包括图神经网络,第一分类网络和第二分类网络,所述方法包括:

获取样本用户,其具有标签数据,用于表征所述样本用户针对预定激励行为的响应行为;

在预先构建的用户关系网络图中,以该样本用户为目标节点,利用所述图神经网络对所述目标节点进行节点表征聚合,得到用户表征;

将所述用户表征分别输入所述第一分类网络和第二分类网络,得到第一预测值和第二预测值,所述第一预测值表征所述样本用户属于由第一类用户和第二类用户构成的第一用户群的概率,所述第二预测值表征所述样本用户属于由第二类用户和第三类用户构成的第二用户群的概率,其中,第一类用户恒具有所述响应行为,第二类用户仅在所述预定激励行为下具有响应行为,第三类用户恒不具有响应行为;

基于所述第一预测值和/或所述第二预测值,及所述标签数据,确定当前损失值;

以最小化所述当前损失值为目标,调整所述用户分类模型的参数。

根据第二方面,提供一种用户分类处理的方法,包括:

获取根据第一方面所述的方法训练得到的用户分类模型,其中包括图神经网络,第一分类网络和第二分类网络;

将各待处理用户输入所述用户分类模型,以利用所述图神经网络,第一分类网络和第二分类网络,确定各待处理用户对应的第一估计值和第二估计值,所述第一估计值表征所对应待处理用户属于由第一类用户和第二类用户构成的第一用户群的概率,所述第二估计值表征所对应待处理用户属于由第二类用户和第三类用户构成的第二用户群的概率,其中,第一类用户恒具有针对预定激励行为的响应行为,第二类用户仅在所述预定激励行为下具有响应行为,第三类用户恒不具有响应行为;

针对各待处理用户,基于该待处理用户对应的第一估计值和第二估计值,确定是否针对该待处理用户实施所述预定激励行为。

根据第三方面,提供一种用户分类模型的训练装置,其中,所述用户分类模型包括图神经网络,第一分类网络和第二分类网络,所述装置包括:

第一获取模块,配置为获取样本用户,其具有标签数据,用于表征所述样本用户针对预定激励行为的响应行为;

聚合模块,配置为在预先构建的用户关系网络图中,以该样本用户为目标节点,利用所述图神经网络对所述目标节点进行节点表征聚合,得到用户表征;

输入得到模块,配置为将所述用户表征分别输入所述第一分类网络和第二分类网络,得到第一预测值和第二预测值,所述第一预测值表征所述样本用户属于由第一类用户和第二类用户构成的第一用户群的概率,所述第二预测值表征所述样本用户属于由第二类用户和第三类用户构成的第二用户群的概率,其中,第一类用户恒具有所述响应行为,第二类用户仅在所述预定激励行为下具有响应行为,第三类用户恒不具有响应行为;

第一确定模块,配置为基于所述第一预测值和/或所述第二预测值,及所述标签数据,确定当前损失值;

调整模块,配置为以最小化所述当前损失值为目标,调整所述用户分类模型的参数。

根据第四方面,提供一种用户分类处理的装置,包括:

第二获取模块,配置为获取根据第三方面所述的装置训练得到的用户分类模型,其中包括图神经网络,第一分类网络和第二分类网络;

第二确定模块,配置为将各待处理用户输入所述用户分类模型,以利用所述图神经网络,第一分类网络和第二分类网络,确定各待处理用户对应的第一估计值和第二估计值,所述第一估计值表征所对应待处理用户属于由第一类用户和第二类用户构成的第一用户群的概率,所述第二估计值表征所对应待处理用户属于由第二类用户和第三类用户构成的第二用户群的概率,其中,第一类用户恒具有针对预定激励行为的响应行为,第二类用户仅在所述预定激励行为下具有响应行为,第三类用户恒不具有响应行为;

第三确定模块,配置为针对各待处理用户,基于该待处理用户对应的第一估计值和第二估计值,确定与所述预定激励行为相关的处理方式。

根据第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面所述的方法。

根据第六方面,提供一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面所述的方法。

根据第七方面,提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第二方面所述的方法。

根据第八方面,提供一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第二方面所述的方法。

根据本说明书实施例提供的方法及装置,首先在用户关系网络图中,以样本用户为目标节点,利用用户分类模型的图神经网络对目标节点进行节点表征聚合,得到聚合有其自身及邻居的属性特征的用户表征,其可以更全面准确的表征样本用户的特点,为用户的准确分类提供基础。接着,将用户表征分别输入用户分类模型的第一分类网络和第二分类网络,以得到表征样本用户属于由第一类用户(恒具有响应行为)和第二类用户(仅在预定激励行为下具有响应行为)构成的第一用户群的概率的第一预测值,和表征样本用户属于由第二类用户和第三类用户(恒不具有响应行为)构成的第二用户群的概率的第二预测值。然后基于第一预测值和/或第二预测值,及用于表征样本用户针对预定激励行为的响应行为的标签数据,确定当前损失值,以最小化当前损失值为目标,调整用户分类模型的参数,实现对用户分类模型的训练,且图神经网络可以聚合得到可更全面准确的表征样本用户特点的用户表征,第一分类网络和第二分类网络可以联合学习到、确定出仅在预定激励行为下具有响应行为的用户(高需求用户)的能力,使得训练所得的用户分类模型的分类结果更准确。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本说明书披露的一个实施例的实施框架示意图;

图2为实施例提供的用户分类模型的训练方法的一种流程示意图;

图3为实施例提供的标签数据设置场景的一种示意图;

图4为实施例提供的用户分类处理的方法的一种流程示意图;

图5为实施例提供的用户分类模型的训练装置的一种示意性框图;

图6为实施例提供的用户分类处理的装置的一种示意性框图。

具体实施方式

下面将结合附图,详细描述本说明书实施例的技术方案。

本说明书实施例披露一种用户分类模型的训练、用户分类处理的方法及装置,下面首先对用户分类模型的训练方法的应用场景和技术构思进行介绍,具体如下:

如前所述,电商以及金融等服务平台为了促进用户在平台的活跃度并且向用户提供更优质定制化服务,需要对各用户进行细分,确定出对激励政策和激励行为的认同度较高的用户,以对该类用户推送一些激励政策和激励行为,以提高平台用户针对目标业务的响应积极性,提升用户在平台的活跃度,那么如何提供一种用户分类模型的训练方法至关重要。

鉴于此,发明人提出一种用户分类模型的训练方法,图1示出根据本说明书披露的一个实施例的实施框架示意图。其中,用户分类模型包括图神经网络,第一分类网络和第二分类网络。在训练过程中,可以首先构建用户样本集,该用户样本集中包括各样本用户及其具有的标签数据,该标签数据可以表征样本用户针对预定激励行为的响应行为,该预定激励行为为用于激励用户针对目标业务进行响应的行为。

接着,获取用户关系网络图,一种情况,可以根据用户样本集中各样本用户的社交关系(以及交易关系、转账关系等)构建用户关系网络图;另一种情况,可以直接从目标数据源处获取针对用户样本集中各样本用户所构建的用户关系网络图。该用户关系网络图中各节点对应各用户,该用户包括样本用户以及与其存在好友关系(或存在交易关系、转账关系等)的用户,各边表征节点所对应用户之间的好友关系(或者交易关系、转账关系等)。如图1所示,示出了用户关系网络图的局部图。

在训练过程中,从用户样本集中选取样本用户,在用户关系网络图中,以该样本用户为目标节点,利用图神经网络对目标节点进行节点表征聚合,得到用户表征,该用户表征聚合有样本用户及其邻居用户的属性特征,该用户表征可以多元化全面准确地表征出用户特点。接着,将用户表征分别输入第一分类网络和第二分类网络,得到第一预测值和第二预测值,即通过第一分类网络预测得到样本用户属于由第一类用户和第二类用户构成的第一用户群的概率(第一预测值),通过第二分类网络预测得到样本用户属于由第二类用户和第三类用户构成的第二用户群的概率(第二预测值)。

其中,第一类用户恒具有响应行为,即第一类用户在有或者没有预定激励行为下均具有响应行为;第二类用户仅在预定激励行为下具有响应行为;第三类用户恒不具有响应行为,即第三类用户在有或者没有预定激励行为下均不具有响应行为。

可以理解的是,为了针对不同类型的用户提供更优质的服务同时优化资产结构、平衡盈利能力,则需要准确地确定出对预定激励行为存在高需求(即仅在预定激励行为下具有响应行为)的用户,相应的,本说明书实施例中,设置第一分类网络预测得到样本用户属于由第一类用户和第二类用户构成的第一用户群的概率,且第二分类网络预测得到样本用户属于由第二类用户和第三类用户构成的第二用户群的概率。

其中,该用户分类模型可以为各个类型的平台提供用户分类服务,例如为电商平台的用户进行分类,为金融平台的用户进行分类等。可以理解的,该预定激励行为与用户分类模型所应用平台的目标业务存在关系。在一个示例性场景中,该用户分类模型应用于电商平台,针对该电商平台提供的商品销售业务提供用户分类服务,该预定激励行为可以包括针对目标业务(商品销售业务)实施以下之一:发放用户权益(例如发放商品优惠券),推送附加服务(例如赠送赠品、赠送积分、赠送蚂蚁能量等),提供折扣等。相应的,具有响应行为指购买商品,不具有响应行为指不购买商品。

在又一个示例性场景中,该用户分类模型应用于金融平台,针对该金融平台提供的信贷业务提供用户分类服务,该预定激励行为可以包括针对目标业务(信贷业务)实施以下之一:推送附加服务(例如赠送赠品),提供折扣(例如降低利息率)等。相应的,具有响应行为指认购信贷服务,不具有响应行为指不认购信贷服务。

在又一个示例性场景中,该用户分类模型应用于内容平台,针对该内容平台提供的内容推送业务提供用户分类服务,相应的该预定激励行为可以包括针对目标业务(内容推送业务)实施以下之一:推送附加服务(例如赠送赠品,赠送积分,赠送指定小游戏次数或币值等)等。相应的,具有响应行为指接受内容推送,不具有响应行为指不接受内容推送。

在又一个示例性场景中,该用户分类模型应用于社交平台,针对该社交平台提供的线上活动推送业务提供用户分类服务,相应的该预定激励行为可以包括针对目标业务(线上活动推送业务)实施以下之一:推送附加服务(例如赠送赠品,赠送积分,赠送指定小游戏次数或币值等)等。相应的,具有响应行为指参加线上活动,不具有响应行为指不参加线上活动。

接着,得到第一预测值以及第二预测值之后,可以继续基于第一预测值和/或第二预测值,及标签数据,确定当前损失值。其中,当前损失值越大,表征第一预测值和/或第二预测值与标签数据的差异越大,即第一分类网络和/或第一分类网络的预测结果的准确性越低。相应的,以最小化当前损失值为目标,即以提高用户分类模型的预测结果的准确性为目标,调整用户分类模型的参数。

上述过程中,通过图神经网络,得到聚合有样本用户自身及其邻居的属性特征,即聚合多元化信息的用户表征,其更全面准确的表示出用户特点,为后续的用户分类提供了基础。并且,第一预测值表征样本用户属于由第一类用户和第二类用户构成的第一用户群的概率,其中,第一预测值越大,表征样本用户属于第一用户群的可能性越大;第二预测值表征样本用户属于由第二类用户和第三类用户构成的第二用户群的概率,其中,第二预测值越大,表征样本用户属于第二用户群的可能性越大。相应的,在第一预测值和第二预测值均大的情况下,可以表征样本用户属于第二类用户(仅在预定激励行为下具有响应行为的用户)的可能性越大。以最小化当前损失值为目标,调整用户分类模型的参数,使得第一分类网络和第二分类网络可以联合学习到、确定出仅在预定激励行为下具有响应行为的用户(高需求用户)的能力,使得该用户分类模型可以更加准确的确定出对预定激励行为存在高需求的用户,提高用户分类结果的准确性。

下面结合具体实施例,对本说明书提供的用户分类模型的训练、用户分类处理的方法进行详细阐述。

图2示出了本说明书一个实施例中用户分类模型的训练方法的流程图。该方法通过电子设备执行,该电子设备可以通过任何具有计算、处理能力的装置、设备、平台、设备集群等来实现。该用户分类模型包括图神经网络,第一分类网络和第二分类网络,如图2所示,所述方法包括如下步骤S210-S250:

在步骤S210,获取样本用户,其具有标签数据,用于表征样本用户针对预定激励行为的响应行为。

一种实现方式中,在对用户分类模型训练之前,可以首先构建用于训练用户分类模型的用户样本集,步骤S210中的样本用户可以取自该用户样本集。该用户样本集中可以包括:多个样本用户(即样本用户的用户标识和属性特征)及各样本用户对应的标签数据。其中,用户样本集中包括的样本用户与用户分类模型的应用场景相关。举例而言,若用户分类模型应用于电商平台,为电商平台的商品销售业务提供用户分类服务,则该用户样本集中的各样本用户为该电商平台的用户。若用户分类模型应用于金融平台,为金融平台的信贷业务提供用户分类服务,则该用户样本集中的各样本用户为该金融平台的用户。若用户分类模型应用于内容平台或社交平台,该用户样本集中的各样本用户为该内容平台或社交平台的用户。

另外,一种情况中,该用户样本集中的各样本用户还可以既包括用户分类模型所应用平台的用户还包括该平台绑定的其他平台的用户。

上述平台仅为示例性举例说明,用户分类模型还可以应用于其他需要对用户进行分类的平台。

后续的,电子设备可以从该用户样本集中获取样本用户。在一个实施例中,本说明书还提供用户样本集的具体获得方式,其中,该用户样本集可以通过以下方式获得:

在步骤11,将用户群组划分为未施加预定激励行为的对照组和施加了预定激励行为的测试组。本步骤中,将用户群组中的各用户随机划分为对照组和测试组,每个组均包括多个用户,对于对照组用户不施加预定激励行为,对测试组用户施加预定激励行为。

接着,在步骤12,根据用户群组中任意的第一用户所属的组别以及是否进行响应行为,确定该第一用户的第一标签数据。

具体的,在一种情况下,第一用户属于测试组;在步骤12,具体包括若第一用户具有响应行为,将第一标签数据设置为包括属于第一类用户的第一标签和属于第二类用户的第二标签;若第一用户不具有响应行为,将第一标签数据设置为仅包括属于第三类用户的第三标签。

可以理解的是,第一用户属于施加了预定激励行为的测试组,若第一用户具有响应行为,则可以表征第一用户在施加了预定激励行为的情况下具有响应行为(可能属于第二类用户),另外其在未施加预定激励行为的情况下也可能具有响应行为(可能属于第一类用户),相应的,可以将第一标签数据设置为包括属于第一类用户的第一标签和属于第二类用户的第二标签。反之,若第一用户不具有响应行为,即第一用户在施加了预定激励行为下不进行响应行为,那么可以认为第一用户在未施加预定激励行为的情况下,也不具有响应行为,即属于第三类用户,相应的,可以将第一标签数据设置为仅包括属于第三类用户的第三标签。

其中,该第一标签、第二标签以及第三标签可以为相同的标签,例如为第一数值(例如为1),也可以为不同的标签。在第一标签、第二标签以及第三标签为相同的标签的情况下,如图3所示,在第一用户属于测试组,且第一用户具有响应行为的情况下,第一用户的第一标签数据可以表示为[1,1,0]。在第一用户属于测试组,且第一用户不具有响应行为的情况下,第一用户的第一标签数据可以表示为[0,0,1]。其中,第一标签数据的第一个位置的数值表示第一用户是否属于第一类用户,第二个位置的数值表示第一用户是否属于第二类用户,第三个位置的数值表示第一用户是否属于第三类用户,其中,“1”表示属于,“0”表示不属于。

在另一种情况下,第一用户属于对照组;在步骤12,具体包括若第一用户具有响应行为,将第一标签数据设置为仅包括属于第一类用户的第一标签;若第一用户不具有响应行为,将第一标签数据设置为包括属于第二类用户的第二标签和属于第三类用户的第三标签。

本实现方式中,第一用户属于未施加预定激励行为的对照组,若第一用户具有响应行为,则认为第一用户属于第一类用户,相应的,第一标签数据设置为仅包括属于第一类用户的第一标签。反之,若第一用户不具有响应行为,则认为第一用户可能属于第三类用户,同时,认为第一用户在施加预定激励行为的情况下可能具有响应行为,相应的确定第一用户也可能属于第二类用户,相应的,将第一标签数据设置为包括属于第二类用户的第二标签和属于第三类用户的第三标签。

相应的,若该第一标签、第二标签以及第三标签为相同的标签,且为第一数值(例如1),如图3所示,第一用户属于对照组,且第一用户具有响应行为的情况下,第一用户的第一标签数据可以表示为[1,0,0]。在第一用户属于对照组,且第一用户不具有响应行为的情况下,第一用户的第一标签数据可以表示为[0,1,1]。

电子设备基于上述标签数据确定方式,可以针对用户群组中各用户,基于该用户所属的组别以及是否进行响应行为,标定其标签数据,以得到用户样本集。

对于预定激励行为而言,其与用户分类模型所应用平台提供的业务相关,其中,业务不同,该预定激励行为可以存在不同。在一个实施例中,该预定激励行为包括针对目标业务实施以下之一:发放用户权益,推送附加服务,提供折扣。

可以理解的,电子设备可以针对用户样本集中的各样本用户执行本说明书实施例所提供的用户分类模型的训练流程,以训练用户分类模型。本说明书实施例中,以其中一个样本用户为例来说明利用用户样本集中每个样本用户训练用户分类模型的过程,也就是说,针对用户样本集中每个样本用户,可以进行类似处理。

接着,电子设备获取样本用户之后,在步骤S220,在预先构建的用户关系网络图中,以该样本用户为目标节点,利用图神经网络对目标节点进行节点表征聚合,得到用户表征。

该用户关系网络图中的各节点对应各用户,其中,各节点对应的用户可以为样本用户或与样本用户存在好友关系(或交易关系、转账关系等指定关系)的用户,用户关系网络图中的边表示节点所对应用户之间的好友关系(或交易关系、转账关系等指定关系)。一般具有好友关系等指定关系的用户,其行为习惯相似的可能性更大,相应的,用户关系网络图可以在一定程度上表征用户之间的行为相似性以及风险传导性信息。

本步骤中,通过在用户关系网络图中,利用图神经网络对目标节点(样本用户)进行节点表征聚合,可以得到能够更全面准确的表示用户特点的用户表征,为提高用户分类结果提供基础。

在一个实施例中,该图神经网络包括k个聚合层;在步骤S220具体配置为,依次在k个聚合层,针对目标节点执行k级向量聚合,其中,每级向量聚合包括,至少基于该目标节点的各个邻居节点的上一级聚合向量确定该目标节点的本级聚合向量,其中各节点的初级聚合向量根据对应用户的属性特征确定。

其中,为了依次在k个聚合层,针对目标节点v执行k级向量聚合,首先,根据目标节点v的属性特征,确定目标节点v的初级聚合向量

具体的,在每级向量聚合过程中,上述的各邻居节点u为与目标节点v相连接的节点。可以理解的,在每个聚合层,在针对目标节点v进行向量聚合外,还需要针对每个邻居节点进行向量聚合,以得到每个邻居节点的本级聚合向量,在针对每个邻居节点u进行向量聚合时,则需要利用该邻居节点u的上一级聚合向量及其邻居节点的上一级聚合向量,以此类推,使得在第i个聚合层,聚合所得的目标节点v的本级聚合向量,包含目标节点v的i阶邻居节点的属性特征。以此,经过k个聚合层的聚合后,目标节点v的聚合向量

在一个实施例中,上述确定初级聚合向量

在一个实施例中,对于目标节点v,确定其第i级向量聚合(即第i个聚合层的向量聚合)的过程可以包括,首先利用第i个聚合层的聚合函数AGG

然后,根据该邻居聚合向量

其中,f表示对邻居聚合向量

以上进行邻居聚合的聚合函数AGG

考虑到目标节点v的各个邻居节点u相对于目标节点v来说,其重要性不一,可以基于各个邻居节点u相对于目标节点v的重要性,来确定各个邻居节点在聚合时所占的比重,相应的,在一个实施例中,至少基于该目标节点的各个邻居节点的上一级聚合向量确定该目标节点的本级聚合向量,包括:基于该目标节点的上一级聚合向量和各个邻居节点的上一级聚合向量,确定各个邻居节点相对于该目标节点的权重值;根据该目标节点的上一级聚合向量、各个邻居节点的上一级聚合向量及相对于该目标节点的权重值,确定该目标节点的本级聚合向量。

其中,各个权重值表征,所对应邻居节点相对于该目标节点的重要性,权重值越大表征所对应邻居节点相对于该目标节点的重要性越高,一种情况中,该权重值可以是基于注意力机制所计算的权重值。一种实现中,可以通过如下公式,确定各个邻居节点u相对于该目标节点v的权重值:

其中,

之后,确定出各个邻居节点u相对于目标节点v的权重值之后,根据该目标节点v的上一级(i-1级)聚合向量、各个邻居节点u的上一级(i-1级)聚合向量及相对于该目标节点的权重值,确定该目标节点的本级(i级)聚合向量。具体的,可以通过如下公式表示:

其中,

可以理解,目标节点v的初级聚合向量即可以作为0级聚合向量,基于此,在第1到第k个聚合层中,逐级针对目标节点v执行聚合,可以得到目标节点v的第k个聚合层的输出向量

之后,在步骤S230,将用户表征分别输入第一分类网络和第二分类网络,得到第一预测值和第二预测值。其中,第一预测值表征样本用户属于由第一类用户和第二类用户构成的第一用户群的概率,第二预测值表征样本用户属于由第二类用户和第三类用户构成的第二用户群的概率,其中,第一类用户恒具有响应行为,即第一类用户在有或者没有预定激励行为下均具有响应行为;第二类用户仅在预定激励行为下具有响应行为;第三类用户恒不具有响应行为,即第三类用户在有或者没有预定激励行为下均不具有响应行为。

本步骤中,将用户表征分别输入第一分类网络和第二分类网络,以通过第一分类网络和第二分类网络分别预测样本用户所属的用户类别,得到第一分类网络对应的第一预测值和第二分类网络对应的第二预测值,以分别得到样本用户属于由第一类用户和第二类用户构成的第一用户群的概率,以及样本用户属于由第二类用户和第三类用户构成的第二用户群的概率。

其中,第一预测值越大,表征样本用户属于第一用户群的可能性越大。第二预测值越大,表征样本用户属于第二用户群的可能性越大。第一预测值和第二预测值均较大时,则可以表征样本用户为第二类用户(仅在预定激励行为下具有响应行为的用户)的可能性大。

一种实现中,第一分类网络和第二分类网络可以分别包括多层非线性映射层,其中第一分类网络和第二分类网络所使用的激活函数可以为Leaky-Relu函数。

接着,电子设备在得到第一预测值以及第二预测值之后,在步骤S240,基于第一预测值和/或第二预测值,及标签数据,确定当前损失值。在一种实现中,可以基于预设损失函数,基于第一预测值和/或第二预测值,及标签数据,确定当前损失值。其中,该预设损失函数可以为交叉熵函数。之后,在步骤S250,以最小化当前损失值为目标,调整用户分类模型的参数。

可以理解的,当前损失值越大,表征第一预测值和/或第二预测值与标签数据的差异越大,即第一分类网络和/或第一分类网络的预测结果的准确性越低。相应的,以最小化当前损失值为目标,即以提高用户分类模型的预测结果的准确性为目标,调整用户分类模型的参数。具体的,确定出当前损失值之后,基于当前损失值,利用反向传播算法,确定用户分类模型的参数梯度。利用所确定的模型参数梯度以及用户分类模型的参数,确定用户分类模型更新后的参数。进而基于更新后的参数,调整用户分类模型的参数。其中,确定用户分类模型的参数梯度是以最小化当前损失值为目标得到的。最小化当前损失值,可以实现对户分类模型的分类结果的监督,保持其准确性。

可以理解的是,结合前述用户样本集的获得方式可知,用户样本集中样本用户具有的标签数据可以存在四类,可以分别表示为[1,0,0]、[0,1,1]、[1,1,0]以及[0,0,1]。

对于第一分类网络而言,其需要预测用户属于由第一类用户和第二类用户构成的第一用户群的概率,在训练过程中,第一分类网络以第一类用户和第二类用户为正样本,第三类用户为负样本进行训练。对于第二分类网络而言,其需要预测用户属于第二类用户和第三类用户构成的第二用户群的概率,在训练过程中,第二分类网络以第二类用户和第三类用户为正样本,第一类用户为负样本进行训练。

鉴于此,结合用户样本集中样本用户具有的四类标签数据,对于具有仅包括属于第一类用户的第一标签的标签数据的样本用户,其仅用于训练第一分类网络;对于具有仅包括属于第三类用户的第三标签的标签数据的样本用户,其仅用于训练第二分类网络;对于任一具有第二类用户的第二标签的标签数据的样本用户,其既可以用于训练第一分类网络,又可以用于训练第二分类网络。

相应的,在一个实施例中,在步骤S240,具体设置为若标签数据仅包括属于第一类用户的第一标签,基于第一预测值及标签数据,确定第一损失值。相应的,在步骤S250,具体设置为以最小化第一损失值为目标,调整图神经网络和第一分类网络的参数。本实现方式中,第一预测值表征样本用户属于第一类用户和第二类用户的概率,基于第一预测值及标签数据,确定的第一损失值,可以表征第一分类网络预测结果与真实结果的差异大小,其中,第一损失值越大,第一分类网络预测结果与真实结果的差异越大。相应的,以最小化第一损失值为目标,调整图神经网络和第一分类网络的参数,使得第一分类网络学习到第一类用户的特征,进而可以更好的学习到区分出属于第一类用户的能力,进一步学习到预测用户是否属于第一用户群(即为第一类用户或第二类用户)的能力。

在又一个实施例中,在步骤S240,具体设置为若标签数据仅包括属于第三类用户的第三标签,基于第二预测值及标签数据,确定第二损失值。相应的,在步骤S250,具体设置为以最小化第二损失值为目标,调整图神经网络和第二分类网络的参数。本实现方式中,第二预测值表征样本用户属于第二类用户和第三类用户的概率,基于第二预测值及标签数据,确定的第二损失值,可以表征第二分类网络预测结果与真实结果的差异大小,其中,第二损失值越大,第二分类网络预测结果与真实结果的差异越大。相应的,以最小化第二损失值为目标,调整图神经网络和第二分类网络的参数,使得第二分类网络学习到第三类用户的特征,进而可以更好的学习到区分出属于第三类用户的能力,进一步学习到预测用户是否属于第二用户群(即为第二类用户或第三类用户)的能力。

在又一个实施例中,在步骤S240,具体设置为若标签数据包括属于第二类用户的第二标签,基于第一预测值和第二预测值及标签数据,确定第三损失值。相应的,在步骤S250,具体设置为以最小化第三损失值为目标,调整图神经网络、第一分类网络以及第二分类网络的参数。

本实现方式中,可以利用第一预测值和标签数据,确定第三损失值中的第一子损失值,并利用第二预测值和标签数据,确定第三损失值的第二子损失值,进而以最小化第一子损失值为目标,调整图神经网络和第一分类网络的参数,以最小化第二子损失值为目标,调整图神经网络和第二分类网络的参数,以使得第一分类网络学习到的预测用户是否属于第一用户群(即为第一类用户或第二类用户)的能力,第二分类网络学习到的预测用户是否属于第二用户群(即为第二类用户或第三类用户)的能力,进而,使得第一分类网络和第二分类网络可以联合学习到、确定出仅在预定激励行为下具有响应行为的用户(高需求用户)的能力,使得该用户分类模型可以更加准确地确定出对预定激励行为存在高需求的用户,提高用户分类结果的准确性。

上述实施例中,通过上述设置的四类标签数据,可以实现通过部分标签学习的方式训练用户分类模型(即对于包括属于第二类用户的第二标签的标签数据,可以其既可以用于训练第一分类网络,又可以用于训练第二分类网络)的效果,大大提高了样本的利用率,在一定程度上可以降低样本标注成本。

上述步骤S210~S250为一次模型迭代训练过程。为了训练得到更好的用户分类模型,可以多次迭代执行上述过程。也就是在步骤S250之后基于用户分类模型更新后的参数,返回执行步骤S210。上述模型迭代训练过程的停止条件可以包括:迭代训练次数达到预设次数阈值,或者迭代训练时长达到预设时长,或者当前损失值小于设定的损失阈值等等。

回顾一下步骤S210~S250的执行过程,上述实施例是以一个样本用户为例进行说明的。在另一实施例中,也可以针对一批样本用户(即多个样本用户)执行上述步骤S210~步骤S230,分别得到每个样本用户对应的第一预测值和第二预测值。之后,基于每个样本用户对应的第一预测值和第二预测值,和每个样本用户的标签数据,确定当前损失值,以最小化当前损失值为目标,训练用户分类模型。本实施例中,对一批样本用户确定当前损失值,然后再调整用户分类模型的模型参数,这样能够减少对用户分类模型的参数调整次数,更易于训练过程的实施。

本实施例,通过图神经网络,得到聚合有样本用户自身及其邻居的属性特征,即聚合多元化信息的用户表征,其更全面准确的表示出用户特点,为后续的用户分类提供了基础。并且以最小化当前损失值为目标,调整用户分类模型的参数,使得第一分类网络和第二分类网络可以联合学习到、确定出仅在预定激励行为下具有响应行为的用户(高需求用户)的能力,使得该用户分类模型可以更加准确的确定出高需求用户,提高用户分类结果的准确性。

相应于上述方法实施例,本说明书实施例还提供了一种用户分类处理的方法,该方法通过电子设备执行,该电子设备可以通过任何具有计算、处理能力的装置、设备、平台、设备集群等来实现。如图4所示,为用户分类处理的方法的一种流程示意图,所述方法包括S410-S430:

在步骤S410,获取用户分类模型,其中包括图神经网络,第一分类网络和第二分类网络。其中,该用户分类模型为根据前述的用户分类模型的训练方法训练得到的的模型,其具体训练流程,可以参见前述方法实施例,在此不再赘述。

在步骤S420,将各待处理用户输入用户分类模型,以利用图神经网络,第一分类网络和第二分类网络,确定各待处理用户对应的第一估计值和第二估计值,其中,第一估计值表征所对应待处理用户属于由第一类用户和第二类用户构成的第一用户群的概率,第二估计值表征所对应待处理用户属于由第二类用户和第三类用户构成的第二用户群的概率,其中,第一类用户恒具有针对预定激励行为的响应行为,第二类用户仅在所述预定激励行为下具有响应行为,第三类用户恒不具有响应行为。一种实现种,各待处理用户可以与前述的样本用户属于同一平台用户。

本步骤中,可以是将待处理用户的用户标识输入用户分类模型中,可以将用户标识对应的待处理用户作为目标节点,在预先构建的用户关系网络图中,利用用户分类模型的图神经网络对待处理节点进行节点表征聚合,得到各待处理用户的用户表征。接着,将各待处理用户的用户表征分别输入第一分类网络和第二分类网络,得到该各待处理用户对应的第一估计值和第二估计值。

其中,利用图神经网络,第一分类网络和第二分类网络,确定各待处理用户对应的第一估计值和第二估计值的过程,可以参见前述利用确定样本用户对应的第一预测值和第二预测值的过程,在此不再赘述。

之后,在步骤S430,针对各待处理用户,基于该待处理用户对应的第一估计值和第二估计值,确定与预定激励行为相关的处理方式。其中,各待处理用户对应的第一估计值和第二估计值可以表征出待处理用户所属的用户类别,对于属于第二类用户的待处理用户,其对于预定激励行为具有响应行为的可能性更大,相应的,可以基于各待处理用户对应的第一估计值和第二估计值,确定待处理用户是否属于第二类用户,继而,根据待处理用户是否属于第二类用户的结果,确定与预定激励行为相关的处理方式。该与预定激励行为相关的处理方式包括但不限于:是否实施预定激励程度,实施预定激励行为的激励程度(例如预定激励行为为发放优惠券,激励程度为优惠券具体数额,预定激励行为为提供折扣,该激励程度为折扣程度),以及实施预定激励行为的时机等。

可以理解的,第一估计值越高表征所对应待处理用户属于第一用户群的可能性越大,第二估计值越高表征所对应待处理用户属于第二用户群的可能性越大,相应的,在第一估计值较高(即高于预设的第一阈值)且第二估计值较高(即预设的第二阈值)的情况下,可以表征所对应待处理用户属于第二类用户。对于第二类用户,其为仅在预定激励行为下具有响应行为的用户,对于该类用户,其对预定激励行为的需求更高,相应的,该类用户为更合适被实施预定激励行为的用户。在一个实施例中,在步骤S430,可以具体设置为,在步骤31,若待处理用户对应的第一估计值高于第一阈值,且对应的第二估计值高于第二阈值,将该待处理用户确定为备选实施预定激励行为的目标用户。在步骤32,若待处理用户对应的第一估计值不高于第一阈值,和/或对应的第二估计值不高于第二阈值,确定针对该待处理用户不实施预定激励行为。

为了更好为用户提供更优质的服务并且促进用户在平台的活跃度,在确定出目标用户之后,还可以对该类目标用户进行排序,以确定针对各目标用户被实施预定激励行为的优先级。其中,在一个实施例中,在确定出所有备选实施预定激励行为的目标用户之后,电子设备还可以基于各目标用户对应的第一估计值和第二估计值的和值,确定各目标用户被实施预定激励行为的优先级。

一种实现方式中,电子设备可以直接基于各目标用户对应的第一估计值和第二估计值的和值的大小,确定各目标用户被实施预定激励行为的优先级,其中,目标用户对应的第一估计值和第二估计值的和值越大,该目标用户对应的优先级越高。

另一种实现方式中,电子设备可以针对各目标用户,基于该目标用户对应的第一估计值与第二估计值的和值,确定该目标用户的激励行为增益值,进而,基于各目标用户的激励行为增益值的大小排序,确定各目标用户对应的优先级。

具体的,电子设备可以预存有各目标用户对应的静态响应值,该静态响应值表征所对应目标用户在未施加预定激励行为下进行响应行为的概率。在本实现方式中,电子设备可以针对各目标用户,计算该目标用户对应的第一估计值和第二估计值的和值,进而计算该和值与该目标用户对应的静态响应值的比值,将该比值作为该目标用户的激励行为增益值。之后,基于各目标用户的激励行为增益值的大小排序,确定各目标用户被实施预定激励行为的优先级,其中,各目标用户的激励行为增益值越大,认为其在施加预定激励行为下进行响应行为的积极性更高,相应的其对应的被实施预定激励行为的优先级越高。一种实现中,根据各目标用户对应的优先级确定对其实施预定激励行为的顺序和/或确定对其实施预定激励行为对应的激励程度,优先级越高实施预定激励行为的顺序越靠前,优先级越高对其实施预定激励行为对应的激励程度可以越大等。

上述确定目标用户对应的优先级的方式中,无需考虑目标用户的消费(支用)水平,仅基于目标用户对预定激励行为进行响应行为的积极性来确定其对应的优先级,对于积极性高的目标用户优先实施预定激励行为,以实现对用户更加优质且精准的服务,更好的提高用户的使用体验。

一种示例性场景中,在用户分类模型应用于金融平台,对金融平台提供的信贷业务提供用户分类服务时,用户表征可以体现出用户是否为风险用户(例如是否按时还款)或者确定出用户的风险等级。对于该场景,通过该用户分类模型可以确定出低风险高需求(即还款积极且对预定激励行为进行响应行为积极性高)的用户。

上述内容对本说明书的特定实施例进行了描述,其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行,并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的,或者可能是有利的。

相应于上述方法实施例,本说明书实施例,提供了一种用户分类模型的训练装置500,其中,所述用户分类模型包括图神经网络,第一分类网络和第二分类网络,其示意性框图如图5所示,包括:

第一获取模块510,配置为获取样本用户,其具有标签数据,用于表征所述样本用户针对预定激励行为的响应行为;

聚合模块520,配置为在预先构建的用户关系网络图中,以该样本用户为目标节点,利用所述图神经网络对所述目标节点进行节点表征聚合,得到用户表征;

输入得到模块530,配置为将所述用户表征分别输入所述第一分类网络和第二分类网络,得到第一预测值和第二预测值,所述第一预测值表征所述样本用户属于由第一类用户和第二类用户构成的第一用户群的概率,所述第二预测值表征所述样本用户属于由第二类用户和第三类用户构成的第二用户群的概率,其中,第一类用户恒具有所述响应行为,第二类用户仅在所述预定激励行为下具有响应行为,第三类用户恒不具有响应行为;

第一确定模块540,配置为基于所述第一预测值和/或所述第二预测值,及所述标签数据,确定当前损失值;

调整模块550,配置为以最小化所述当前损失值为目标,调整所述用户分类模型的参数。

在一种可选实施方式中,所述图神经网络包括k个聚合层;

所述聚合模块520,具体配置为依次在所述k个聚合层,针对目标节点执行k级向量聚合,其中,每级向量聚合包括,至少基于该目标节点的各个邻居节点的上一级聚合向量确定该目标节点的本级聚合向量,其中各节点的初级聚合向量根据对应用户的属性特征确定。

在一种可选实施方式中,所述聚合模块520,具体配置为基于该目标节点的上一级聚合向量和所述各个邻居节点的上一级聚合向量,确定各个邻居节点相对于该目标节点的权重值;

根据该目标节点的上一级聚合向量、所述各个邻居节点的上一级聚合向量及相对于该目标节点的权重值,确定该目标节点的本级聚合向量。

在一种可选实施方式中,所述样本用户选自用户样本集,所述装置还包括:样本集获得模块(图中未示出);其中,所述样本集获得模块配置为获得所述用户样本集,具体包括:

划分单元(图中未示出),配置为将用户群组划分为未施加所述预定激励行为的对照组和施加了所述预定激励行为的测试组;

第一确定单元(图中未示出),配置为根据所述用户群组中任意的第一用户所属的组别以及是否进行所述响应行为,确定所述第一用户的第一标签数据。

在一种可选实施方式中,所述第一用户属于所述测试组;所述第一确定单元,具体配置为若所述第一用户具有所述响应行为,将所述第一标签数据设置为包括属于所述第一类用户的第一标签和属于所述第二类用户的第二标签;

若所述第一用户不具有所述响应行为,将所述第一标签数据设置为仅包括属于所述第三类用户的第三标签。

在一种可选实施方式中,所述第一用户属于所述对照组;所述第一确定单元,具体配置为若所述第一用户具有所述响应行为,将所述第一标签数据设置为仅包括属于所述第一类用户的第一标签;

若所述第一用户不具有所述响应行为,将所述第一标签数据设置为包括属于所述第二类用户的第二标签和属于所述第三类用户的第三标签。

在一种可选实施方式中,所述第一确定模块540,具体配置为若所述标签数据仅包括属于所述第一类用户的第一标签,基于所述第一预测值及所述标签数据,确定第一损失值;

所述调整模块550,具体配置为以最小化所述第一损失值为目标,调整所述图神经网络和所述第一分类网络的参数。

在一种可选实施方式中,所述第一确定模块540,具体配置为若所述标签数据仅包括属于所述第三类用户的第三标签,基于所述第二预测值及所述标签数据,确定第二损失值;

所述调整模块550,具体配置为以最小化所述第二损失值为目标,调整所述图神经网络和所述第二分类网络的参数。

在一种可选实施方式中,所述第一确定模块540,具体配置为若所述标签数据包括属于所述第二类用户的第二标签,基于所述第一预测值和所述第二预测值及所述标签数据,确定第三损失值;

所述调整模块550,具体配置为以最小化所述第三损失值为目标,调整所述图神经网络、所述第一分类网络以及所述第二分类网络的参数。

在一种可选实施方式中,所述预定激励行为包括针对目标业务实施以下之一:发放用户权益,推送附加服务,提供折扣。

相应于上述方法实施例,本说明书实施例,提供了一种用户分类处理的装置600,其示意性框图如图6所示,包括:

第二获取模块610,配置为获取用户分类模型,其中包括图神经网络,第一分类网络和第二分类网络;该用户分类模型是基于前述的用户分类模型的训练装置训练所得模型。

第二确定模块620,配置为将各待处理用户输入所述用户分类模型,以利用所述图神经网络,第一分类网络和第二分类网络,确定各待处理用户对应的第一估计值和第二估计值,所述第一估计值表征所对应待处理用户属于由第一类用户和第二类用户构成的第一用户群的概率,所述第二估计值表征所对应待处理用户属于由第二类用户和第三类用户构成的第二用户群的概率,其中,第一类用户恒具有针对预定激励行为的响应行为,第二类用户仅在所述预定激励行为下具有响应行为,第三类用户恒不具有响应行为;

第三确定模块630,配置为针对各待处理用户,基于该待处理用户对应的第一估计值和第二估计值,确定与所述预定激励行为相关的处理方式。

在一种可选实施方式中,所述第三确定模块630,包括:

第二确定单元(图中未示出),配置为若待处理用户对应的第一估计值高于第一阈值,且对应的第二估计值高于第二阈值,将该待处理用户确定为备选实施所述预定激励行为的目标用户;

第三确定单元(图中未示出),配置为若待处理用户对应的第一估计值不高于第一阈值,和/或对应的第二估计值不高于第二阈值,确定针对该待处理用户不实施所述预定激励行为。

在一种可选实施方式中,所述第三确定模块630,还包括:

第四确定单元(图中未示出),配置为基于各目标用户对应的第一估计值和第二估计值的和值,确定各目标用户被实施所述预定激励行为的优先级。

在一种可选实施方式中,所述第四确定模块,配置为针对各目标用户,基于该目标用户对应的第一估计值与第二估计值的和值,确定该目标用户的激励行为增益值;

基于各目标用户的激励行为增益值的大小排序,确定各目标用户对应的优先级。

在一种可选实施方式中,所述第二确定模块620,具体配置为在预先构建的用户关系网络图中,分别以各待处理用户为待处理节点,利用所述图神经网络对所述待处理节点进行节点表征聚合,得到各待处理用户的用户表征;

将各待处理用户的用户表征分别输入所述第一分类网络和第二分类网络,得到该各待处理用户对应的第一估计值和第二估计值。

上述装置实施例与方法实施例相对应,具体说明可以参见方法实施例部分的描述,此处不再赘述。装置实施例是基于对应的方法实施例得到,与对应的方法实施例具有同样的技术效果,具体说明可参见对应的方法实施例。

本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书所提供的所述用户分类模型的训练方法。

本说明书实施例还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书所提供的所述用户分类模型的训练方法。

本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书所提供的所述用户分类处理的方法。

本说明书实施例还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书所提供的所述用户分类处理的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于存储介质和计算设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式,对本发明实施例的目的、技术方案和有益效果进行了进一步的详细说明。所应理解的是,以上所述仅为本发明实施例的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号