首页> 中国专利> 用户分类方法、用户分类装置及电子设备

用户分类方法、用户分类装置及电子设备

摘要

公开了一种用户分类方法、用户分类装置和电子设备。该用户分类方法包括:获取目标用户的第一个体特征;针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径;获取每条元路径中的关系用户的第二个体特征和关系特征;基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量;以及,使用多层感知器网络基于所述注意力特征向量获得所述目标用户的分类结果。这样,提高了用户分类的准确率、召回率和鲁棒性。

著录项

  • 公开/公告号CN113065573A

    专利类型发明专利

  • 公开/公告日2021-07-02

    原文格式PDF

  • 申请/专利权人 阿里巴巴集团控股有限公司;

    申请/专利号CN202010001309.8

  • 发明设计人 钟齐炜;冯景华;汤佳宇;

    申请日2020-01-02

  • 分类号G06K9/62(20060101);

  • 代理机构11688 北京彩和律师事务所;

  • 代理人刘磊;闫桑田

  • 地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱

  • 入库时间 2023-06-19 11:42:32

说明书

技术领域

本申请涉及人工智能技术领域,且更为具体地,涉及一种用户分类方法、用户分类装置和电子设备。

背景技术

用户分类指的是将用户分为不同的用户群,例如,可以按照用户的属性,比如年龄、性别、收入、教育、职业、家庭、地域因素等用户的个人属性特征来对用户进行分类。

随着用户数据的增多和机器学习技术的发展,用户分类呈现出以下几个趋势。首先,是分类用户的维度增多,即,用户分类所涉及的场景越来越多,比如用户对于金融产品的逾期识别。其次,用户分类的时效越来越短,这也使得对于分类所用的用户数据的要求提高,且需要改进用户分类技术。第三,用户分类从人工分类发展为基于用户大数据的人工智能分类,也就是,通过采用机器学习算法从用户的数据中提取特征以进行用户分类。

因此,期望提供改进的用户分类方案。

发明内容

为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种用户分类方法、用户分类装置和电子设备,其结合目标用户的个体特征及其关系用户的个体特征和关系特征,并使用注意力机制融合个体特征和关系特征,从而提高用户分类的准确率、召回率和鲁棒性。

根据本申请的一方面,提供了一种用户分类方法,包括:获取目标用户的第一个体特征,所述第一个体特征用于表示所述目标用户的个体属性;针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述目标用户的关系;基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,使用多层感知器网络基于所述注意力特征向量获得所述目标用户的分类结果,所述多层感知器网络用于基于特征向量进行分类。

在上述用户分类方法中,所述元路径具有对应关联的关系类型。

在上述用户分类方法中,基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量包括:对于每条元路径,将所述多个关系用户中的每个关系用户各自的第二个体特征和关系特征拼接以得到多个关系用户特征,所述关系用户特征是拼接后的第二个体特征和关系特征;将所述多个关系用户特征与所述第一个体特征拼接以得到多个第一拼接特征,所述第一拼接特征是拼接后的第一个体特征、第二个体特征和拼接特征;基于所述多个第一拼接特征使用至少一个注意力机制以获得对应于每条元路径的多个子注意力向量,所述多个子注意力向量是用于表示每条元路径对应的关系用户的第二个体特征和关系特征相对于目标用户的重要程度的特征向量;以及,将所述多个子注意力向量级联以获得所述注意力特征向量。

在上述用户分类方法中,对于每条元路径,将所述多个用户中的每个用户各自的第二个体特征和关系特征拼接以得到多个关系用户特征包括:对于每条元路径,将所述多个用户中的每个用户各自的第二个体特征和关系特征通过变换矩阵映射为相同长度的第二个体特征向量和关系特征向量,所述变换矩阵用于将不同向量转换为相同长度;以及,将所述相同长度的第二个体特征向量和关系特征向量拼接为所述多个关系用户特征。

在上述用户分类方法中,基于所述多个拼接特征使用至少一个注意力机制以获得对应于每条元路径的多个子注意力向量包括:基于所述多个第一拼接特征使用节点注意力机制以获得节点注意力向量,所述节点注意力机制用于计算作为节点的不同用户对所述目标用户的重要程度,且所述节点注意力向量是其中不同用户的特征基于所述重要程度具有不同权重的特征向量;从所述节点注意力向量与所述每个关系用户特征获得多个节点特征;以及,基于所述多个节点特征之和获得所述子注意力向量。

在上述用户分类方法中,基于所述多个节点特征之和获得所述子注意力向量包括:对于每条元路径,从所述多个节点特征获得和特征向量;将所述和特征向量与所述第一个体特征拼接以获得第二拼接向量;基于所述第二拼接向量使用特征注意力机制以获得特征注意力向量,所述特征注意力机制用于计算不同类型的特征对所述目标用户的重要程度,且所述特征注意力向量是其中不同类型的特征基于所述重要程度具有不同权重的特征向量;从所述特征注意力向量与所述第二拼接向量获得用户集合特征向量;以及,基于对应于多条元路径的多个用户集合特征向量获得所述子注意力向量。

在上述用户分类方法中,基于对应于多条元路径的多个用户集合特征向量获得所述子注意力向量包括:将所述多个用户集合特征向量分别与所述第一个体特征拼接以获得多个第三拼接向量;基于所述第三拼接向量使用语义注意力机制以获得多个语义注意力向量,所述语义注意力机制用于计算不同关系类型对所述目标用户的重要程度,且所述特征注意力向量是其中不同关系类型的特征基于所述重要程度具有不同权重的特征向量;以及,从每个对应的用户集合特征向量与语义注意力向量获得所述子注意力向量。

在上述用户分类方法中,所述目标用户包括用户账号、用户设备、用户物品的其中之一。

在上述用户分类方法中,所述不同关系类型包括社交关系、资金关系、设备登录关系的其中之一。

在上述用户分类方法中,所述分类结果包括金融逾期结果、搜索推荐结果、虚假交易结果的其中之一。

根据本申请的另一方面,提供了一种金融用户逾期识别方法,包括:获取金融用户的第一个体特征,所述第一个体特征用于表示所述金融用户的个体属性;针对所述金融用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述金融用户的关系;基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,使用多层感知器网络基于所述注意力特征向量识别所述金融用户是否逾期,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示金融用户逾期的标签。

根据本申请的再一方面,提供了一种目标用户的搜索推荐方法,包括:获取目标用户的第一个体特征,所述第一个体特征用于表示所述目标用户的个体属性;针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述目标用户的关系;基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;使用多层感知器网络基于所述注意力特征向量对所述目标用户进行分类,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示向目标用户进行搜索推荐的类别的标签;以及,按照所述类别向所述目标用户进行搜索推荐。

根据本申请的又一方面,提供了一种虚假交易识别方法,包括:获取交易用户的第一个体特征,所述第一个体特征用于表示所述金融用户的个体属性;针对所述交易用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述交易用户的关系;基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,使用多层感知器网络基于所述注意力特征向量识别所述交易用户是否进行了虚假交易,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示虚假交易的标签。

根据本申请的又一方面,提供了一种用户领取优惠券的意图的识别方法,包括:获取领取优惠券的用户的第一个体特征,所述第一个体特征用于表示所述用户的个体属性;针对所述用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述领取优惠券的用户的关系;基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,使用多层感知器网络基于所述注意力特征向量识别所述用户领取所述优惠券是否是恶意意图,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示所述用户的恶意意图的标签。

根据本申请的另一方面,提供了一种用户分类装置,包括:目标特征获取单元,用于获取目标用户的第一个体特征,所述第一个体特征用于表示所述目标用户的个体属性;元路径遍历单元,用于针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;关系特征获取单元,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述目标用户的关系;注意力机制单元,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,分类结果获得单元,用于使用多层感知器网络基于所述注意力特征向量获得所述目标用户的分类结果,所述多层感知器网络用于基于特征向量进行分类。

在上述用户分类装置中,所述元路径具有对应关联的关系类型。

在上述用户分类装置中,所述注意力机制单元用于:对于每条元路径,将所述多个关系用户中的每个关系用户各自的第二个体特征和关系特征拼接以得到多个关系用户特征,所述关系用户特征是拼接后的第二个体特征和关系特征;将所述多个关系用户特征与所述第一个体特征拼接以得到多个第一拼接特征,所述第一拼接特征是拼接后的第一个体特征、第二个体特征和拼接特征;基于所述多个第一拼接特征使用至少一个注意力机制以获得对应于每条元路径的多个子注意力向量,所述多个子注意力向量是用于表示每条元路径对应的关系用户的第二个体特征和关系特征相对于目标用户的重要程度的特征向量;以及,将所述多个子注意力向量级联以获得所述注意力特征向量。

在上述用户分类装置中,所述注意力机制单元对于每条元路径,将所述多个用户中的每个用户各自的第二个体特征和关系特征拼接以得到多个关系用户特征包括:对于每条元路径,将所述多个用户中的每个用户各自的第二个体特征和关系特征通过变换矩阵映射为相同长度的第二个体特征向量和关系特征向量,所述变换矩阵用于将不同向量转换为相同长度;以及,将所述相同长度的第二个体特征向量和关系特征向量拼接为所述多个关系用户特征。

在上述用户分类装置中,所述注意力机制单元基于所述多个拼接特征使用至少一个注意力机制以获得对应于每条元路径的多个子注意力向量包括:基于所述多个第一拼接特征使用节点注意力机制以获得节点注意力向量,所述节点注意力机制用于计算作为节点的不同用户对所述目标用户的重要程度,且所述节点注意力向量是其中不同用户的特征基于所述重要程度具有不同权重的特征向量;从所述节点注意力向量与所述每个关系用户特征获得多个节点特征;以及,基于所述多个节点特征之和获得所述子注意力向量。

在上述用户分类装置中,所述注意力机制单元基于所述多个节点特征之和获得所述子注意力向量包括:对于每条元路径,从所述多个节点特征获得和特征向量;将所述和特征向量与所述第一个体特征拼接以获得第二拼接向量;基于所述第二拼接向量使用特征注意力机制以获得特征注意力向量,所述特征注意力机制用于计算不同类型的特征对所述目标用户的重要程度,且所述特征注意力向量是其中不同类型的特征基于所述重要程度具有不同权重的特征向量;从所述特征注意力向量与所述第二拼接向量获得用户集合特征向量;以及,基于对应于多条元路径的多个用户集合特征向量获得所述子注意力向量。

在上述用户分类装置中,所述注意力机制单元基于对应于多条元路径的多个用户集合特征向量获得所述子注意力向量包括:将所述多个用户集合特征向量分别与所述第一个体特征拼接以获得多个第三拼接向量;基于所述第三拼接向量使用语义注意力机制以获得多个语义注意力向量,所述语义注意力机制用于计算不同关系类型对所述目标用户的重要程度,且所述特征注意力向量是其中不同关系类型的特征基于所述重要程度具有不同权重的特征向量;以及,从每个对应的用户集合特征向量与语义注意力向量获得所述子注意力向量。

在上述用户分类装置中,所述目标用户包括用户账号、用户设备、用户物品的其中之一。

在上述用户分类装置中,所述不同关系类型包括社交关系、资金关系、设备登录关系的其中之一。

在上述用户分类装置中,所述分类结果包括金融逾期结果、搜索推荐结果、虚假交易结果的其中之一。

根据本申请的再一方面,提供了一种金融用户逾期识别装置,包括:金融用户特征获取单元,用于获取金融用户的第一个体特征,所述第一个体特征用于表示所述金融用户的个体属性;金融元路径遍历单元,用于针对所述金融用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;金融关系特征获取单元,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述金融用户的关系;金融注意力机制单元,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,金融用户逾期识别单元,用于使用多层感知器网络基于所述注意力特征向量识别所述金融用户是否逾期,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示金融用户逾期的标签。

根据本申请的又一方面,提供了一种目标用户的搜索推荐装置,包括:搜索用户特征获取单元,用于获取目标用户的第一个体特征,所述第一个体特征用于表示所述目标用户的个体属性;搜索元路径遍历单元,用于针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;搜索关系特征获取单元,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述目标用户的关系;搜索注意力机制单元,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;用户分类单元,用于使用多层感知器网络基于所述注意力特征向量对所述目标用户进行分类,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示向目标用户进行搜索推荐的类别的标签;以及,搜索推荐单元,用于按照所述类别向所述目标用户进行搜索推荐。

根据本申请的再一方面,提供了一种虚假交易识别装置,包括:交易用户特征获取单元,用于获取交易用户的第一个体特征,所述第一个体特征用于表示所述金融用户的个体属性;交易元路径遍历单元,用于针对所述交易用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;交易关系特征获取单元,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述交易用户的关系;交易注意力机制单元,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,虚假交易识别单元,用于使用多层感知器网络基于所述注意力特征向量识别所述交易用户是否进行了虚假交易,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示虚假交易的标签。

根据本申请的又一方面,提供了一种用户领取优惠券的意图的识别装置,包括:意图用户特征获取单元,用于获取领取优惠券的用户的第一个体特征,所述第一个体特征用于表示所述用户的个体属性;意图元路径遍历单元,用于针对所述用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;意图关系特征获取单元,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述领取优惠券的用户的关系;意图注意力机制单元,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,恶意意图识别单元,用于使用多层感知器网络基于所述注意力特征向量识别所述用户领取所述优惠券是否是恶意意图,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示所述用户的恶意意图的标签。

根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的用户分类方法,金融用户逾期识别方法,目标用户的搜索推荐方法,虚假交易识别方法,和用户领取优惠券的意图的识别方法。

根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的用户分类方法,金融用户逾期识别方法,目标用户的搜索推荐方法,虚假交易识别方法,和用户领取优惠券的意图的识别方法。

本申请提供的用户分类方法、用户分类装置和电子设备,能够结合目标用户的个体特征及其关系用户的个体特征和关系特征,并使用注意力机制融合个体特征和关系特征,这样,在目标用户的个体特征的基础上结合了目标用户的关系用户的关系特征,从而能够基于个体特征和关系特征的结合来对用户进行分类,提高了用户分类的准确率。

并且,通过使用元路径方法,可以在关系特征的基础上自适应地挖掘目标用户与关系用户的未知拓扑关系结构,并融合目标用户和关系用户的个体特征,从而提高了用户分类的召回率。

此外,由于注意力机制可以在融合个体特征和关系特征的同时,实现对个体和关系重要程度的捕捉,这也可以提高用户分类的准确率,并且由于在分类时能够对特征的重要程度进行区分而更加强调重要特征和忽略非重要特征,也可以提高用户分类的鲁棒性。

附图说明

通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。

图1图示了根据本申请实施例的用户分类方法的应用场景的示意图。

图2图示了根据本申请实施例的用户分类方法的流程图。

图3图示了根据本申请实施例的用户分类方法所应用的网络架构的示意图。

图4图示了根据本申请实施例的金融用户逾期识别方法的流程图。

图5图示了根据本申请实施例的目标用户的搜索推荐方法的流程图。

图6图示了根据本申请实施例的虚假交易识别方法的流程图。

图7图示了根据本申请实施例的用户领取优惠券的意图的识别方法的流程图。

图8图示了根据本申请实施例的用户分类装置的框图。

图9图示了根据本申请实施例的金融用户逾期识别装置的框图。

图10图示了根据本申请实施例的目标用户的搜索推荐装置的框图。

图11图示了根据本申请实施例的虚假交易识别装置的框图。

图12图示了根据本申请实施例的用户领取优惠券的意图的识别装置的框图。

图13图示了根据本申请实施例的电子设备的框图。

具体实施方式

下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。

如上所述,随着用户分类应用场景的增多,为了实现用户分类任务所使用的用户数据也越来越多。例如,为了用户的金融产品的逾期识别,通过使用用户的个体特征(比如采购金额,年龄等)和关系特征(比如同设备登陆,社交关系等)来对用户是否逾期进行分类。

目前的金融逾期分类的常用方法大致分为两个方向:一是基于个体特征的方法,比如用GBDT根据个体特征实现分类;二是基于关系特征的方法,比如用标签传播,随机游走,子图挖掘等实现分类。

但是,第一类方法只考虑个体特征,忽略了网络的拓扑信息,而第二类方法无法自适应地挖掘未知拓扑结构以及融合个体特征,因此这些常用方法的精确率和召回率都很低。

针对上述技术问题,本申请的基本构思是通过基于至少一个注意力机制的异构网络来融合用户的个体特征和关系特征。

具体地,本申请提供的用户分类方法、用户分类装置和电子设备首先获取目标用户的第一个体特征,所述第一个体特征用于表示所述目标用户的个体属性,然后针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户,再获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述目标用户的关系,接下来基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量,最后使用多层感知器网络基于所述注意力特征向量获得所述目标用户的分类结果,所述多层感知器网络用于基于特征向量进行分类。

这样,本申请提供的用户分类方法、用户分类装置和电子设备能够结合目标用户的个体特征及其关系用户的个体特征和关系特征,并使用注意力机制融合个体特征和关系特征,这样,在目标用户的个体特征的基础上结合了目标用户的关系用户的关系特征,从而能够基于个体特征和关系特征的结合来对用户进行分类,提高了用户分类的准确率。

并且,通过使用元路径方法,可以在关系特征的基础上自适应地挖掘目标用户与关系用户的未知拓扑关系结构,并融合目标用户和关系用户的个体特征,从而提高了用户分类的召回率。

此外,由于注意力机制可以在融合个体特征和关系特征的同时,实现对个体和关系重要程度的捕捉,这也可以提高用户分类的准确率,并且由于在分类时能够对特征的重要程度进行区分而更加强调重要特征和忽略非重要特征,也可以提高用户分类的鲁棒性。

图1图示了根据本申请实施例的用户分类方法的应用场景的示意图。如图1所示,通过云服务器C获取目标用户T和其多个关系用户A、B、C、…的个体特征和关系特征。然后,通过用于用户识别的服务器装置F来获取目标用户T的识别结果TR。这里,所述服务器装置F包括基于至少一个注意力机制的异构网络,其进一步包括应用元路径方法的模块,应用注意力机制的模块以及多层感知器网络的模块。最后,识别结果TR可以从服务器装置F发送到需要目标用户T的信息的另一终端,例如移动终端M,并通过该运动终端M向需要目标用户T的信息的其它用户U展示。

在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。

图2图示了根据本申请实施例的用户分类方法的流程图。

如图2所示,根据本申请实施例的用户分类方法包括如下步骤。

步骤S110,获取目标用户的第一个体特征,所述第一个体特征用于表示所述目标用户的个体属性。这里,所述目标用户是需要进行分类的用户,例如要识别所述用户是否具有金融产品的逾期。所述目标用户的第一个体特征可以是所述用户的年龄、职业、收入等各种反映个体属性的数据。并且,本领域技术人员可以理解,基于所述目标用户的具体分类场景,所述目标用户的第一个体特征可能对应于不同的个人数据。

并且,在本申请实施例中,所述目标用户可以是多种类型的用户,也就是说,所述目标用户不仅限于自然人或者法人,也可以包括用户账号、用户设备、用户物品等其它类型的用户。例如,在本申请实施例中,所述目标用户可以是某个移动终端,比如商店所使用的个人收付款设备,例如POS机,则其第一特征数据将包括交易特征数据、资金特征数据等。

步骤S120,针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户。如上所述,在本申请实施例中,除了所述目标用户的个体特征之外,还涉及所述目标用户的关系用户。这里,所述目标用户的关系用户例如是与所述目标用户具有社交关系的关系用户,与所述目标用户具有资金关系的关系用户,或者与所述目标用户使用相同设备登录的关系用户等。

另外,如上所述,在本申请实施例中,所述目标用户可以是多种类型的用户,除了作为人的用户本身以外,也可以包括可以代表人的其它标识,例如用户账号,或者由人所使用的设备或者物品等。相应地,所述目标用户的关系用户也可以是不同类型的用户,诸如用户账号、用户设备或者用户物品等。而且,所述目标用户的关系用户不仅限于一个类型的用户,也可以包括多个类型的用户,例如几个关系用户是用户本身,另外的关系用户是用户账号、用户设备、用户物品等。

由于在本申请实施例中,所述关系用户是所述目标用户的不同关系类型的关系用户,且也可能是不同类型的用户,根据本申请实施例的关系用户所组成的用户集合实质上是一个异质用户集合。因此,在本申请实施例中,通过使用元路径方法遍历来产生对应于不同关系类型的关系用户集合。这里,所述元路径方法实质上是通过相似性来确定目标集合的子集合的方法,在本申请实施例中,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户。

例如,如图1所示,某个目标用户T的关系用户包括用户A、用户B、用户C、用户D和用户E,且关系类型包括社交关系和资金关系两种。通过使用元路径方法遍历得到对应于社交关系的元路径{用户A,用户C,用户D}和对应于资金关系的元路径{用户B,用户E,用户D}。

因此,对于关系用户集合,可以使用元路径方法遍历以产生对应于不同关系类型的多条元路径,例如如图2所示的元路径1到元路径P。这里,图2图示了根据本申请实施例的用户分类方法所应用的网络架构的示意图。并且,针对某一关系类型,可以产生一条或者多条元路径。例如,在如图2所示的元路径1到元路径P中,可以有一条或者多条元路径对应于社交关系,也可以有一条或者多条元路径对应于资金关系。

步骤S130,获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述目标用户的关系。也就是,针对所确定的多条元路径,确定每条元路径中包含的多个用户中的每个用户的第二个体特征和关系特征。例如,针对如上所述的元路径{用户A,用户C,用户D},分别确定用户A、用户C和用户D各自的第二个体特征,再分别确定用户A、用户C和用户D的关系特征。

如上所述,所述第二个体特征类似于所述第一个体特征,可以是取决于所要进行的分类场景的反映用户的个体属性的数据,例如年龄、职业等。所述用户的关系特征可以以所述元路径中包含所述用户的路径表示,例如用户C的关系特征为A→C的路径,所述用户D的关系特征为C→D的路径等。另外,针对每条元路径中的第一个用户,例如如上所述的用户A,也可以构造一条虚拟的某用户到用户A的路径,从而作为用户A的关系特征。

这样,针对所产生的多条元路径,实际上获得了多条元路径分别对应的用户集合和关系集合。例如,所述用户集合是如图2所示的用户集合

也就是,在根据本申请实施例的用户分类方法中,所述元路径具有对应关联的关系类型。

步骤S140,基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量。

如上所述,通过获得所述目标用户的第一个体特征、所述关系用户的第二个体特征和关系特征,就可以通过融合上述特征来得到最终用于用户分类的特征向量。并且,在本申请实施例中,为了区分对于目标用户的重要程度,采用注意力机制来融合所述第一个体特征、所述第二个体特征与所述关系特征。

这里,注意力机制(Attention)利用了与人类相似的注意力的原理,通过聚焦于需要重点关注的部分,然后对这一部分投入更多注意力资源,以获取更多所需要关注目标的细节信息,而抑制其他无用信息。其可以应用于自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,以从众多信息中选择出对当前任务目标更关键的信息。

在本申请实施例中,所述第二个体特征与所述关系特征涉及到具有不同关系类型的不同关系用户的不同特征,也就是,每种关系,每个用户以及每个特征都可能对目标用户的分类具有不同的重要程度,因此,可以采用不同的注意力机制来分别计算其对目标用户的重要程度。

并且,针对每种关系,每个用户以及每个特征,可以对于其中的一个或者多个来使用一个或多个注意力机制来计算其对目标用户的重要程度,因此,在本申请实施例中,可以使用一个或多个注意力机制来从一个或多个方面捕捉对于分类结果相对重要的特征。

因此,通过基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制,所获得的注意力特征向量将赋予对于目标用户的分类结果具有更大的重要程度的特征更大的权重,从而促进用户分类的精确性。

将在下文中对于本申请实施例中所采用的注意力机制进行具体说明。

步骤S150,使用多层感知器网络基于所述注意力特征向量获得所述目标用户的分类结果,所述多层感知器网络用于基于特征向量进行分类。这里,取决于根据本申请实施例的用户分类方法所应用的分类场景,例如金融业务场景、推荐业务场景、电商业务场景等,所述分类结果可以是金融逾期结果、搜索推荐结果、虚假交易结果等,这将在下文中进行进一步的详细说明。

如上所述,由于所述注意力特征向量赋予了不同特征不同权重,从而区分了各个特征对于用户分类的不同重要程度。这样,通过多层感知器网络,可以获得更加准确的用户分类结果。

另外,如上所述,根据本申请实施例的用户分类方法通过元路径方法有效地利用了目标用户的关系用户网络的拓扑信息,从而能够自适应地挖掘未知的拓扑结构和融合个体特征,提高了用户分类的召回率。

并且,由于个体特征和关系特征的有效融合,也提高了用户分类的鲁棒性。

下面,将结合如图3所示的根据本申请实施例的用户分类方法的示意性网络架构来说明注意力机制。

如图3所示,针对目标用户x

例如,对于如上所述的元路径{用户A,用户C,用户D},其包含三个节点用户A、用户C和用户D,则分别将用户A、用户C和用户D的第二个体特征及其关系特征拼接,以得到三个关系用户特征,例如记为h

接下来,将所述目标用户的第一个体特征与所述多个关系用户特征拼接,以得到多个第一拼接特征。例如,第一个体特征记为h

然后,分别基于所述多个第一拼接特征使用所述至少一个注意力机制以获得对应于每条元路径的多个子注意力向量,并将所述多个子注意力向量级联以获得所述注意力特征向量。

因此,在根据本申请实施例的用户分类方法中,基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量包括:对于每条元路径,将所述多个关系用户中的每个关系用户各自的第二个体特征和关系特征拼接以得到多个关系用户特征,所述关系用户特征是拼接后的第二个体特征和关系特征;将所述多个关系用户特征与所述第一个体特征拼接以得到多个第一拼接特征,所述第一拼接特征是拼接后的第一个体特征、第二个体特征和拼接特征;基于所述多个第一拼接特征使用至少一个注意力机制以获得对应于每条元路径的多个子注意力向量,所述多个子注意力向量是用于表示每条元路径对应的关系用户的第二个体特征和关系特征相对于目标用户的重要程度的特征向量;以及,将所述多个子注意力向量级联以获得所述注意力特征向量。

值得注意的是,在本申请实施例中,所述目标用户的第一个体特征,以及每个关系用户各自的第二个体特征和关系特征可能具有不同大小,因此,在对特征进行拼接之前,需要通过变换矩阵映射以获得相同大小的特征向量。例如,可以使用全连接层将不同大小的特征转换为相同大小的特征向量。

因此,在根据本申请实施例的用户分类方法中,对于每条元路径,将所述多个用户中的每个用户各自的第二个体特征和关系特征拼接以得到多个关系用户特征包括:对于每条元路径,将所述多个用户中的每个用户各自的第二个体特征和关系特征通过变换矩阵映射为相同长度的第二个体特征向量和关系特征向量,所述变换矩阵用于将不同向量转换为相同长度;以及,将所述相同长度的第二个体特征向量和关系特征向量拼接为所述多个关系用户特征。

并且,在根据本申请实施例的用户分类方法中,将所述多个关系用户特征与所述第一个体特征拼接以得到多个第一拼接特征包括:将所述第一个体特征通过变换矩阵映射为具有与所述多个关系用户特征相同大小的第一个体特征向量;以及,将所述相同大小的多个关系用户特征与所述第一个体特征拼接为所述多个第一拼接特征。

仍然以上述实例为例进行描述,对于所获得的三个第一拼接特征[h

h′

z

其中,W和q是注意力机制中要训练的参数,L表示不同注意力机制中要计算的对象的数目。例如,如果要通过节点注意力机制计算每种关系的用户集合中不同用户对目标用户x

在如图3所示的示意性网络结构中,使用节点注意力机制、特征注意力机制和语义注意力机制三者来获得注意力特征向量,但是如上所述,在根据本申请实施例的用户分类方法中,也可以基于如上所述的注意力机制,使用节点注意力机制、特征注意力机制和语义注意力机制中的任意一个或多个两个注意力机制来获得注意力特征向量。

继续参考图3,首先通过节点注意力机制计算每种关系的用户集合中不同用户对目标用户x

因此,在根据本申请实施例的用户分类方法中,基于所述多个拼接特征使用至少一个注意力机制以获得对应于每条元路径的多个子注意力向量包括:基于所述多个第一拼接特征使用节点注意力机制以获得节点注意力向量,所述节点注意力机制用于计算作为节点的不同用户对所述目标用户的重要程度,且所述节点注意力向量是其中不同用户的特征基于所述重要程度具有不同权重的特征向量;从所述节点注意力向量与所述每个关系用户特征获得多个节点特征;以及,基于所述多个节点特征之和获得所述子注意力向量。

继续参考图3,在继续使用特征注意力机制的情况下,首先对于每条元路径,将所述多个节点特征求和以获得和特征向量。然后,按照如上所述的注意力机制,首先将所述和特征向量与所述第一个体特征拼接以获得第二拼接向量,然后基于所述第二拼接向量使用特征注意力机制以获得特征注意力向量,再将所述特征注意力向量与所述第二拼接向量相乘以获得用户集合特征向量。或者,也可以将所述特征注意力向量与所述第二拼接向量基于不同权重相乘以获得用户集合特征向量。这里,所述用户集合特征向量表示对应于每条元路径的用户集合,例如如上所述的用户集合{用户A,用户C,用户D}的特征向量。

类似地,如果不继续使用语义注意力机制,可以直接将每个元路径对应的用户集合特征向量作为所述子注意力向量。或者,也可以进一步使用语义注意力机制以获得所述子注意力向量。

因此,在上述用户分类方法中,基于所述多个节点特征之和获得所述子注意力向量包括:对于每条元路径,从所述多个节点特征获得和特征向量;将所述和特征向量与所述第一个体特征拼接以获得第二拼接向量;基于所述第二拼接向量使用特征注意力机制以获得特征注意力向量,所述特征注意力机制用于计算不同类型的特征对所述目标用户的重要程度,且所述特征注意力向量是其中不同类型的特征基于所述重要程度具有不同权重的特征向量;从所述特征注意力向量与所述第二拼接向量获得用户集合特征向量;以及,基于对应于多条元路径的多个用户集合特征向量获得所述子注意力向量。

继续参考图3,在继续使用语义注意力机制的情况下,按照如上所述的注意力机制,首先将所述多个用户集合特征向量分别与所述第一个体特征拼接以获得多个第三拼接向量,然后基于所述第三拼接向量使用语义注意力机制以获得多个语义注意力向量,最后将每个对应的特征级特征向量与语义注意力向量相乘以获得所述子注意力向量。或者,也可以将每个对应的特征级特征向量与语义注意力向量以不同权重相乘以获得所述子注意力向量。

也就是,在上述用户分类方法中,基于对应于多条元路径的多个用户集合特征向量获得所述子注意力向量包括:将所述多个用户集合特征向量分别与所述第一个体特征拼接以获得多个第三拼接向量;基于所述第三拼接向量使用语义注意力机制以获得多个语义注意力向量,所述语义注意力机制用于计算不同关系类型对所述目标用户的重要程度,且所述特征注意力向量是其中不同关系类型的特征基于所述重要程度具有不同权重的特征向量;以及,从每个对应的用户集合特征向量与语义注意力向量获得所述子注意力向量。

这样,通过如图3所示的多注意力机制,可以实现对个体和关系重要程度的多感受野捕捉,从而获得准确的分类结果。

图4图示了根据本申请实施例的金融用户逾期识别方法的流程图。

如图4所示,根据本申请实施例的金融用户逾期识别方法包括:S210,获取金融用户的第一个体特征,所述第一个体特征用于表示所述金融用户的个体属性;S220,针对所述金融用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;S230,获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述金融用户的关系;S240,基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及S250,使用多层感知器网络基于所述注意力特征向量识别所述金融用户是否逾期,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示金融用户逾期的标签。

这里,在如图4所示的根据本申请实施例的金融用户逾期识别方法中,目标用户为需要识别是否金融逾期的用户,且关系用户可以是与所述目标用户具有资金关系的用户,比如有资金往来流水的用户。

并且,通过如图4所示的根据本申请实施例的金融用户逾期识别方法,可以获得用户是否金融逾期的结果,从而可以向比如银行等金融机构,尤其是例如其贷款部门提供用户是否金融逾期的结果,从而促进贷款部门的贷款安全。

本领域技术人员可以理解,根据本申请实施例的金融用户逾期识别方法的其它细节与之前参考图1到图3描述的根据本申请实施例的用户分类方法中的相应细节完全相同,为了避免冗余便不再赘述。

图5图示了根据本申请实施例的目标用户的搜索推荐方法的流程图。

如图5所示,根据本申请实施例的目标用户的搜索推荐方法包括:S310,获取目标用户的第一个体特征,所述第一个体特征用于表示所述目标用户的个体属性;S320,针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;S330,获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述目标用户的关系;S340,基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;S350,使用多层感知器网络基于所述注意力特征向量对所述目标用户进行分类,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示向目标用户进行搜索推荐的类别的标签;以及S360,按照所述类别向所述目标用户进行搜索推荐。

这里,在如图5所示的根据本申请实施例的目标用户的搜索推荐方法中,目标用户为需要进行搜索推荐的用户,比如正在浏览购物网站的用户,且关系用户可以是与所述目标用户具有社交关系的用户,或者是与所述目标用户在购物网站上购买过相同物品的其它用户,等等。

并且,通过如图5所示的根据本申请实施例的目标用户的搜索推荐方法,可以获得目标用户的搜索推荐结果,从而可以向购物网站等需要用户的搜索推荐结果的其它用户提供目标用户的搜索推荐结果,从而使得这些其它用户能够提供符合目标用户的搜索推荐结果。

本领域技术人员可以理解,根据本申请实施例的目标用户的搜索推荐方法的其它细节与之前参考图1到图3描述的根据本申请实施例的用户分类方法中的相应细节完全相同,为了避免冗余便不再赘述。

图6图示了根据本申请实施例的虚假交易识别方法的流程图。

如图6所示,根据本申请实施例的虚假交易识别方法包括:S410,获取交易用户的第一个体特征,所述第一个体特征用于表示所述金融用户的个体属性;S420,针对所述交易用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;S430,获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述交易用户的关系;S440,基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及S450,使用多层感知器网络基于所述注意力特征向量识别所述交易用户是否进行了虚假交易,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示虚假交易的标签。

这里,在如图6所示的根据本申请实施例的虚假交易识别方法中,目标用户为需要识别是否虚假交易的用户,比如特定网站的交易用户,且关系用户可以是与所述目标用户具有交易关系的用户,比如目标用户作为买方或者卖方具有相对应的买卖关系的用户,等等。

并且,通过如图6所示的根据本申请实施例的虚假交易识别方法,可以获得目标用户是否为虚假交易的分类结果,从而可以向网站的服务提供方提供目标用户是否为虚假交易的判定结果,从而使得服务提供方能够准确地识别进行了虚假交易的用户。

本领域技术人员可以理解,根据本申请实施例的虚假交易识别方法的其它细节与之前参考图1到图3描述的根据本申请实施例的用户分类方法中的相应细节完全相同,为了避免冗余便不再赘述。

图7图示了根据本申请实施例的用户领取优惠券的意图的识别方法的流程图。

如图7所示,根据本申请实施例的用户领取优惠券的意图的识别方法包括:S510,获取领取优惠券的用户的第一个体特征,所述第一个体特征用于表示所述用户的个体属性;S520,针对所述用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;S530,获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述领取优惠券的用户的关系;S540,基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及S550,使用多层感知器网络基于所述注意力特征向量识别所述用户领取所述优惠券是否是恶意意图,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示所述用户的恶意意图的标签。

这里,在如图7所示的根据本申请实施例的用户领取优惠券的意图的识别方法中,目标用户为已领取或者待领取优惠券的用户,比如购物网站的用户,且关系用户可以是与所述目标用户具有社交关系的用户,比如目标用户通过社交网站转发优惠券信息的关系用户,等等。

并且,通过如图7所示的根据本申请实施例的用户领取优惠券的意图的识别方法,可以获得目标用户领取所述优惠券是否是恶意意图的分类结果,从而可以优惠券的提供方提供目标用户领取所述优惠券是否是恶意意图的判定结果,从而使得优惠券的提供方能够准确地识别恶意领取优惠券的用户,减少优惠券的提供方的损失。

此外,在如图7所示的根据本申请实施例的用户领取优惠券的意图的识别方法中,所述优惠券可以是购物时的满减券,也可以是以单纯的现金红包的形式。并且,所述优惠券的提供方并不限于购物网站或者其卖家,也包括其它提供现金红包的用户。

本领域技术人员可以理解,根据本申请实施例的用户领取优惠券的意图的识别方法的其它细节与之前参考图1到图3描述的根据本申请实施例的用户分类方法中的相应细节完全相同,为了避免冗余便不再赘述。

图8图示了根据本申请实施例的用户分类装置的框图。

如图8所示,根据本申请实施例的用户分类装置600包括:目标特征获取单元610,用于获取目标用户的第一个体特征,所述第一个体特征用于表示所述目标用户的个体属性;元路径遍历单元620,用于针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;关系特征获取单元630,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述目标用户的关系;注意力机制单元640,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,分类结果获得单元650,用于使用多层感知器网络基于所述注意力特征向量获得所述目标用户的分类结果,所述多层感知器网络用于基于特征向量进行分类。

在一个示例中,在上述用户分类装置600中,所述元路径具有对应关联的关系类型。

在一个示例中,在上述用户分类装置600中,所述注意力机制单元640用于:对于每条元路径,将所述多个关系用户中的每个关系用户各自的第二个体特征和关系特征拼接以得到多个关系用户特征,所述关系用户特征是拼接后的第二个体特征和关系特征;将所述多个关系用户特征与所述第一个体特征拼接以得到多个第一拼接特征,所述第一拼接特征是拼接后的第一个体特征、第二个体特征和拼接特征;基于所述多个第一拼接特征使用至少一个注意力机制以获得对应于每条元路径的多个子注意力向量,所述多个子注意力向量是用于表示每条元路径对应的关系用户的第二个体特征和关系特征相对于目标用户的重要程度的特征向量;以及,将所述多个子注意力向量级联以获得所述注意力特征向量。

在一个示例中,在上述用户分类装置600中,所述注意力机制单元640对于每条元路径,将所述多个用户中的每个用户各自的第二个体特征和关系特征拼接以得到多个关系用户特征包括:对于每条元路径,将所述多个用户中的每个用户各自的第二个体特征和关系特征通过变换矩阵映射为相同长度的第二个体特征向量和关系特征向量,所述变换矩阵用于将不同向量转换为相同长度;以及,将所述相同长度的第二个体特征向量和关系特征向量拼接为所述多个关系用户特征。

在一个示例中,在上述用户分类装置600中,所述注意力机制单元640基于所述多个拼接特征使用至少一个注意力机制以获得对应于每条元路径的多个子注意力向量包括:基于所述多个第一拼接特征使用节点注意力机制以获得节点注意力向量,所述节点注意力机制用于计算作为节点的不同用户对所述目标用户的重要程度,且所述节点注意力向量是其中不同用户的特征基于所述重要程度具有不同权重的特征向量;从所述节点注意力向量与所述每个关系用户特征获得多个节点特征;以及,基于所述多个节点特征之和获得所述子注意力向量。

在一个示例中,在上述用户分类装置600中,所述注意力机制单元640基于所述多个节点特征之和获得所述子注意力向量包括:对于每条元路径,从所述多个节点特征获得和特征向量;将所述和特征向量与所述第一个体特征拼接以获得第二拼接向量;基于所述第二拼接向量使用特征注意力机制以获得特征注意力向量,所述特征注意力机制用于计算不同类型的特征对所述目标用户的重要程度,且所述特征注意力向量是其中不同类型的特征基于所述重要程度具有不同权重的特征向量;从所述特征注意力向量与所述第二拼接向量获得用户集合特征向量;以及,基于对应于多条元路径的多个用户集合特征向量获得所述子注意力向量。

在一个示例中,在上述用户分类装置600中,所述注意力机制单元640基于对应于多条元路径的多个用户集合特征向量获得所述子注意力向量包括:将所述多个用户集合特征向量分别与所述第一个体特征拼接以获得多个第三拼接向量;基于所述第三拼接向量使用语义注意力机制以获得多个语义注意力向量,所述语义注意力机制用于计算不同关系类型对所述目标用户的重要程度,且所述特征注意力向量是其中不同关系类型的特征基于所述重要程度具有不同权重的特征向量;以及,从每个对应的用户集合特征向量与语义注意力向量获得所述子注意力向量。

在一个示例中,在上述用户分类装置600中,所述目标用户包括用户账号、用户设备、用户物品的其中之一。

在一个示例中,在上述用户分类装置600中,所述不同关系类型包括社交关系、资金关系、设备登录关系的其中之一。

在一个示例中,在上述用户分类装置600中,所述分类结果包括金融逾期结果、搜索推荐结果、虚假交易结果的其中之一。

这里,本领域技术人员可以理解,上述基于用户分类装置600中的各个单元和模块的具体功能和操作已经在上面参考图1到图3的用户分类方法的描述中得到了详细介绍,并因此,将省略其重复描述。

如上所述,根据本申请实施例的用户分类装置600可以实现在各种终端设备中,例如金融反欺诈网站的服务器等。在一个示例中,根据本申请实施例的用户分类装置600可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该用户分类装置600可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该用户分类装置600同样可以是该终端设备的众多硬件模块之一。

替换地,在另一示例中,该用户分类装置600与该终端设备也可以是分立的设备,并且该用户分类装置600可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。

图9图示了根据本申请实施例的金融用户逾期识别装置的框图。

如图9所示,根据本申请实施例的金融用户逾期识别装置700包括:金融用户特征获取单元710,用于获取金融用户的第一个体特征,所述第一个体特征用于表示所述金融用户的个体属性;金融元路径遍历单元720,用于针对所述金融用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;金融关系特征获取单元730,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述金融用户的关系;金融注意力机制单元740,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,金融用户逾期识别单元750,用于使用多层感知器网络基于所述注意力特征向量识别所述金融用户是否逾期,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示金融用户逾期的标签。

这里,本领域技术人员可以理解,上述金融用户逾期识别装置700中的各个单元和模块的具体功能和操作与如图8所示的根据本申请实施例的用户分类装置600中的各个单元和模块的具体功能和操作完全对应,并因此,将省略其重复描述。

图10图示了根据本申请实施例的目标用户的搜索推荐装置的框图。

如图10所示,根据本申请实施例的目标用户的搜索推荐装置800包括:搜索用户特征获取单元810,用于获取目标用户的第一个体特征,所述第一个体特征用于表示所述目标用户的个体属性;搜索元路径遍历单元820,用于针对所述目标用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;搜索关系特征获取单元830,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述目标用户的关系;搜索注意力机制单元840,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;用户分类单元850,用于使用多层感知器网络基于所述注意力特征向量对所述目标用户进行分类,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示向目标用户进行搜索推荐的类别的标签;以及,搜索推荐单元860,用于按照所述类别向所述目标用户进行搜索推荐。

这里,本领域技术人员可以理解,上述目标用户的搜索推荐装置800中的各个单元和模块的具体功能和操作与如图8所示的根据本申请实施例的用户分类装置600中的各个单元和模块的具体功能和操作完全对应,并因此,将省略其重复描述。

图11图示了根据本申请实施例的虚假交易识别装置的框图。

如图11所示,根据本申请实施例的虚假交易识别装置900包括:交易用户特征获取单元910,用于获取交易用户的第一个体特征,所述第一个体特征用于表示所述金融用户的个体属性;交易元路径遍历单元920,用于针对所述交易用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;交易关系特征获取单元930,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述交易用户的关系;交易注意力机制单元940,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,虚假交易识别单元950,用于使用多层感知器网络基于所述注意力特征向量识别所述交易用户是否进行了虚假交易,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示虚假交易的标签。

这里,本领域技术人员可以理解,上述虚假交易识别装置900中的各个单元和模块的具体功能和操作与如图8所示的根据本申请实施例的用户分类装置600中的各个单元和模块的具体功能和操作完全对应,并因此,将省略其重复描述。

图12图示了根据本申请实施例的用户领取优惠券的意图的识别装置的框图。

如图12所示,根据本申请实施例的用户领取优惠券的意图的识别装置1000包括:意图用户特征获取单元1010,用于获取领取优惠券的用户的第一个体特征,所述第一个体特征用于表示所述用户的个体属性;意图元路径遍历单元1020,用于针对所述用户的关系用户的不同关系类型使用元路径方法遍历以获取每条包含多个关系用户的多条元路径,所述元路径方法用于通过相似性搜索获得所述关系用户中基于不同关系类型相似的所述多个关系用户;意图关系特征获取单元1030,用于获取每条元路径中的关系用户的第二个体特征和关系特征,所述第二个体特征用于表示所述关系用户的个体属性,所述关系特征用于表示所述关系用户与所述领取优惠券的用户的关系;意图注意力机制单元1040,用于基于拼接的所述第一个体特征、所述第二个体特征与所述关系特征使用至少一个注意力机制以获得注意力特征向量,所述至少一个注意力机制用于计算不同特征对所述目标用户的重要程度,且所述注意力特征向量是其中不同特征基于所述重要程度具有不同权重的特征向量;以及,恶意意图识别单元1050,用于使用多层感知器网络基于所述注意力特征向量识别所述用户领取所述优惠券是否是恶意意图,所述多层感知器网络用于基于特征向量进行分类,且设置有用于表示所述用户的恶意意图的标签。

这里,本领域技术人员可以理解,上述用户领取优惠券的意图的识别装置1000中的各个单元和模块的具体功能和操作与如图8所示的根据本申请实施例的用户分类装置600中的各个单元和模块的具体功能和操作完全对应,并因此,将省略其重复描述。

下面,参考图13来描述根据本申请实施例的电子设备。

图13图示了根据本申请实施例的电子设备的框图。

如图13所示,电子设备10包括一个或多个处理器11和存储器12。

处理器13可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的用户分类方法、金融用户逾期识别方法,目标用户的搜索推荐方法,虚假交易识别方法,和用户领取优惠券的意图的识别方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如个体特征数据、关系特征数据等各种内容。

在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

该输入装置13可以包括例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息,包括用户分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图13中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。

除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的用户分类方法,金融用户逾期识别方法,目标用户的搜索推荐方法,虚假交易识别方法,和用户领取优惠券的意图的识别方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在第一用户计算设备上执行、部分地在第一用户设备上执行、作为一个独立的软件包执行、部分在第一用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的用户分类方法,金融用户逾期识别方法,目标用户的搜索推荐方法,虚假交易识别方法,和用户领取优惠券的意图的识别方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号