首页> 中国专利> 用户风险的评估方法、装置、电子设备及存储介质

用户风险的评估方法、装置、电子设备及存储介质

摘要

本申请提供了一种用户风险的评估方法、装置、电子设备及存储介质。在用户风险的评估方法中,首先获取待评估用户的用户数据,其中,用户数据至少包括用户属性、关系信息和交易信息。将用户属性和关系信息输入到知识提取单元中,得到用户知识特征。将交易信息输入到第一线性映射单元中,得到用户交易特征。然后将用户知识特征和用户交易特征输入到动态融合单元中,得到融合特征。最后将融合特征输入到第二线性映射单元中,得到待评估用户的风险等级。解决了现有技术中用户的风险评估效果较差,无法准确地对用户的风险进行评估,加大了银行等金融机构的金融业务的风险的问题。

著录项

  • 公开/公告号CN114820210A

    专利类型发明专利

  • 公开/公告日2022-07-29

    原文格式PDF

  • 申请/专利权人 中国农业银行股份有限公司;

    申请/专利号CN202210439733.X

  • 发明设计人 朱宏康;王浩楠;郑宝;

    申请日2022-04-25

  • 分类号G06Q40/08;G06Q40/02;G06N5/02;G06K9/62;G06N3/04;G06N3/08;

  • 代理机构北京集佳知识产权代理有限公司;

  • 代理人周初冬

  • 地址 100005 北京市东城区建国门内大街69号

  • 入库时间 2023-06-19 16:08:01

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-29

    公开

    发明专利申请公布

说明书

技术领域

本申请涉及金融技术领域,尤其涉及一种用户风险的评估方法、装置、电子设备及存储介质。

背景技术

对于金融机构来说,客户的风险评估是十分重要的,所有客户均存在一定的风险,尤其是不正当金融行为,需要被有效识别,否则不仅客户所在机构面临经济损失,而且会扰乱金融秩序,危害金融稳定,甚至危害社会稳定。

在现有技术中,在对客户进行风险评估时,通常只计算离散的客户特征值,对不同性质的特征不加以区分,导致用户的风险评估效果较差,无法准确地对用户的风险进行评估,加大了银行等金融机构的金融业务的风险。

发明内容

有鉴于此,本申请提供了一种用户风险的评估方法、装置、电子设备及存储介质,以解决现有技术中通常只计算离散的客户特征值,对不同性质的特征不加以区分,导致用户的风险评估效果较差,无法准确地对用户的风险进行评估,加大了银行等金融机构的金融业务的风险的问题。

为实现上述目的,本申请提供如下技术方案:

本申请第一方面公开了一种用户风险的评估方法,应用于风险评估模型,其中,所述风险评估模型包括知识提取单元、第一线性映射单元、第二线性映射单元和动态融合单元,所述用户风险的评估方法,包括:

获取待评估用户的用户数据,其中,所述用户数据至少包括用户属性、关系信息和交易信息;

将所述用户属性和所述关系信息输入到所述知识提取单元中,得到用户知识特征;

将所述交易信息输入到所述第一线性映射单元中,得到用户交易特征;

将所述用户知识特征和所述用户交易特征输入到所述动态融合单元中,得到融合特征;

将所述融合特征输入到所述第二线性映射单元中,得到所述待评估用户的风险等级。

可选的,上述的方法,所述风险评估模型的构建过程,包括:

获取标注风险等级的用户数据样本集;

将所述标注风险等级的用户数据样本集输入到初始模型中进行运算,得到当前用户数据的风险等级;

判断所述当前用户数据的风险等级与实际标注的用户数据的风险等级是否一致;

若所述当前用户数据的风险等级与实际标注的用户数据的风险等级一致,则完成所述风险评估模型的构建;

若所述当前用户数据的风险等级与实际标注的用户数据的风险等级不一致,则求出损失函数,并利用所述损失函数调整所述神经网络模型的参数,直至输出的所述当前用户数据的风险等级与实际标注的用户数据的风险等级一致,则完成所述风险评估模型的构建。

可选的,上述的方法,所述获取待评估用户的用户数据之后,还包括:

对所述用户数据进行数据预处理。

可选的,上述的方法,所述将所述融合特征输入到所述第二线性映射单元中,得到所述待评估用户的风险等级之后,还包括:

将所述风险等级与预设的阈值进行对比;

若所述风险等级大所述阈值,则生成风险用户的提示信息。

本申请第二方面还提供了一种用户风险的评估装置,应用于风险评估模型,其中,所述风险评估模型包括知识提取单元、第一线性映射单元、第二线性映射单元和动态融合单元,所述用户风险的评估方法,包括:

获取单元,用于获取待评估用户的用户数据,其中,所述用户数据至少包括用户属性、关系信息和交易信息;

第一特征提取单元,用于将所述用户属性和所述关系信息输入到所述知识提取单元中,得到用户知识特征;

第二特征提取单元,用于将所述交易信息输入到所述第一线性映射单元中,得到用户交易特征;

融合单元,用于将所述用户知识特征和所述用户交易特征输入到所述动态融合单元中,得到融合特征;

评估单元,用于将所述融合特征输入到所述第二线性映射单元中,得到所述待评估用户的风险等级。

可选的,上述的装置,所述用户风险的评估装置还包括用于构建所述风险评估模型的模型构建单元,所述模型构建单元,包括:

获取子单元,用于获取标注风险等级的用户数据样本集;

运算子单元,用于将所述标注风险等级的用户数据样本集输入到初始模型中进行运算,得到当前用户数据的风险等级;

判断子单元,用于判断所述当前用户数据的风险等级与实际标注的用户数据的风险等级是否一致;

构建子单元,用于若所述当前用户数据的风险等级与实际标注的用户数据的风险等级一致,则完成所述风险评估模型的构建;

调参子单元,用于若所述当前用户数据的风险等级与实际标注的用户数据的风险等级不一致,则求出损失函数,并利用所述损失函数调整所述神经网络模型的参数,直至输出的所述当前用户数据的风险等级与实际标注的用户数据的风险等级一致,则完成所述风险评估模型的构建。

可选的,上述的装置,还包括:

预处理单元,用于对所述用户数据进行数据预处理。

可选的,上述的装置,所述将所述融合特征输入到所述第二线性映射单元中,得到所述待评估用户的风险等级之后,还包括:

对比单元,用于将所述风险等级与预设的阈值进行对比;

信息生成单元,用于若所述风险等级大所述阈值,则生成风险用户的提示信息。

本申请第三方面公开了一种电子设备,包括:

一个或多个处理器;

存储装置,其上存储有一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如本申请第一方面中任意一项所述的方法。

本申请第四方面公开了一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如本申请第一方面中任意一项所述的方法。

从上述技术方案可以看出,本申请提供的一种用户风险的评估方法中,首先获取待评估用户的用户数据,其中,用户数据至少包括用户属性、关系信息和交易信息。将用户属性和关系信息输入到知识提取单元中,得到用户知识特征。将交易信息输入到第一线性映射单元中,得到用户交易特征。然后将用户知识特征和用户交易特征输入到动态融合单元中,得到融合特征。最后将融合特征输入到第二线性映射单元中,得到待评估用户的风险等级。由此可知,利用本申请的方法,通过不同的模块对用户知识特征和用户交易特征进行特征提取,并设计了动态融合单元对用户的两类特征赋予不同的权重,通过动态调节权重区分不同特征的贡献度,使融合特征具有更强的表达能力,从而降低简单拼接或直接融合产生的噪声影响,增强特征表达能力,从而提高分类准确性。解决了现有技术中通常只计算离散的客户特征值,对不同性质的特征不加以区分,导致用户的风险评估效果较差,无法准确地对用户的风险进行评估,加大了银行等金融机构的金融业务的风险的问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请另一实施例公开的一种用户风险的评估方法的流程图;

图2为本申请另一实施例公开的步骤S104中动态融合单元的一种实施方式的流程图;

图3为本申请另一实施例公开的风险评估模型的构建过程的一种实施方式的流程图;

图4为本申请另一实施例公开的一种用户风险的评估装置的示意图;

图5为本申请另一实施例公开的一种电子设备的示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

并且,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

由背景技术可知,在现有技术中,在对客户进行风险评估时,通常只计算离散的客户特征值,对不同性质的特征不加以区分,导致用户的风险评估效果较差,无法准确地对用户的风险进行评估,加大了银行等金融机构的金融业务的风险。

鉴于此,本申请提供了一种用户风险的评估方法、装置、电子设备及存储介质,以解决现有技术中通常只计算离散的客户特征值,对不同性质的特征不加以区分,导致用户的风险评估效果较差,无法准确地对用户的风险进行评估,加大了银行等金融机构的金融业务的风险的问题。

本申请第一方面公开了一种用户风险的评估方法,应用于风险评估模型,其中,风险评估模型包括知识提取单元、第一线性映射单元、第二线性映射单元和动态融合单元,具体如图1所示,包括:

S101、获取待评估用户的用户数据,其中,用户数据至少包括用户属性、关系信息和交易信息。

需要说明的是,从用户知识图谱获取用户属性和关系信息,从交易数据库获取用户交易信息,用户知识图谱遵循资源描述框架(Resource Description Framework,RDF)作为数据模型,所有知识均以<主语,谓语,宾语>结构的三元组存储,因此用户属性和关系信息多为纯文本;而交易数据库的数据类型多为日期和数字。

可选的,在本申请的另一实施例中,执行步骤S101之后,还可以包括:

对用户数据进行数据预处理。

需要说明的是,在获取到待评估用户的用户数据之后,对用户数据进行数据预处理,例如经过分词、数据脱敏、去停用词、构造辞典等操作,然后通过辞典映射,最终输出数值化的文本信息,即用一个数字序列表示一条文本信息。

S102、将用户属性和关系信息输入到知识提取单元中,得到用户知识特征。

需要说明的是,将用户属性和关系信息输入到模型中的知识提取单元(KnowledgeExtract Unit,KEU),得到用户知识特征。KEU的目的是将数值化的用户属性和关系信息转换为特定维度的向量,从而利于计算机计算,即输入是整数序列,输出是固定维度的浮点向量。

S103、将交易信息输入到第一线性映射单元中,得到用户交易特征。

需要说明的是,将交易信息输入到模型中的第一线性映射单元(Liner ProjectUnit,LPU),得到用户交易特征。LPU为的目的是将时间和交易金额等数字信息进行线性变换,转换为特定维度的向量。在此步骤中,输入是数值化和日期等结构化数据,输出是固定维度的浮点向量。

S104、将用户知识特征和用户交易特征输入到动态融合单元中,得到融合特征。

需要说明的是,在获取到用户知识特征和用户交易特征之后,则将用户知识特征和用户交易特征输入到动态融合单元(Dynamic Fusion Unit,DFU)中,得到融合特征,通过间将用户知识特征和用户交易特征进行融合,能够更准确的表示用户的特征。DFU的目的是根据每个用户的知识特征和交易特征,动态分配权重,从而使融合特征具备更强的表达能力。DFU的结构如图2所示,其中

S105、将融合特征输入到第二线性映射单元中,得到待评估用户的风险等级。

需要说明的是,将融合特征输入到第二线性映射单元中,得到待评估用户的风险等级,即输入是浮点型的融合向量,输出是一个整数,用于表示用户的风险等级,风险等级的数值可以根据实际情况进行设定,例如1、2、3,数值越大,表示的风险越大。

本申请实施例提供的一种用户风险的评估方法中,首先获取待评估用户的用户数据,其中,用户数据至少包括用户属性、关系信息和交易信息。将用户属性和关系信息输入到知识提取单元中,得到用户知识特征。将交易信息输入到第一线性映射单元中,得到用户交易特征。然后将用户知识特征和用户交易特征输入到动态融合单元中,得到融合特征。最后将融合特征输入到第二线性映射单元中,得到待评估用户的风险等级。由此可知,利用本申请的方法,通过不同的模块对用户知识特征和用户交易特征进行特征提取,并设计了动态融合单元对用户的两类特征赋予不同的权重,通过动态调节权重区分不同特征的贡献度,使融合特征具有更强的表达能力,从而降低简单拼接或直接融合产生的噪声影响,增强特征表达能力,从而提高分类准确性。解决了现有技术中通常只计算离散的客户特征值,对不同性质的特征不加以区分,导致用户的风险评估效果较差,无法准确地对用户的风险进行评估,加大了银行等金融机构的金融业务的风险的问题。

可选的,在本申请的另一实施例中,执行步骤S105之后,还可以包括:

将风险等级与预设的阈值进行对比。

若风险等级大阈值,则生成风险用户的提示信息。

需要说明的是,在得到待评估用户的风险等级之后,将风险等级与预设的阈值进行对比,该阈值可根据实际情况进行设定,例如3。如果风险等级大阈值,则视为高风险,因此生成风险用户的提示信息,以提示工作人员。

可选的,在本申请的另一实施例中,上述风险评估模型的构建过程的一种实施方式,如图3所示,具体包括:

S301、获取标注风险等级的用户数据样本集。

需要说明的是,首先获取标注了风险等级的用户数据样本集,用于进行模型的训练。

S302、将标注风险等级的用户数据样本集输入到初始模型中进行运算,得到当前用户数据的风险等级。

S303、判断当前用户数据的风险等级与实际标注的用户数据的风险等级是否一致。

需要说明的是,需要说明的是,在初始运算模型中运算得到当前用户数据的风险等级之后,将运算得到的当前用户数据的风险等级与实际标注的用户数据的风险等级进行对比,从而判断初始运算模型中运算得到的当前用户数据的风险等级是否准确。

S304、若当前用户数据的风险等级与实际标注的用户数据的风险等级一致,则完成风险评估模型的构建。

S305、若当前用户数据的风险等级与实际标注的用户数据的风险等级不一致,则求出损失函数,并利用损失函数调整神经网络模型的参数,直至输出的当前用户数据的风险等级与实际标注的用户数据的风险等级一致,则完成风险评估模型的构建。

需要说明的是,需要说明的是,如果当前用户数据的风险等级与实际标注的用户数据的风险等级不一致,则求出神经网络模型的损失函数,利用损失函数调整神经网络模型的参数,并重新进行新一轮的运算,直至输出的当前用户数据的风险等级与实际标注的用户数据的风险等级一致,则完成风险评估模型的构建。该步骤的输入是风险分级的概率分布,输出是一个实数值,即损失,实数值的大小表示与实际类别的偏离程度,越大代表预测越不准确,模型训练的目标就是使损失最小。

可选的,在本申请的另一实施例中还提供了一种用户风险的评估装置,应用于风险评估模型,其中,风险评估模型包括知识提取单元、第一线性映射单元、第二线性映射单元和动态融合单元,具体如图4所示,包括:

获取单元401,用于获取待评估用户的用户数据,其中,用户数据至少包括用户属性、关系信息和交易信息。

第一特征提取单元402,用于将用户属性和关系信息输入到知识提取单元中,得到用户知识特征。

第二特征提取单元403,用于将交易信息输入到第一线性映射单元中,得到用户交易特征。

融合单元404,用于将用户知识特征和用户交易特征输入到动态融合单元中,得到融合特征。

评估单元405,用于将融合特征输入到第二线性映射单元中,得到待评估用户的风险等级。

本实施例中,获取单元201、第一特征提取单元402、第二特征提取单元403、融合单元404以及评估单元405的具体执行过程,可参见对应图1的方法实施例内容,此处不再赘述。

本申请实施例提供的一种用户风险的评估装置中,首先获取单元201获取待评估用户的用户数据,其中,用户数据至少包括用户属性、关系信息和交易信息。第一特征提取单元402将用户属性和关系信息输入到知识提取单元中,得到用户知识特征。第二特征提取单元403将交易信息输入到第一线性映射单元中,得到用户交易特征。然后融合单元404将用户知识特征和用户交易特征输入到动态融合单元中,得到融合特征。最后评估单元405将融合特征输入到第二线性映射单元中,得到待评估用户的风险等级。由此可知,利用本申请的方法,通过不同的模块对用户知识特征和用户交易特征进行特征提取,并设计了动态融合单元对用户的两类特征赋予不同的权重,通过动态调节权重区分不同特征的贡献度,使融合特征具有更强的表达能力,从而降低简单拼接或直接融合产生的噪声影响,增强特征表达能力,从而提高分类准确性。解决了现有技术中通常只计算离散的客户特征值,对不同性质的特征不加以区分,导致用户的风险评估效果较差,无法准确地对用户的风险进行评估,加大了银行等金融机构的金融业务的风险的问题。

可选的,在本申请的另一实施例中,上述用户风险的评估装置还包括用于构建风险评估模型的模型构建单元,模型构建单元包括:

获取子单元,用于获取标注风险等级的用户数据样本集。

运算子单元,用于将标注风险等级的用户数据样本集输入到初始模型中进行运算,得到当前用户数据的风险等级。

判断子单元,用于判断当前用户数据的风险等级与实际标注的用户数据的风险等级是否一致。

构建子单元,用于若当前用户数据的风险等级与实际标注的用户数据的风险等级一致,则完成风险评估模型的构建。

调参子单元,用于若当前用户数据的风险等级与实际标注的用户数据的风险等级不一致,则求出损失函数,并利用损失函数调整神经网络模型的参数,直至输出的当前用户数据的风险等级与实际标注的用户数据的风险等级一致,则完成风险评估模型的构建。

本实施例中,获取子单元、运算子单元、判断子单元、构建子单元以及调参子单元的具体执行过程,可参见对应图3的方法实施例内容,此处不再赘述。

可选的,在本申请的另一实施例中,上述用户风险的评估装置,还可以包括:

预处理单元,用于对用户数据进行数据预处理。

本实施例中,预处理单元的具体执行过程,可参见对应上述的方法实施例内容,此处不再赘述。

可选的,在本申请的另一实施例中,上述用户风险的评估装置,还可以包括:

对比单元,用于将风险等级与预设的阈值进行对比。

信息生成单元,用于若风险等级大阈值,则生成风险用户的提示信息。

本实施例中,对比单元、信息生成单元的具体执行过程,可参见对应上述的方法实施例内容,此处不再赘述。

本申请另一实施例还提供了一种电子设备,如图5所示,具体包括:

一个或多个处理器501。

存储装置502,其上存储有一个或多个程序。

当一个或多个程序被一个或多个处理器501执行时,使得一个或多个处理器501实现如上述实施例中任意一项方法。

本申请另一实施例还提供了计算机存储介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现如上述实施例中任意一项方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号