首页> 中国专利> 风险交易识别模型的训练方法、风险交易识别方法和装置

风险交易识别模型的训练方法、风险交易识别方法和装置

摘要

本说明书实施例描述了风险交易识别模型的训练方法、风险交易识别方法和装置。根据实施例的方法,在对风险交易识别模型进行训练时,获取到的黑数据样本和白数据样本的分类标签是已知的。通过利用当前训练的风险交易识别模型对各数据样本进行识别能够得到各自的识别结果,进而可以确定出损失函数,并利用该损失函数继续进行模型训练。由于确定的损失函数是能够提高黑数据样本的学习权重的,从而当用于模型学习的黑数据样本少于白数据样本时,能够减弱学习任务向白数据样本的分类标签倾斜的问题,进而提高模型对风险交易进行识别的准确性。

著录项

  • 公开/公告号CN114912549A

    专利类型发明专利

  • 公开/公告日2022-08-16

    原文格式PDF

  • 申请/专利权人 支付宝(杭州)信息技术有限公司;

    申请/专利号CN202210807503.4

  • 发明设计人 王宁涛;傅幸;王维强;

    申请日2022-07-11

  • 分类号G06K9/62(2022.01);G06Q10/06(2012.01);G06Q40/04(2012.01);

  • 代理机构济南信达专利事务所有限公司 37100;

  • 代理人李世喆

  • 地址 310000 浙江省杭州市西湖区西溪路556号8层B段801-11

  • 入库时间 2023-06-19 16:25:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-12-13

    授权

    发明专利权授予

  • 2022-09-02

    实质审查的生效 IPC(主分类):G06K 9/62 专利申请号:2022108075034 申请日:20220711

    实质审查的生效

说明书

技术领域

本说明书一个或多个实施例涉及人工智能领域,尤其涉及风险交易识别模型的训练方法、风险交易识别方法和装置。

背景技术

在风险防控领域中,通过深度学习网络对黑样本和白样本进行学习训练,从而能够利用训练得到的模型对账户进行风险识别。

然而,风险防控领域中的黑白样本的比例通常差异是较大的。比如,黑样本和白样本的比例可能为1:1000或者1:10000,甚至白样本的比例更高。而对于风险防控通常更需要关注的是黑样本,基于这样的黑白样本比例学习得到的模型更多关注到的是白样本的信息,从而可能弱化甚至遗漏掉黑样本的信息,导致得到的识别模型在进行风险识别时准确率经常比较低。

发明内容

本说明书一个或多个实施例描述了风险交易识别模型的训练方法、风险交易识别方法和装置,能够提高风险交易识别的准确性。

根据第一方面,提供了风险交易识别模型的训练方法,包括:

获取黑数据样本和白数据样本;其中,所述黑数据样本的分类标签为风险交易,所述白数据样本的分类标签为非风险交易;

将所述黑数据样本和所述白数据样本输入当前训练的风险交易识别模型,得到各黑数据样本和白数据样本的识别结果;

根据各黑数据样本和白数据样本的识别结果,确定损失函数;其中,所述损失函数能够提高对所述黑数据样本的学习权重;

利用所述损失函数,继续训练所述风险交易识别模型。

在一种可能的实现方式中,所述识别结果包括:数据样本的标签为风险交易的概率值;

所述根据各黑数据样本和白数据样本的识别结果确定损失函数,包括:

确定所述白数据样本的第一学习权重;以及,

确定所述黑数据样本的第二学习权重;其中,所述第二学习权重大于所述第一学习权重,且所述第二学习权重满足:对所述风险交易识别模型得到的各个风险交易的概率值进行从高到低的排序,获取排在前N个概率值所对应的N个数据样本,该N个数据样本中所包含的分类标签为风险交易的黑数据样本的数量与输入所述风险交易识别模型的所有黑数据样本的数量的比值大于第一预设阈值;

根据所述第一学习权重和所述第二学习权重确定所述损失函数。

在一种可能的实现方式中,所述确定所述白数据样本的第一学习权重,包括:

获取当前训练的风险识别模型输出的分类标签为风险交易的概率值;

根据所述风险交易的概率值,确定所述第一学习权重。

在一种可能的实现方式中,所述根据所述第一学习权重和所述第二学习权重确定所述损失函数,包括:

以所述第一学习权重作为训练所述黑数据样本的权重值,得到黑样本损失项;

以所述第二学习权重作为训练所述白数据样本的权重值,得到白样本损失项;

计算所述黑样本损失项与所述白样本损失项的和,得到所述损失函数。

在一种可能的实现方式中,所述根据对各黑数据样本和白数据样本的识别结果确定损失函数,包括:

利用如下计算式,计算所述损失函数:

其中,

在一种可能的实现方式中,

在一种可能的实现方式中,所述黑数据样本与所述白数据样本数量的比例值不大于第二预设阈值。

根据第二方面,提供了风险交易识别方法,包括:

获取待进行风险识别的待识别交易数据;

将所述待识别交易数据输入到所述风险交易识别模型中,得到该风险交易识别模型输出的识别结果;其中,所述风险交易识别模型是利用第一方面任一实施例所述的风险交易识别模型的训练方法训练得到的。

根据第三方面,提供了风险交易识别模型的训练装置,包括:获取模块、输入模块、确定模块和训练模块;

所述获取模块,配置为获取黑数据样本和白数据样本;其中,所述黑数据样本的分类标签为风险交易,所述白数据样本的分类标签为非风险交易;

所述输入模块,配置为将所述获取模块获取到的所述黑数据样本和所述白数据样本输入当前训练的风险交易识别模型,得到对各黑数据样本和白数据样本的识别结果;

所述确定模块,配置为根据所述输入模块得到的各黑数据样本和白数据样本的识别结果,确定损失函数;其中,所述损失函数能够提高对所述黑数据样本的学习权重;

所述训练模块,配置为利用所述确定模块确定的所述损失函数,继续训练所述风险交易识别模型。

根据第四方面,提供了风险交易识别装置,包括:待识别交易获取模块和识别模块;

所述待识别交易获取模块,配置为获取待进行风险识别的待识别交易数据;

所述识别模块,配置为将所述待识别交易获取模块获取到的所述待识别交易数据输入到所述风险交易识别模型中,得到该风险交易识别模型输出的识别结果;其中,所述风险交易识别模型是利用第三方面所述的风险交易识别模型的训练装置训练得到的。

根据第五方面,提供了一种计算设备,包括:存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述第一方面和第二方面中任一项所述的方法。

根据本说明书实施例提供的方法和装置,在对风险交易识别模型进行训练时,获取到的黑数据样本和白数据样本的分类标签是已知的。通过利用当前训练的风险交易识别模型对各数据样本进行识别能够得到各自的识别结果,进而可以确定出损失函数,并利用该损失函数继续进行模型训练。由于确定的损失函数是能够提高黑数据样本的学习权重的,从而当用于模型学习的黑数据样本少于白数据样本时,能够减弱学习任务向白数据样本的分类标签倾斜的问题,进而提高模型对风险交易进行识别的准确性。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本说明书一个实施例提供的一种风险交易识别模型的训练方法的流程图;

图2是本说明书一个实施例提供的一种损失函数的确定方法的流程图;

图3是本说明书一个实施例提供的一种风险交易识别方法的流程图;

图4是本说明书一个实施例提供的一种风险交易识别模型的训练装置的示意图;

图5是本说明书一个实施例提供的风险交易识别装置的示意图。

具体实施方式

如前所述,在风险防控领域中,用于训练模型的黑白样本的比例通常差异是较大的。这使得深度学习网络中,softmax层产出的估计在多分类任务里会向主要的标签倾斜。比如,黑样本和白样本的比例为1:10000,那么在进行模型训练时,由于白样本的标签远远大于黑样本的标签。因此,softmax层产出的估计会向着白样本标签倾斜,进而弱化和忽略了黑样本的信息。如此使得模型没能更好的学习到黑样本的信息,从而在进行风险预测时,经常得不到准确的风险识别结果。

基于此,本方案考虑通过确定能够提高黑数据样本的学习权重的损失函数,平衡模型训练中黑数据样本少于白数据样本的情况,从而提高模型在进行模型预测时的准确性。

如图1所示,本说明书实施例提供了风险交易识别模型的训练方法,该方法可以包括如下步骤:

步骤101:获取黑数据样本和白数据样本;其中,黑数据样本的分类标签为风险交易,白数据样本的分类标签为非风险交易;

步骤103:将黑数据样本和白数据样本输入当前训练的风险交易识别模型,得到各黑数据样本和白数据样本的识别结果;

步骤105:根据各黑数据样本和白数据样本的识别结果,确定损失函数;其中,损失函数能够提高对黑数据样本的学习权重;

步骤107:利用损失函数,继续训练风险交易识别模型。

本实施例中,在对风险交易识别模型进行训练时,获取到的黑数据样本和白数据样本的分类标签是已知的。通过利用当前训练的风险交易识别模型对各数据样本进行识别能够得到各自的识别结果,进而可以确定出损失函数,并利用该损失函数继续进行模型训练。由于确定的损失函数是能够提高黑数据样本的学习权重的,从而当模型学习的黑数据样本少于白数据样本时,能够减弱学习任务向白数据样本的分类标签倾斜的问题,进而提高模型进行风险交易识别的准确性。

下面结合具体的实施例对附图1中的各个步骤进行说明。

首先在步骤101中,获取黑数据样本和白数据样本。

用于训练风险交易识别模型的训练样本包括分类标签为风险交易的黑数据样本和分类标签为非风险交易的白数据样本。比如,对于某些交易数据来说,通过用户的举报,以及人工分析等,能够确定一些交易为违规交易,那么这些交易所对应的数据即为分类标签为风险交易的黑数据样本。同理,通过用户的举报,以及人工分析等确定不包含违规交易的数据则为分类标签为非风险交易的白数据样本。

值得指出的是,在实际应用中,通常风险交易的黑数据样本会远远少于非风险交易的白数据样本,一方面,这会导致由于一类标签的样本量太小,无法有效的进行深度学习。另一方面,这会导致深度学习网络中softmax层产出的估计在多分类任务里会向样本数据量更多的标签倾斜,而这种倾斜会直接影响多分类任务的准确性。而本方案意在致力于解决这一分类标签不平衡的问题,因此,在一种可能的实现方式中,本方案用于训练风险交易识别模型的黑数据样本与白数据样本的数量的比例值不大于第二预设阈值。

比如,第二预设阈值为1:1000,那么获取到的用于训练风险交易识别模型的黑数据样本和白数据样本的数量比例不应大于1:1000。如,黑数据样本和白数据样本的数量比例值可以为1:5000、1:10000等。

然后在步骤103中,将黑数据样本和白数据样本输入当前训练的风险交易识别模型,得到各黑数据样本和白数据样本的识别结果。

本步骤中,意在将黑数据样本和白数据样本输入到当前训练的风险交易识别模型中,从深度学习网络的输出层产出各数据样本的估计值,以用于对损失函数进行优化。

进一步在步骤105中,根据各黑数据样本和白数据样本的识别结果,确定损失函数。

本步骤中,考虑根据黑数据样本和白数据样本的识别结果确定能够提高对黑数据样本的学习权重,从而达到平衡黑数据样本和白数据样本分类标签不平衡的问题。例如,在一种可能的实现方式中,识别结果可以包括数据样本的标签为风险交易的概率值。那么如图2所示,步骤105在根据各黑数据样本和白数据样本的识别结果确定损失函数时,可以通过如下步骤实现:

步骤201:确定白数据样本的第一学习权重;以及,

步骤203:确定黑数据样本的第二学习权重;其中,第二学习权重大于第一学习权重,且第二学习权重满足:对风险交易识别模型得到的各个风险交易的概率值进行从高到低的排序,获取排在前N个概率值所对应的N个数据样本,该N个数据样本中所包含的分类标签为风险交易的黑数据样本的数量与输入风险交易识别模型的所有黑数据样本的数量的比值大于第一预设阈值;

步骤205:根据第一学习权重和第二学习权重确定损失函数。

本实施例中,在确定损失函数时,首先可以确定白数据样本的第一学习权重,以及黑数据样本的第二学习权重。然后根据第一学习权重和第二学习权重即可确定出损失函数。值得注意的是,确定出的黑数据样本的第二学习权重应大于白数据样本的第一学习权重,如此能够提高训练过程中对黑数据样本的学习关注度,从而达到平衡黑数据样本的分类标签较少的问题。

此外,对风险交易识别模型得到的各个风险交易的概率值从高到低进行排序后,获取排在前N个概率值所对应的N个数据样本后,该第二学习权重还应满足的是,该N个数据样本中所包含的分类标签为风险交易的黑数据样本的数量与输入风险交易识别模型的所有黑数据样本的数量的比值大于第一预设阈值。也就是说,通过本方案确定的损失函数进行模型训练时,使得训练的模型对各数据样本进行识别时,识别的结果能够对黑数据样本的风险交易标签具有较高的覆盖程度,从而能够提高模型进行风险预测的准确性。

例如,对于10000个数据样本,其中,分类标签为风险交易的黑数据样本为80个,而分类标签为非风险交易的白数据样本为9920个。利用当前训练的风险交易识别模型对这10000个数据样本进行识别后,将识别结果得到的分类标签为风险交易的概率值从高到低进行排序,选取排在前100个概率值所对应的数据样本。可以判断该概率值排在前100的数据样本中所包含的分类标签为黑数据样本所包含的数量。如果这100个数据样本中完全包括实际分类标签为风险交易的80个黑数据样本,那么此时识别结果中对黑数据样本的覆盖程度为100%,说明识别结果具有较高的覆盖程度。而如果实际分类标签为风险交易的80个黑数据样本中有较多的黑数据样本没有包括在上述100个数据样本中。例如,仅有50个实际分类标签为风险交易的黑数据样本包含在其中,那么此时的覆盖程度为50/80=62.5%,显然识别结果对黑数据样本的的覆盖程度较低。本实施例中,通过设定第一预设值,使排在前N个数据样本中所包含的分类标签为风险交易的黑数据样本的数量与输入风险交易识别模型的所有黑数据样本的数量的比值大于第一预设阈值,保证了识别结果能够对黑数据样本具有较高的覆盖程度,从而能够提高模型用于风险识别的可靠性。

下面对步骤201进行说明。

步骤201在确定白数据样本的第一学习权重时,可以考虑根据当前训练的风险交易模型的估计值来确定。比如,可以首先获取当前训练的风险交易识别模型输出的分类标签为风险交易的概率值,然后根据该风险交易的概率值确定第一学习权重。

比如,可以基于focal loss损失函数的权重确定方式,根据经验值确定一个超参数,并将该超参数作为风险交易识别模型输出的分类标签为风险交易的概率值的指数,以此来得到第一学习权重。当然,在一种可能的实现方式中,该超参数还可以通过神经网络的学习不断优化得到。

下面对步骤203进行说明。

由于黑数据样本的数量少于白数据样本的数量。因此,本步骤中考虑使第二学习权重大于第一学习权重,即为黑数据样本赋予更高的学习权重,从而提高模型学习时对黑数据样本的关注程度,达到平衡黑数据样本和白数据样本的分类标签不平衡的问题。

当然在一种可能的实现方式中,可以使第二学习权重为1,不根据当前风险交易识别模型的识别结果来确定。即对于黑数据样本的标签值来说,认为当前风险交易识别模型的识别结果为风险交易的概率为100%。如此,能够最大程度地提高黑数据样本的学习权重,进而提高风险交易识别模型进行风险交易识别的准确性。

下面对步骤205进行说明。

当确定白数据样本的第一学习权重以及黑数据样本的第二学习权重之后,进一步根据第一学习权重和第二学习权重确定损失函数。比如,在一种可能的实现方式中,首先以第一学习权重作为训练黑数据样本的权重值,得到黑样本损失项,并以第二学习权重作为训练白数据样本的权重值,得到白样本损失项。

然后,计算得到的黑样本损失项和白样本损失项的和得到损失函数。虽然白数据样本的标签数量较多,但黑数据样本的第二学习权重更大。如此,在模型对样本数据进行学习时,能够提升黑样本数据在优化学习中的占比,从而使训练得到的模型更加可靠,利用该模型进行风险识别时的准确性也更高。

在一种可能的实现方式中,可以将第二学习权重的值设为1,如此可以利用如下计算式得到损失函数:

其中,

传统的交叉熵损失函数中,黑数据样本的损失项和白数据样本的损失项都根据样本的识别结果确定了相应的学习权重。例如,focal loss损失函数中,黑样本的学习权重可以为

例如,对于黑数据样本来说,如果采用传统的focal loss损失函数,假如风险交易识别模型的识别结果为风险交易的概率为0.8,参数

最后在步骤107中,利用损失函数,继续训练风险交易识别模型。

训练风险交易识别模型的过程是以最小化上述损失函数为目标的。具体地,在上述损失函数的基础上,每次迭代过程中,利用损失函数的值进行反向传播,更新风险交易识别模型的模型参数,直至达到迭代停止条件。其中迭代停止条件可以是诸如损失函数收敛、迭代次数达到预设的次数阈值等。

如图3所示,本说明书实施例提供了一种风险交易识别方法,该方法可以包括如下步骤:

步骤301:获取待进行风险识别的待识别交易数据;

步骤303:将待识别交易数据输入到风险交易识别模型中,得到该风险交易识别模型输出的识别结果;其中,风险交易识别模型是利用本说明书任一实施例提供的风险交易识别模型的训练方法训练得到的。

由于风险交易识别模型是利用能够提高黑数据样本的学习权重的损失函数训练得到的,考虑到了黑数据样本远少于白数据样本所造成的模型学习到的信息向白数据样本的标签值倾斜的问题,从而能够提高对风险交易进行识别的准确性。

如图4所示,本说明书实施例提供了一种风险交易识别模型的训练装置,包括:获取模块401、输入模块402、确定模块403和训练模块404;

获取模块401,配置为获取黑数据样本和白数据样本;其中,黑数据样本的分类标签为风险交易,白数据样本的分类标签为非风险交易;

输入模块402,配置为将获取模块401获取到的黑数据样本和白数据样本输入当前训练的风险交易识别模型,得到对各黑数据样本和白数据样本的识别结果;

确定模块403,配置为根据输入模块402得到的各黑数据样本和白数据样本的识别结果,确定损失函数;其中,损失函数能够提高对黑数据样本的学习权重;

训练模块404,配置为利用确定模块403确定的损失函数,继续训练风险交易识别模型。

在一种可能的实现方式中,识别结果包括:数据样本的标签为风险交易的概率值;

确定模块403在根据各黑数据样本和白数据样本的识别结果确定损失函数时,配置成执行如下操作:

确定白数据样本的第一学习权重;以及,

确定黑数据样本的第二学习权重;其中,第二学习权重大于第一学习权重,且第二学习权重满足:对风险交易识别模型得到的各个风险交易的概率值进行从高到低的排序,获取排在前N个概率值所对应的N个数据样本,该N个数据样本中所包含的分类标签为风险交易的黑数据样本的数量与输入风险交易识别模型的所有黑数据样本的数量的比值大于第一预设阈值;

根据第一学习权重和第二学习权重确定损失函数。

在一种可能的实现方式中,确定模块403在确定白数据样本的第一学习权重时,配置成执行如下操作:

获取当前训练的风险识别模型输出的分类标签为风险交易的概率值;

根据风险交易的概率值,确定第一学习权重。

在一种可能的实现方式中,确定模块403在根据第一学习权重和第二学习权重确定损失函数时,配置成执行如下操作:

以第一学习权重作为训练黑数据样本的权重值,得到黑样本损失项;

以第二学习权重作为训练白数据样本的权重值,得到白样本损失项;

计算黑样本损失项与白样本损失项的和,得到损失函数。

在一种可能的实现方式中,确定模块403在根据各黑数据样本和白数据样本的识别结果确定损失函数时,配置成利用如下计算式,计算损失函数:

其中,

在一种可能的实现方式中,确定模块403确定的损失函数中,

在一种可能的实现方式中,获取模块401获取到的黑数据样本与白数据样本数量的比例值不大于第二预设阈值。

如图5所示,本说明书实施例还提供了一种风险交易识别装置,包括:待识别交易获取模块501和识别模块502;

待识别交易获取模块501,配置为获取待进行风险识别的待识别交易数据;

识别模块502,配置为将待识别交易获取模块501获取到的待识别交易数据输入到风险交易识别模型中,得到该风险交易识别模型输出的识别结果;其中,风险交易识别模型是利用本说明书任一实施例提供的风险交易识别模型的训练装置训练得到的。

本说明书还提供了一种计算机可读存储介质,其上存储有计算机程序,当计算机程序在计算机中执行时,令计算机执行说明书中任一个实施例中的方法。

本说明书还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现说明书中任一个实施例中的方法。

可以理解的是,本说明书实施例示意的结构并不构成对风险交易识别模型的训练装置和风险交易识别装置的具体限定。在说明书的另一些实施例中,风险交易识别模型的训练装置和风险交易识别装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。

上述装置内的各单元之间的信息交互、执行过程等内容,由于与本说明书方法实施例基于同一构思,具体内容可参见本说明书方法实施例中的叙述,此处不再赘述。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书所描述的功能可以用硬件、软件、挂件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式,对本说明书描述的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号