首页> 中国专利> 一种贷后资金归集行为评分的方法及装置

一种贷后资金归集行为评分的方法及装置

摘要

本发明公开了一种贷后资金归集行为评分的方法与装置,所述方法包括以下步骤:数据采集与清洗,获取整个系统中所需的数据对象,进行数据清洗;贷后转账交易筛选与权重计算,对清洗后的数据进行转账交易筛选,根据筛选出的贷后交易结果,对每一笔交易设置权重并计算;生成团伙,用于发现团伙,并计算出各节点的相关特征,获得团伙维度特征;团伙评分与个人评分,根据上一步中得到的团伙维度特征进行综合判定;结果输出,对团伙和个人归集账号进行筛选,完成后对结果进行推送。所述方法判断准确率高、时效性高,并降低了对经验丰富的风控人员的依赖。

著录项

  • 公开/公告号CN112927070A

    专利类型发明专利

  • 公开/公告日2021-06-08

    原文格式PDF

  • 申请/专利权人 顶象科技有限公司;

    申请/专利号CN202110428815.X

  • 发明设计人 尚朝;徐英浩;陈树华;

    申请日2021-04-21

  • 分类号G06Q40/02(20120101);G06Q20/10(20120101);G06Q20/40(20120101);

  • 代理机构11483 北京云科知识产权代理事务所(特殊普通合伙);

  • 代理人张飙

  • 地址 311121 浙江省杭州市余杭区五常街道文一西路998号19幢603B室

  • 入库时间 2023-06-19 11:19:16

说明书

技术领域

本发明涉及计算机与通信领域,具体涉及一种贷后资金归集行为评分的方法及装置。

背景技术

贷后资金归集是指多人申请多笔贷款,在银行发放贷款后立即贷款资金转入同一或者少量账号内。资金归集现象的背后原因往往有贷款中介包装申请、公司或单位私款公用、亲友间拆借用于投资和行员为完成任务指标的作弊行为。由于这种资金归集金额巨大,欺诈风险与逾期风险很高。正确识别贷后资金聚集,可以很大程度上减少风险损失。

目前针对贷后资金归集的问题处理主要依赖一些规则,通过判断单个账户的交易频率、交易资金、交易关系等信息,设置一些相关的阈值进行筛选。这种筛查往往需要经验丰富的风控人员去识别,效率低下。并且时效性较慢,等到风险账户达到筛选标准时,往往已经伴随着风险的发生。在规则的维度上以人为单位,而不是从团伙中去挖掘目标风险,不能及时地发现其他风险关联人群。

发明内容

针对现有技术存在的问题,本发明的目的在于解决现有技术中针对贷后资金归集用户的判断准确率低、时效性差的技术问题,提供一种贷后资金归集行为评分的方法与装置,能够从高危团伙中筛选高资金归集风险用户,比对单一的个人判断准确率更高。另外从团伙角度中也更容易发现未明显表现出的隐藏风险。所述方法判断准确率高、速度更快,也降低了对经验丰富的风控人员的依赖。

本发明提供一种贷后资金归集行为评分的方法,包括以下步骤:

数据采集与清洗,获取整个系统中所需的数据对象,进行数据清洗;

贷后转账交易筛选与权重计算,对清洗后的数据进行转账交易筛选,根据筛选出的贷后交易结果,对每一笔交易设置权重并计算;

生成团伙,用于发现团伙,并计算出各节点的相关特征,获得团伙维度特征;

团伙评分与个人评分,根据上一步中得到的团伙维度特征进行综合判定;

结果输出,对团伙和个人归集账号进行筛选,完成后对结果进行推送。

进一步,在数据采集与清洗步骤中,所述数据对象包含用户的基础信息数据、贷款数据、转账交易数据;数据进行清洗的方式为只保留系统所需要的字段,并对缺失值和异常数据进行筛选。

进一步,贷后转账交易筛选与权重计算步骤中,所述贷后转账交易筛选进一步包括以下步骤:

a,去除冗余交易,将本人跨行转账数据保留并进行处理,处理方法为将转账次数设为1,转账金额设置为0;

b,去除公共交易账号转账数据,去除转账到大型互联网金融机构或银行机构的转账交易数据;

c,设置交易金额阈值,去除低于交易金额阈值的转账交易数据;

d,筛选转账交易时间,仅保留预设时间内的转账交易数据,保证资金的归集与贷款相关。

进一步,贷后转账交易筛选与权重计算步骤中,设置权重的原则是设置一个0~1之间的衰减值,随着贷款发放时间与转账交易时间差越大,使得转账权重随之减少。

进一步,生成团伙步骤中,使用社区发现算法将处理好的交易数据构归集团伙;通过使用资金聚集度算法计算每个账户的节点资金聚集度,资金聚集度结果值超过聚集度阈值的节点进行标记,构建团伙信息,获取节点维度和团伙维度的相关特征。

进一步,所述节点维度特征包括:该节点入度和出度、金额相关字段、归集度、贷款相关字段、团伙数量;所述团伙维度特征包括:团伙内贷款相关字段、团伙内交易相关字段、团伙内贷后表现相关字段。

进一步,所述团伙评分进一步包括以下步骤:

第一,将各个特征进行标准化,用来统一不同特征之间的数量级;

第二,使用层次分析法为每个字段计算出一个权重,以区分不同字段的重要性,构造完成判断矩阵;使用方根法计算出各个特征的权重;一致性检验通过后,结果即为最终的权重;

第三,根据业务上特征与归集风险之间的相关性,判断特征的正负性;归集资金、转入账号数量等与归集风险呈正相关的特征,设定为正值;交易时间与贷款发放时间差与归集风险呈负相关的特征,设定为负值;各个特征结果乘以上一步中计算的权重后进行求和,得到团伙原始评分;

第四,团伙原始评分结果进行标准化,使最终评分结果在1~0之间;计算方法为结果代入到sigmoid函数中计算,计算公式为

其中,x为团伙原始评分,S为处理后的最终结果;最终分数表示团伙风险的水平高低。

第五,使用第一到第四步中的方法对个人维度特征进行处理,得到个人最终评分。

进一步,权重的计算公式如下:

公式代码:\overline{W_i}=\sqrt[n]{\prod\limits_{j=1}^{n}a_{ij}}

其中aij为判断矩阵中的元素,n为判断矩阵阶数,结果为判断矩阵第i行元素的乘积的n次方根。

结果进行归一化,

公式代码:W_i=\frac{\overline{W_i}}{\sum\limits_{i=1}^{n}\overline{W_i}}。

进一步,所述结果输出步骤中,根据设定的分数阈值先对团伙进行筛选,判断出高危团伙;再对高危团伙中的用户筛选,发现高风险用户。

另一方面,本发明提供一种贷后资金归集行为评分的装置,所述装置包括数据采集与清洗模块、贷后转账交易筛选与权重计算模块、生成团伙模块、团伙评分与个人评分模块、和结果输出模块,所述装置用于实施根据本发明的贷后资金归集行为评分的方法。

本方法从高危团伙中筛选高资金归集风险用户,比对单一的个人判断准确率更高。另外从团伙角度中也更容易发现未明显表现出的隐藏风险。装置部署上线后,可根据已设定的方法自动输出结果,比以往方法中业务人员依据经验判断速度更快。也降低了对经验丰富的风控人员的依赖。所述方法中对各个特征设置权重,并综合分析,特征使用范围更广,信息更全面。

附图说明

图1示出了根据本发明的贷后资金归集行为评分的方法与装置的系统架构图;

图2示出了根据本发明的贷后资金归集行为评分的方法与装置的评分计算流程图。

具体实施方式

下面将结合附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。

根据附图1和2,本发明提供了一种发现贷后资金归集团伙的方法和装置,并且揭示了团伙评分和团伙中个人评分的方法。评分可以用于发现异常团伙并且从异常团伙中挖掘聚集用户作为高风险用户。参阅图1,所述方法包括数据采集与清洗、贷后转账交易筛选与权重计算、生成团伙、团伙评分与个人评分、结果输出。相应地,所述装置包括数据采集与清洗模块、贷后转账交易筛选与权重计算模块、生成团伙模块、团伙评分与个人评分模块、和结果输出模块。

数据采集与清洗装置中获取整个系统中所需的数据对象,包含用户的基础信息数据、贷款数据、转账交易数据等。数据需进行清洗,只保留系统所需要的字段,并对缺失值和异常数据进行筛选。处理完成后数据进入下一模块。

贷后转账交易筛选与权重计算中。第一,去除冗余交易,如本人储蓄卡转账到本人他行储蓄卡时,本人跨行转账可认定为非归集行为,但是为了不影响后续建网转账关系须保留,处理方法为转账次数设为1,并且转账金额设置为0。第二,去除公共交易账号转账数据,如转账到大型互联网金融机构或银行机构,此部分交易一般为信用卡还款、理财、购物等非资金归集类型。第三,可以设置交易金额阈值,如1000元,低于这个阈值的转账交易可以剔除,保留大额转账后期有助于定位异常归集账号。第四,为了保证资金的归集与贷款相关,需筛选转账交易时间,一般筛选发生在贷款发放后的100小时内的交易,时间可根据自身业务情况进行调整。第五,根据筛选出的贷后交易结果对每一笔交易设置权重,原则是随着贷款发放时间与转账交易时间差越大,转账权重随之减少。实施时,可以设置一个0~1之间的衰减值(如0.95)。时间差在1小时以内,权重为0.95^0;时间差在1~2小时,权重为0.95^1;时间差在2~3小时,权重为0.95^2;以此类推,当时间差为第99~100个小时,权重为0.95^100。最后进行业务所需的其他交易筛选。

生成团伙装置用于发现团伙,并计算出各节点(用户)的相关特征,如出度、入度、金额、聚集度等。使用社区发现算法将处理好的交易数据构归集团伙。社区发现(CommunityDetection)算法主要目标是将网络分解成较小的子网络,子网络通常称为社区,每个社区内的节点之间的交互关系比对社区外的节点交互更加紧密。主流的社区发现算法有标签传播算法(Label Propagation)、基于模块度算法(Louvain)、谱聚类算法等。本发明中优选使用基于标签的算法,该算法在初始时,每个节点各自属于不同的社区,具有唯一的社区标签;然后在每一次迭代中,每个节点通过网络将自己的社区标签传播给邻居节点,每个节点在收到邻居节点的社区标签后,挑选社区标签出现频率最高的标签作为自己的新标签,如果最高频率的标签有多个时,则随机选择其中一个;不断的执行该迭代计算,直到每个节点都获取邻居节点标签中出现频率最高的标签,停止迭代。在该算法迭代执行的过程中,网络中关系密集的节点簇因为互为邻居关系会逐渐收敛成同样社区标签,形成一个社区。节点资金聚集度衡量在交易网络中,任意一笔钱在网络中流动,最终流向各个节点的概率。流向概率越大的节点,表示资金在交易的过程中,越容易聚集到该节点。使用PageRank算法,可以计算每个账户的重要性,该重要性指标即为节点的资金聚集度。PageRank(PR),又称网页排名,是最初是对搜索引擎搜索结果中的网页进行排名的一种算法,计算一个用户随机点击一个网站然后不停点击从而到达各个网站的概率。对于某个页面i,其对应PR值大小的计算公式如下:

这里,p1,p2,...,pN是目标页面pi,M(pi)是链入pi页面的集合,L(pj)是页面pj链出页面的数量,而N是集合中所有页面的数量。这里可以将网页的相互链接看成是用户之间的转账关系,网页之间的跳转当做资金的流动,最终资金越容易聚集的节点,其PR值越高。通过构建完成的团伙信息,获取节点维度和团伙维度的相关特征。节点维度特征包括:该节点入度/出度、金额相关字段、归集度、贷款相关字段、团伙数量等。团伙维度特征包括:团伙内贷款相关字段,如贷款金额、贷款金额等;团伙内交易相关字段,如交易时间、交易金额、总交易量等,团伙内贷后表现相关字段,如逾期用户比例、最大的用户资金占比等。

团伙评分装置可根据上一步中得到的团伙维度特征使用如下步骤进行综合判定,如图2所示,评分计算流程包括特征表转化、特征权重计算、特征相关性、sigmoid函数计算和输出分数几个部分,具体地,包括以下五个步骤:

第一,将各个特征进行标准化,用来统一不同特征之间数量级。

第二,使用层次分析法为每个字段计算出一个权重,以区分不同字段的重要性。层次分析法是一种解决多目标的复杂问题的定性与定量相结合的决策分析方法。该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标之间能否实现的标准之间的相对重要程度,并合理地给出每个决策方案的每个标准的权数,利用权数求出各方案的优劣次序,比较有效地应用于那些难以用定量方法解决的问题。使用层次分析法进行计算,首先需要对团伙特征两两比较,根据1~9标度法对比较结果进行打分。1分表示A、B两个特征相比,具有同样重要性。9分表示A、B两个特征相比,A特征比B特征极端重要,此时B特征比A特征得分则为1/9。构造完成判断矩阵。然后使用方根法计算出各个特征的权重,计算公式如下:

公式代码:\overline{W_i}=\sqrt[n]{\prod\limits_{j=1}^{n}a_{ij}}

aij为判断矩阵中的元素,n为判断矩阵阶数,结果为判断矩阵第i行元素的乘积的n次方根。

结果进行归一化,

公式代码:W_i=\frac{\overline{W_i}}{\sum\limits_{i=1}^{n}\overline{W_i}}

一致性检验通过后,结果即为最终的权重。

第三,根据业务上特征与归集风险之间的相关性,判断特征的正负性。例如归集资金、转入账号数量等与归集风险呈正相关的特征,设定为正值。交易时间与贷款发放时间差与归集风险呈负相关的特征,设定为负值。各个特征结果乘以上一步中计算的权重后进行求和,得到团伙原始评分。

第四,团伙原始评分结果进行标准化,使最终评分结果在1~0之间。计算方法为结果代入到sigmoid函数中计算,计算公式为

其中,x为团伙原始评分,S为处理后的最终结果。最终分数越高,团伙风险越大。

第五,使用第一到第四步中的方法对个人维度特征进行处理,得到个人最终评分。

结果输出装置中,对团伙和个人归集账号进行筛选。先对团伙进行筛选,判断出高危团伙。再对高危团伙中的用户筛选,发现高风险用户。筛选时可以直接通过分数排序,取排名靠前的部分数据输出。也可以配合业务上的阈值进行处理。例如,团伙中近三个月有过交易、团伙数量需达到一定规模,贷款账户在团伙中超过一定占比等。完成后对结果进行推送,以便业务部门验证。业务方面筛选阈值和评分筛选阈值可根据上线后的效果随时调整。

本发明中特征的构建根据业务可做定制化开发。团伙发现使用的社区算法如标签传播算法(Label Propagation)、基于模块度算法(Louvain)、谱聚类算法等。资金聚集度可使用PageRank、基尼系数或熵的方法。计算方法并不唯一,可使用其他相关方法完成,优选使用PageRank算法,其具有更优的准确度。

本方法从高危团伙中筛选高资金归集风险用户,比对单一的个人判断准确率更高。另外从团伙角度中也更容易发现未明显表现出的隐藏风险。装置部署上线后,可根据已设定的方法自动输出结果,比以往方法中业务人员依据经验判断速度更快。也降低了对经验丰富的风控人员的依赖。

本发明的方法中前期正确的数据筛选方法为后期建模提供了保障,使用贷后资金交易数据进行自动建模,无需专家经验,输出阈值可人工整定,对各个特征设置权重,并综合分析,特征使用范围更广,信息更全面。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号