公开/公告号CN112528038B
专利类型发明专利
公开/公告日2022-07-05
原文格式PDF
申请/专利权人 交通银行股份有限公司;
申请/专利号CN202011436111.9
申请日2020-12-10
分类号G06F16/36(2019.01);G06F16/35(2019.01);G06F16/33(2019.01);G06Q40/02(2012.01);
代理机构上海科盛知识产权代理有限公司 31225;
代理人孙永申
地址 200120 上海市浦东新区自由贸易试验区银城中路188号
入库时间 2022-08-23 13:58:31
法律状态公告日
法律状态信息
法律状态
2022-07-05
授权
发明专利权授予
技术领域
本发明涉及金融科技技术领域,尤其是涉及一种基于多层图结构担保联通体唯一性识别方法、设备及介质。
背景技术
随着银行业金融机构信贷资产规模的增长,各类担保贷款也随之增加,客户之间通过互相担保或连环担保形成的担保联通体风险不断凸显。由于担保联通体的复杂性、不确定性与传染性,担保联通体信贷风险管理成为商业银行信贷管理中的薄弱环节。针对此起彼伏的担保联通体风险,商业银行需要建立担保联通体风险评价的长效机制,将化解担保联通体贷款风险作为信贷风险管理的重点工程,及时提供风险预警,阻断风险链条传导。
担保联通体风险评价的普遍过程大致分为担保数据分析、关联关系刻画、违约风险评价、担保关系建模以及风险阻断应用。其中,担保数据分析和关联关系刻画的目的是为了识别由企业客户构成的担保联通体,担保联通体样本的唯一性识别也是违约风险评价和担保关系建模的关键基础问题。因此,如何确定风险评价对象,即样本唯一性识别,是担保联通体风险评价建模的基础。
目前普遍采用的担保联通体识别算法包括基于担保矩阵的穷举查找法和基于担保图谱的深度优先遍历法。其中,穷举查找法建立当前时点的担保关系矩阵,依次对担保矩阵中首元素进行遍历查找,每次查找获得的子担保矩阵即为一个封闭的担保联通体。深度优先遍历法基于担保关系图谱进行路径遍历,每个遍历子图中所有节点构成一个担保连通体,直至所有担保联通体均封闭且不交叉。这两类方法存在以下两大痛点:
1、仅适用于静态担保关联关系分析,无法满足动态担保联通体唯一性识别需求。针对固定时点的静态担保关系矩阵或担保关系图谱,穷举查找法和深度优先遍历法能够获取相互独立的担保联通体集合。但对于随时间动态变化的担保关系矩阵或担保关系图谱时序集合,如何基于企业客户间担保关系变化,识别出唯一的担保联通体样本,是这两类方法无法解决的问题。
2、穷举查找法效率较低。穷举查找法在每次生成担保联通体时,均需全局遍历担保关系矩阵,算法复杂度高。面对大量担保关系数据和不断变化的担保关系,基于担保关系矩阵的穷举查找法难以满足应用的实时性要求。
图结构是目前风险管理领域应用广泛的一种非关系型数据结构,基于企业客户担保关系绘制担保图谱,可以直观刻画出担保网络拓扑结构和边界规模,为担保联通体风险的防范和化解提供技术支持。针对随时间不断变化的动态担保图谱,运用图算法快速识别由同一企业客户集合构建的所有担保联通体,并赋予唯一的担保联通体样本标识,有效挖掘担保连通体动态变化趋势。
采用基于担保图谱的深度优先遍历和基于联通体矩阵的穷举查找法相结合是现有的技术方案之一。首先对不同时点的企业客户担保关系分别构建担保图谱,并依次执行深度优先路径遍历,由每个企业客户连通子图生成担保联通体,获取每个时点相互独立的担保联通体集合。其次利用相邻两个时点的担保联通体变化关系构建联通体矩阵,对联通体矩阵中所有首末元素先后进行正向和反向的穷举查找,为相互关联的联通体赋予相同的唯一标识。
担保图谱与联通体矩阵相结合的方法虽然能够解决动态担保联通体的唯一性识别问题,但对于大数据量企业客户该方法效率非常低。对担保联通体矩阵每个首末元素分别进行正反向共两轮穷举查找,每次穷举查找都需要全局遍历联通体矩阵,而实践中银行大型担保网络规模可至上万个节点,该方法的时间复杂度无法支持。担保联通体唯一性识别是风险评价模型训练和预测的基础工作,其效率将会直接影响担保联通体风险评价模型应用的响应速度。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于多层图结构担保联通体唯一性识别方法、设备及介质。
本发明的目的可以通过以下技术方案来实现:
一种基于多层图结构担保联通体唯一性识别方法,该方法包括以下步骤:
步骤1:针对银行数据,基于单一时点的企业客户间担保关系,建立静态担保关系图谱,获取每个时点相互独立的担保联通体集合;
步骤2:针对每个时点相互独立的担保联通体集合中的联通体担保关系边打标签并进行数量统计;
步骤3:基于所有的标签以及数量统计数据进一步对担保联通体集合中的担保联通体变化趋势进行识别分类;
步骤4:以每个时点相互独立的担保联通体集合作为图节点,依据对担保联通体集合中的担保联通体变化趋势进行识别分类的结果构建联通体变化图谱,并最终生成以每个时点相互独立的担保联通体集合作为新节点的第二层联通体以及对应的动态担保联通体的唯一性识别号以识别银行数据。
进一步地,所述的步骤1包括以下分步骤:
步骤101:针对银行数据以行内企业客户作为节点,以客户间担保关系作为连接边,对行内企业客户间担保关系构建静态担保图谱;
步骤102:对各时点静态担保图谱分别执行深度优先路径遍历,保证各时点静态担保联通体两两之间无节点重叠,获取每个时点相互独立的担保联通体集合;
步骤103:针对每个时点相互独立的担保联通体集合分别进行联通体编号。
进一步地,所述的步骤2包括以下分步骤:
步骤201:针对每个时点相互独立的担保联通体集合,比较相邻时点担保联通体内企业客户,对联通体担保关系边打标签;
步骤202:对各时点担保联通体内担保关系边数量进行统计。
进一步地,所述的步骤3具体包括:根据相邻时点的联通体边标签值、联通体数量、联通体内边数及新增边占比统计分析,对联通体变化类型进行加工识别分类。
进一步地,所述的识别分类的变化类型包括:
完全相同联通体,即联通体内边相同、数量相等;
联通体缩小,即联通体内边相同、数量减少且联通体数量不变;
一拆多,即联通体内边相同、数量减少且联通体数量增多;
多合一,即联通体内边新增、点相同且联通体数量减少;
特殊变化,即联通体内边有新增也有消失;
全新联通体,即联通体内边全为新增。
进一步地,所述的步骤2中的标签包括:
边标签FLAG_PRE,用于表明上期与本期的边状态变化;
边标签FLAG_AFT,用于表明本期与下期的边状态变化;
边标签ORI_CC_ID,用于表明边在上期对应的担保联通体编号。
进一步地,所述的步骤2中的数量统计所包含的统计量包括本期边总数和本期新增边占比数。
进一步地,所述的步骤4包括以下分步骤:
步骤401:以各时点的担保联通体作为图节点,依据担保联通体变化类别,对相邻时点属于相同、缩小、一拆多、多合一共四类变化的担保联通体对建立关联边,构建第二层担保联通体变化图谱;
步骤402:对第二层担保联通体变化图谱再次执行深度优先路径遍历,生成的第二层联通体两两之间无节点重叠,且第二层联通体内节点是相互存在变化关联的第一层联通体;
步骤403:对第二层联通体赋予唯一标识,规则即取其中第一层联通体编号的最小值,作为动态担保联通体的唯一性识别号以识别银行数据。
本发明还提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的一种基于多层图结构担保联通体唯一性识别方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种基于多层图结构担保联通体唯一性识别方法的步骤。
与现有技术相比,本发明具有以下优点:
(1)现有担保联通体唯一性识别算法基于担保矩阵进行查找,或者基于担保图谱进行一次深度优先遍历,算法效率低下且无法满足动态担保关系分析需求。本发明基于企业客户间担保关系构建多层图谱结构,对担保联通体样本进行统计分析和变化分类,实现动态担保联通体的唯一性识别,相对于传统算法效率提升近两倍,为担保联通体风险评价工作奠定基础。
(2)本发明技术方案基于企业客户间动态关系构建多层图谱,完成担保联通体的唯一性识别,不仅提升了担保联通体识别效率,还提供了动态担保联通体唯一性识别问题的解决方案,满足随时间不断变化的担保数据分析需求。
(3)传统担保联通体唯一性识别通常采用基于担保图谱的深度优先遍历和基于担保矩阵的穷举查找方法,存在效率低下、无法满足动态担保关系分析需求等问题。为了解决这些问题,本发明提供了一种基于多层图结构的担保联通体唯一性识别方法,在提高联通体识别效率、优化风险评级模型应用响应速度、满足动态担保关系分析需求的同时,还能依靠图数据库的技术特性挖掘担保网络中的图形化特征,为担保联通体风险评价建模提供有效特征变量。
附图说明
图1为本发明实施例中的方法流程图;
图2为本发明实施例中基于静态担保图谱的联通体识别步骤示意图,其中,图2(a)为各时点担保关系数据步骤示意图,图2(b)为静态担保图谱集步骤示意图,图2(c)为各时点联通体集合步骤示意图,图2(d)为静态担保联通体编号步骤示意图;
图3为本发明实施例中基于动态担保关系的联通体样本分析步骤示意图;
图4为本发明实施例中担保联通体变化类别图示示意图;
图5为本发明实施例中联通体类别变化类别加工规则示意图;
图6为本发明实施例中基于联通体变化图谱的唯一性识别步骤示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
一、本发明技术方案中的缩略语和关键术语定义如下:
担保联通体:又称“担保圈”,是指两个或两个以上法人客户以质押、抵押及保证等担保关系为纽带而形成的网络结构,是一种多家企业通过互相担保或连环担保而产生的特殊利益体。其所表现的“一荣俱荣、一损俱损”的特性,在经济下行期担保联通体内企业风险激增,不仅影响担保联通体内经营较好的企业发展,也严重威胁商业银行的资产安全,甚至形成区域性金融风险。
二、本发明具体技术方案如下:
基于多层图结构的担保联通体唯一性识别方法包含以下四个主要步骤:
1、基于静态担保图谱的联通体识别:
基于单一时点的企业客户间担保关系,建立静态担保关系图谱。采用基于担保图谱的深度优先路径遍历方法,获取每个时点相互独立的担保联通体集合。
2、基于动态担保关系的联通体样本分析:
分析相邻时点的担保联通体样本,识别前一时点及当前时点联通体样本中企业客户的担保关系变化,包括上期已存在、本期新增和本期消亡等特征。
3、基于规则的担保联通体变化趋势分析:
对担保联通体变化趋势进行分类,包括完全相同联通体、联通体缩小、一拆多、多合一、联通体特殊变化、全新联通体共计六类。依据相邻时点的联通体样本内担保关系变化特征,基于规则分析相邻时点的担保联通体变化类型。
4、基于联通体变化图谱的唯一性识别:
以每个时点的担保联通体作为图节点,以相邻时点的担保联通体变化类型作为图关联边,构建第二层担保联通体变化图谱,对第二层图结构再次运用深度优先遍历图算法,获取具有相同识别号的联通体集合,进而生成动态担保图谱的联通体唯一识别号。
三、具体实施例
如图1所示为本发明方法整体流程示意图,展示了识别流程主要步骤及其依赖关系,以及各步骤能提供的主要功能间调用关系。
行内企业客户间担保关系数据经数据清洗、统计分析等预处理步骤后输入,识别流程所有步骤建立在静态担保图谱的联通体识别基础上,对其输出的静态担保联通体集合做进一步挖掘分析。
基于多层图结构的担保联通体唯一性识别方法执行流程如下:
1、基于静态担保图谱的联通体识别:
1.1、以行内企业客户作为节点,以客户间担保关系作为连接边,对行内企业客户间担保关系构建静态担保图谱,如图2/(a)~图2/(b)所示;
1.2、对各时点静态担保图谱分别执行深度优先路径遍历,保证各时点静态担保联通体两两之间无节点重叠,如图2/(c)所示;
1.3、针对上步获取的各时点静态担保联通体集合,分别进行联通体编号,编号规则采用时点+序号,如图2/(d)所示。
2、基于动态担保关系的联通体样本分析,如图3所示:
2.1、比较相邻时点担保联通体内企业客户,对联通体担保关系边打标签:其中边标签FLAG_PRE表明上期与本期的边状态变化;边标签FLAG_AFT表明本期与下期的边状态变化;边标签ORI_CC_ID表明边在上期对应的担保联通体编号,如图3所示;
2.2、对各时点担保联通体内担保关系边数量进行统计,包括本期边总数、本期新增边占比数。
3、基于规则的担保联通体变化趋势分析:
3.1、对担保联通体形态变化进行分类,相邻时点形态相比共分为6种变化类型,如下表以及图4所示;
3.2、根据相邻时点的联通体边标签值、联通体数量、联通体内边数及新增边占比统计分析,对联通体变化类型进行加工,加工规则如图5所示。
4、基于联通体变化图谱的唯一性识别:
4.1、以各时点的担保联通体作为图节点,依据担保联通体变化类别,对相邻时点属于相同、缩小、一拆多、多合一共四类变化的担保联通体对建立关联边,构建第二层担保联通体变化图谱;
4.2、对第二层担保联通体变化图谱再次执行深度优先路径遍历,生成的第二层联通体两两之间无节点重叠,且第二层联通体内节点是相互存在变化关联的第一层联通体,如图6所示;
4.3、对第二层联通体赋予唯一标识,规则即取其中第一层联通体编号的最小值,作为动态担保联通体的唯一性识别号。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。