首页> 中国专利> 一种信用风险压力测试模型的训练方法、装置及设备

一种信用风险压力测试模型的训练方法、装置及设备

摘要

本说明书实施例提供一种可用于大数据技术领域的信用风险压力测试模型的训练方法、装置及设备。所述方法包括确定压力指标和承压指标;其中,压力指标表示影响信用风险的因素,承压指标表示受压力指标影响的因素;根据压力指标和承压指标,获取指标数据集;其中,每条指标数据包括压力指标数据和承压指标数据;将指标数据集划分为训练集和测试集;基于训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练,获得信用风险压力测试模型;其中,在训练过程中,利用测试集对训练获得的模型进行验证,当训练集对应的误差与测试集对应的误差满足预设条件时停止训练。利用本说明书实施例可以有效提高信用风险压力测试的准确度。

著录项

  • 公开/公告号CN112766814A

    专利类型发明专利

  • 公开/公告日2021-05-07

    原文格式PDF

  • 申请/专利权人 中国工商银行股份有限公司;

    申请/专利号CN202110160918.2

  • 发明设计人 方成;朱佳宁;金焰;丁允文;

    申请日2021-02-05

  • 分类号G06Q10/06(20120101);G06Q40/02(20120101);G06N3/08(20060101);

  • 代理机构11127 北京三友知识产权代理有限公司;

  • 代理人任默闻;孙乳笋

  • 地址 100140 北京市西城区复兴门内大街55号

  • 入库时间 2023-06-19 10:54:12

说明书

技术领域

本申请涉及大数据领域,特别涉及一种信用风险压力测试模型的训练方法、装置及设备。

背景技术

随着科技的快速发展,银行在经营过程中会面临各类风险,如信用风险、市场风险、流动性风险、操作风险、法律风险等,但各种风险对银行的影响并不相同。由于信贷资产占银行总资产的50%,所以信用风险是各种风险中对银行运作影响较大的风险,也是金融机构和监管部门风险管理的主要对象和核心内容。因此,对信用风险进行压力测试对规避未来可能发生的风险变得越来越重要。

现有技术中,对信用风险进行压力测试主要是专家根据历史经验设定信用风险压力测试模型的参数,然后将各类风险参数输入信用风险压力测试模型进行测试。这种方式不仅容易受人为主观因素影响,具有一定的主观局限性,而且所能获得的参考信息更是有限,从而使得信用风险压力测试结果不准确。

因此,业内亟需一种可以解决上述技术问题的技术方案。

发明内容

本说明书实施例提供了一种信用风险压力测试模型的训练方法、装置及设备,可以有效提高信用风险压力测试的准确度。

本说明书提供的一种信用风险压力测试模型的训练方法、装置及设备是包括以下方式实现的。

一种信用风险压力测试模型的训练方法,包括:确定压力指标和承压指标;其中,所述压力指标表示影响信用风险的因素,所述承压指标表示受压力指标影响的因素;根据所述压力指标和所述承压指标,获取指标数据集;其中,所述指标数据集中每条指标数据包括与所述压力指标对应的数据和与所述承压指标对应的数据;将所述指标数据集划分为训练集和测试集;基于所述训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练,获得信用风险压力测试模型;其中,在训练过程中,利用所述测试集对训练获得的模型进行验证,当训练集对应的误差与测试集对应的误差满足预设条件时停止训练。

一种信用风险压力测试模型的训练装置,包括:确定模块,用于确定压力指标和承压指标;其中,所述压力指标表示影响信用风险的因素,所述承压指标表示受压力指标影响的因素;获取模块,用于根据所述压力指标和所述承压指标,获取指标数据集;其中,所述指标数据集中每条指标数据包括与所述压力指标对应的数据和与所述承压指标对应的数据;划分模块,用于将所述指标数据集划分为训练集和测试集;训练模块,用于基于所述训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练,获得信用风险压力测试模型;其中,在训练过程中,利用所述测试集对训练获得的模型进行验证,当训练集对应的误差与测试集对应的误差满足预设条件时停止训练。

一种信用风险压力测试模型的训练设备,包括至少一个处理器以及存储计算机可执行指令的存储器,所述处理器执行所述指令时实现本说明书实施例中任意一个方法实施例方法的步骤。

一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现本说明书实施例中任意一个方法实施例的步骤。

本说明书提供的一种信用风险压力测试模型的训练方法、装置及设备。一些实施例中可以确定压力指标和承压指标,根据压力指标和承压指标,获取指标数据集;进一步,可以将指标数据集划分为训练集和测试集,基于训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练,获得信用风险压力测试模型;其中,在训练过程中,利用测试集对训练获得的模型进行验证,当训练集对应的误差与测试集对应的误差满足预设条件时停止训练,压力指标表示影响信用风险的因素,承压指标表示受压力指标影响的因素,指标数据集中每条指标数据包括与压力指标对应的数据和与承压指标对应的数据。采用本说明书提供的实施方案,可以有效提高信用风险压力测试的准确度。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,并不构成对本说明书的限定。在附图中:

图1是本说明书提供的一种信用风险压力测试模型的训练方法的一个实施例的流程示意图;

图2是本说明书提供一种预设神经网络模型的结构示意图;

图3是本说明书提供的一种信用风险压力测试模型的训练装置的一个实施例的模块结构示意图;

图4是本说明书提供的一种信用风险压力测试模型的训练服务器的一个实施例的硬件结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书中的一部分实施例,而不是全部的实施例。基于本说明书中的一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书实施例保护的范围。

下面以一个具体的应用场景为例对本说明书实施方案进行说明。具体的,图1是本说明书提供的一种信用风险压力测试模型的训练方法的一个实施例的流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。

本说明书提供的一种实施方案可以应用到客户端、服务器等中。所述客户端可以包括终端设备,如智能手机、平板电脑等。所述服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式系统的服务器结构等。

需要说明的是,下述实施例描述并不对基于本说明书的其他可扩展到的应用场景中的技术方案构成限制。具体的一种实施例如图1所示,本说明书提供的一种信用风险压力测试模型的训练方法的一种实施例中,所述方法可以包括以下步骤。

S0:确定压力指标和承压指标;其中,所述压力指标表示影响信用风险的因素,所述承压指标表示受压力指标影响的因素。

本说明书实施例中,压力指标可以称为压力情境变量、解释变量等,其可以表示影响信用风险的因素。承压指标也可以称为承压变量、被解释变量,其可以表示受压力指标影响的因素。承压变量是压力测试所研究的压力最终要影响的变量,也是信用风险压力测试模型的被解释变量。通常信用风险状况可以通过承压变量体现。一些场景中,压力指标可以理解为模型的自变量,承压指标可以理解为模型的因变量。

一些实施例中,压力指标可以包括宏观经济指标和企业财务指标。其中,宏观经济指标可以包括以下至少之一:GDP产出缺口、有效汇率、实际广义货币供应量、一年期货款名义利率、消费物价指数;所述企业财务指标包括以下至少之一:资产负债率、总负债与销售收入的比值、现金与总负债的比值、流动比率、速动比率、现金比率、已获利息倍数、利息保障倍数、有形资产负债率、有形净值负债率、产权比率、息税前利润与总资产的比值、利息与利息和息税前利润之和的比值、存贷与销售收入的比值、营运资本与总资产的比值、销售收入与总资产的比值、净利润与所有者权益的比值、净利润与总资产的比值、流动资产与总资产的比值、留存收益、总资产。承压指标可以包括以下至少之一:违约率、不良贷款率、回收率、贷款损失准备、资本充足率、利润总额。

一些实施例中,可以根据与信用风险相关的压力数据,确定压力指标;基于信用风险的传导机制,确定承压指标。

一些实施场景中,可以对历史发生的与银行信用风险相关的压力事件进行分析,得到与信用风险相关的压力数据。其中,与信用风险相关的压力数据可以理解为是信用风险的压力来源。一些实施场景中,信用风险压力来源可以分为经济、自然灾害、政治及社会、管理政策变化、行业变化、企业内部因素六类。当然,上述信用风险压力来源只是进行示例性说明,本说明书实施例不限于上述举例,所属领域技术人员在本申请技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本申请相同或相似,均应涵盖于本申请保护范围内。

一些实施场景中,在得到与信用风险相关的压力数据后,可以从与信用风险相关的压力数据中筛选出能够表示影响信用风险的压力指标。例如一些实施场景中,在得到与信用风险相关的压力数据后,可以将与信用风险相关的压力数据中难以量化的压力数据剔除,获得易于量化的压力数据,然后从易于量化的压力数据中筛选出能够表示影响信用风险的压力指标。由于自然灾害、政治及社会等压力来源包含的范围太广,例如自然灾害包括火山、地震、台风、洪水、厄尔尼诺等,难以用几个指标来描述其状况,本说明书实施例中,将自然灾害、政治及社会、管理政策变化、行业变化确定为难以量化的压力来源。相应的,由于经济因素、企业内部因素有常用的宏观经济学指标、财务指标可以表示,所以将其确定为易于量化的压力来源。

当然,上述只是进行示例性说明,易于量化的压力来源还可以包括其他,本说明书实施例不限于上述举例,所属领域技术人员在本申请技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本申请相同或相似,均应涵盖于本申请保护范围内。

一些实施场景中,获得易于量化的压力数据后,可以将易于量化的压力数据划分为宏观经济因素和企业内部因素两类,然后分别从中选择能够表示影响信用风险的压力指标。

一些实施场景中,结合银行贷款业务性质,可以从属于宏观经济因素的压力数据中选取以下五种宏观经济变量作为压力指标,如表1所示。

表1压力指标-宏观经济因素

其中,上述实际广义货币供应量数据的计算方法为:以1990年物价指数为100,将名义广义货币供应量除以历年物价指数,从而计算出消除了价格变动影响的实际广义货币供应量。

一些实施场景中,综合考虑国内外在信用风险研究中提及的企业财务指标、对信用影响较大且能够在现有贷款企业的数据库中获得数据的企业财务指标,可以从属于企业内部因素的压力数据中选取以下21种企业财务指标作为压力指标。如表2所示。其中,选取的21种企业财务指标可以划分为偿债能力比率和其他比率。

表2压力指标-企业内部因素

当然,上述只是进行示例性说明,从宏观经济因素和企业内部因素对应的压力数据中选择能够表示影响信用风险的压力指标还可以包括其他指标,本说明书实施例不限于上述举例,所属领域技术人员在本申请技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本申请相同或相似,均应涵盖于本申请保护范围内。

由于压力情境变量所产生的压力通过传导,最终使承压变量发生改变,因此,可以认为压力情境变量为因,承压变量为果。一些实施场景中,借鉴货币政策的传导问题,银行的信用风险也有其传导机制,首先是外部宏观经济的压力来源,接着影响到贷款企业经营状况或个人财务状况,导致其还款能力发生变化,最终导致银行不良贷款增加,进而影响银行资本金、盈利状况等。因此,可以选择以下六个指标作为银行信用风险的承压变量:

(1)违约率(Default Rates)

违约的定义为:不可能全额偿还,或是逾期达90天以上。违约率可根据历史贷款偿还状况统计得到,其是信用风险压力最直接影响的变量。通常,违约率的计算方法可以包括违约企业户数法、违约贷款笔数法和违约贷款金额法等。其中,违约企业户数法可以反映贷款违约企业数量比重,违约贷款笔数可以反映贷款违约次数比重(违约频率),违约贷款金额法可以反映违约贷款金额比重。由于每笔贷款的金额可能相差巨大(例如A企业贷款5笔,金额均为10万,B企业贷款1笔,金额为1亿),因此不同金额的贷款发生违约对银行产生的影响也不同。若采用违约企业户数法或违约贷款笔数法计算违约率可能无法充分反映银行面临的信用风险大小。因此,一些实施场景中,可以选择违约贷款金额法来计算违约率P

其中,P

(2)不良贷款率(Non-Performing Loan Ratio)

根据贷款五级分类标准,银行贷款按照风险程度可划分为五类:正常、关注、次级、可疑、损失,其中,次级、可疑、损失为不良贷款。不良贷款率可以理解为金融机构不良贷款占总贷款余额的比重。由于信用风险的加大会使不良贷款率提高,因此,不良贷款率是关系到银行资产质量的核心指标,其具体计算公式如下:

其中,P

(3)回收率(Recovery Rates)

贷款回收率是针对违约贷款而言的,指一定时期内贷款收回额占贷款发放额或累计额的比例,信用风险增大会导致贷款回收率降低。当贷款发生违约,可以计算违约率的数值,但一笔贷款发生违约并不代表这笔贷款就全部损失了,银行会通过加大催收力度、处置抵押品等措施逐步回收贷款,最大程度降低损失。回收率的计算公式如下:

其中,P

(4)贷款损失准备(Loan Loss Provision)

贷款损失准备是银行为了防止将要发生的不良贷款,根据贷款的预期损失,按照一定比例计提的专项准备金,贷款损失准备可以分为一般准备、专项准备和特种准备。通常,一些实施场景中,银行需按不低于年末全部贷款余额的1%计提一般准备,按关注类贷款的2%、次级类贷款的25%、可疑类贷款的50%、损失类贷款的100%计提专项准备。其中,特种准备是银行针对某一国家、地区、行业或某一类贷款风险计提的准备,其计提比例由银行自行确定。特种准备不是银行经常提取的准备金,只有遇到特殊情况银行才计提特种准备。根据贷款损失的计提方法可知,压力会通过影响贷款的风险情况,进而改变银行资产质量的方式传导,对贷款损失专项准备产生影响。贷款损失准备的计算公式如下:

其中,AMT

(5)资本充足率(Capital Adequacy Ratio)

银行的资本主要为自身所拥有的资金,资本充足率是银行的资本总额对其风险加权资产的比率。充足的资本有利于银行在出现风险损失时进行弥补,故资本充足率状况可以反映银行资产的风险状况和抵御各类风险的能力。银行资本的重要用途之一是用于贷款损失准备,当信用风险导致贷款发生不良时,损失准备用于冲销不良贷款,则银行的资本净额减少,资本充足率下降。信用风险压力通过影响贷款损失准备进而影响资本充足率,具体的,资本充足率的计算公式如下:

其中,为CAR资本充足率,AMT

(6)利润总额(Total Profit)

流动性、安全性和赢利性是商业银行经营管理的基本目标。利润是银行经营成果的体现,也是银行存在的基础和发展的动力,国内银行的利润构成主要是:营业收入(主要为利息收入)、投资收益等减去营业成本(主要为利息支出)、营业费用、贷款损失准备、所得税等。在受到信用风险相关压力时,银行不良贷款增加,引起贷款损失准备增加,进而利润减少。银行的利润总额一般可在其财务报表中直接获取到,计算公式如下:

AMT

其中,AMT

本说明书实施例,通过对历史发生的与银行信用风险相关的压力事件进行分析、选择、量化,以及基于银行信用风险的传导机制,得到表示影响信用风险的压力指标和受压力指标影响的承压指标,不仅可以为后续模型训练提供更准确的数据来源,而且可以有效保障后续对信用风险压力测试的准确度。

S2:根据所述压力指标和所述承压指标,获取指标数据集;其中,所述指标数据集中每条指标数据包括与所述压力指标对应的数据和与所述承压指标对应的数据。

本说明书实施例中,在确定压力指标和承压指标后,可以根据压力指标和承压指标,获取指标数据集。其中,指标数据集中包括指标数据,可以用于后续训练模型。

一些实施例中,所述根据所述压力指标和所述承压指标,获取指标数据集,可以包括:获取数据表;其中,所述数据表可以包括宏观经济数据表、企业财务报表、贷款记录表;根据所述压力指标从所述宏观经济数据表、所述企业财务报表中提取对应数据,获得压力指标数据;根据所述承压指标从所述贷款记录表中提取对应数据,获得承压指标数据;将所述压力指标数据和所述承压指标数据进行关联,获得指标数据集。

一些实施场景中,可以从中国人民银行数据库中获取与银行贷款相关数据表,如贷款记录表。一些实施场景中,可以从各银行公开发布的财务信息中获取宏观经济数据表、企业财务报表。其中,各个数据表中数据的时间跨度应覆盖经济低迷期,如亚洲金融危机,以确保数据选择具有一定代表性意义。

由于获取的数据表中包括的数据指标范围通常比所需的压力指标及承压指标范围大得多,一些实施场景中,在获取数据表后,可以根据压力指标从宏观经济数据表、企业财务报表中提取对应数据,获得压力指标数据,根据承压指标从贷款记录表中提取对应数据,获得承压指标数据。这样,通过去掉不需要的指标数据,保留所需指标对应的数据,可以提高模型训练的准确度。

一些实施场景中,由于获取的压力指标数据和承压指标数据涉及多个数据表,不同数据表中数据会存在对应关系,例如,贷款记录表中数据和企业财务指标表中数据可能存在关联、贷款记录表中数据和宏观经济数据表中数据可能存在关联,所以为了使指标数据集中包括相对完善的指标数据,可以将从不同数据表获得的数据进行关联,从而使分散在不同数据表但存在关联的数据存储到一张数据表中,此时可以将该数据表中数据作为对应的指标数据集。其中,指标数据集中每一行可以表示一条记录,每条记录可以包括对应的压力指标数据和承压指标数据,还可以包括其他基本属性等。

一些实施例中,获得的指标数据集中每一条输入数据对应一条输出数据,其中,输入数据可以包括上述26个压力指标,即26个维度,输出数据可以包括上述6个承压指标,即6个维度。当然,上述只是进行示例性说明,指标数据集中的输入数据和输出数据中还可以包括其他数量的指标,本说明书实施例不限于上述举例,所属领域技术人员在本申请技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本申请相同或相似,均应涵盖于本申请保护范围内。

S4:将所述指标数据集划分为训练集和测试集。

本说明书实施例中,在获取指标数据集后,可以将指标数据集划分为训练集和测试集,以便后续进行模型训练和验证。

一些实施例中,所述将所述指标数据集划分为训练集和测试集前,可以利用热卡填补法对所述指标数据集中缺失数据进行填充,获得第一指标数据集;利用回归测试模型删除所述第一指标数据集中异常数据,获得第二指标数据集;相应的,将所述第二指标数据集划分为训练集和测试集。

由于获取的指标数据集中可能会存在重复、差错、格式错误、不规范等异常数据,一些实施场景中,将指标数据集划分为训练集和测试集前,可以对指标数据集中数据进行预处理。其中,预处理可以包括缺失值补全、异常值处理等。

一些实施场景中,针对缺失数据,可以采用热卡填补法在预设数据库中找到一个与其相似的对象,然后用这个相似对象的值来进行填充。其中,不同的问题可能会选用不同的标准来对相似进行判定。例如一些实施场景中,可以通过相似矩阵确定哪个变量(如变量Y)与缺失值(如变量X)所在变量最相关,然后把所有变量按照变量Y的取值大小进行排序,那么变量X的缺失值就可以用排在缺失值前的那个个案数据进行代替。当然,上述只是进行示例性说明,缺失值补全的方式还可以包括其他,本说明书实施例不限于上述举例,所属领域技术人员在本申请技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本申请相同或相似,均应涵盖于本申请保护范围内。

一些实施场景中,针对异常值,可以通过回归测试模型,针对远离预测值的异常数据,进行数据清理。当然,上述只是进行示例性说明,异常值处理的方式还可以包括其他,本说明书实施例不限于上述举例,所属领域技术人员在本申请技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本申请相同或相似,均应涵盖于本申请保护范围内。

本说明书实施例中,通过引入热卡填补法和回归测试算法进行数据清洗,剔除无效和异常数据,保留规范准确数据,可为后续模型训练提供更可靠、更准确的数据,从而提高预测准确度。

一些实施场景中,在对指标数据集中数据进行预处理后,可以将所述指标数据集划分为训练集和测试集。其中训练集可以用于训练模型,训练集可以用于对训练获得的模型进行验证。例如一些实施场景中,可以将指标数据集中的大部分数据(如70%)作为训练集用于训练模型,包括计算梯度、更新连接权和阈值,剩余数据作为测试集,用来估计误差。当然,对指标数据集的划分可以根据实际场景进行设定,本说明书对此不作限定。

S6:基于所述训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练,获得信用风险压力测试模型;其中,在训练过程中,利用所述测试集对训练获得的模型进行验证,当训练集对应的误差与测试集对应的误差满足预设条件时停止训练。

本说明书实施例中,在将指标数据集划分为训练集和测试集后,可以基于训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练。

一些实施例中,所述基于所述训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练,获得信用风险压力测试模型,包括:构建预设神经网络模型;其中,所述预设神经网络模型包括输入层、隐藏层和输出层,所述输入层中神经元的数量根据所述压力指标的数量确定,所述输出层中神经元的数量根据承压指标的数量确定;利用所述训练集中的指标数据对所述预设神经网络模型进行训练,获得第一测试模型和第一误差集;其中,训练过程中,基于所述随机梯度下降算法和所述模拟退火算法更新所述预设神经网络模型的参数;利用所述测试集中的指标数据对所述第一测试模型进行验证,获得第二误差集;判断所述第一误差集和所述第二误差集是否满足预设条件;确定不满足时,基于所述随机梯度下降算法和所述模拟退火算法更新所述第一测试模型的参数,获得第二测试模型;利用所述训练集中的指标数据对所述第二测试模型进行训练,获得第三测试模型和第三误差集;其中,训练过程中,基于所述随机梯度下降算法和所述模拟退火算法更新所述第二测试模型的参数;利用所述测试集中的指标数据对所述第三测试模型进行验证,获得第四误差集;判断所述第三误差集和所述第四误差集是否满足预设条件;确定满足时,将所述第三测试模型作为信用风险压力测试模型。

一些实施场景中,预设神经网络模型可以是BP(Back Propagation)神经网络。BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络。当然,预设神经网络模型还可以是其他神经网络,所属领域技术人员在本申请技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本申请相同或相似,均应涵盖于本申请保护范围内。

一些实施场景中,预设条件可以为训练集误差呈下降趋势,验证集误差呈上升趋势。例如一些实施场景中,当训练集误差降低,测试集误差升高时,可以表示满足预设条件,则停止训练。当然预设条件还可以是其他情况,例如,训练集误差降低到一定阈值时,停止训练,所属领域技术人员在本申请技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本申请相同或相似,均应涵盖于本申请保护范围内。需要说明的是,上述预设条件可以称为“早停”策略。

一些实施场景中,所述基于所述随机梯度下降算法和所述模拟退火算法更新所述预设神经网络模型或所述第一测试模型或所述第二测试模型的参数,可以包括:获取第K次迭代过程中的初始参数;根据下述公式对第K次迭代过程中的初始参数进行更新,获得第K次迭代后的更新参数:

v′

θ=2×random(0,1)

其中,v′

基于第K次迭代过程对应的误差和第K-1次迭代过程对应的误差,按照下述公式确定第K+1次迭代过程中的初始参数:

v

T←λ·T

其中,v

本说明书实施例中,通过引入随机梯度算法和模拟退火算法,可以有效解决传统BP神经网络易陷入局部最优和收敛速度慢的缺陷,通过引入“早停”策略,可以防止BP神经网络过度拟合,使模型的参数更加准确,从而减少信用风险测试时的人为主观经验判断,减少人为因素导致的漏报、误报影响。

下面结合一个具体实施例对上述训练过程进行说明,然而,值得注意的是,该具体实施例仅是为了更好地说明本申请,并不构成对本申请的不当限定。如图2所示,图2是本说明书提供一种预设神经网络模型的结构示意图。其中,预设神经网络模型包括输入层、隐藏层(隐层)和输出层。

本实施例中,输入层中神经元的个数为26,输出层中神经元的个数为6,隐层神经元的个数可通过“试错法”调整。本实施例中,输入层第i个神经元的值可以记为x

则隐层第h个神经元的输入值α

b

输出层第j个神经元的输入值β

y

本实施例中,在构建预设神经网络模型后,可以利用训练集中的指标数据对预设神经网络模型进行训练。

具体的,给定训练集D={(x

其中,(x

由于传统BP神经网络模型基于梯度下降算法,在每次迭代中,都计算误差函数在当前点的梯度,然后根据梯度确定搜索方向,容易使迭代结果陷入局部最优。为避免训练结果陷入局部最优,本实施例,在训练过程中,通过引入随机梯度下降算法和模拟退火算法来更新模型的参数。

具体的,针对引入的随机梯度下降算法,在每一轮迭代中更新参数v时加入随机因素,即任意参数v的更新公式为:

v←v+θ·Δv

θ=2×random(0,1)

其中,v表示模型中的参数,如连接权重、阈值等,Δv表示参数变化量,θ表示随机数。

进一步,针对引入的模拟退火算法,在每一轮迭代中以一定的概率接受比当前解更差的结果,并且接受“次优解”的概率随着迭代次数的增加而逐渐降低。其中,每一轮迭代中,接受新参数的概率P为:

T←λ·T

其中,E

本实施例中,为使模型误差E

w

θ

v

γ

Δw

Δθ

Δv

Δγ

其中,g

本说明书实施例中,只需一个包含足够多神经元的隐层,就可以以任意精度逼近任意复杂度的连续函数。正是由于其强大的表达能力,BP神经网络容易遭遇过拟合,其训练误差持续降低,但测试误差却可能上升。本说明书实施例中,可以将指标数据集中大部分数据(例如源数据库的70%)作为训练集来训练模型,将剩余数据作为测试集来估计误差,若训练集误差降低但测试集误差升高,则停止训练,将停止训练时对应的参数作为最终信用风险压力测试模型的参数。

一些实施例中,在获得信用风险压力测试模型后,还可以获取不同压力情景中的压力指标数据;其中,所述不同压力情景是预先基于历史情境分析法和假设情境分析法设计的;将所述压力指标数据输入所述信用风险压力测试模型,获得不同压力情景对应的承压指标数据;基于所述承压指标数据进行风险控制。

一些实施场景中,可以综合运用历史情境分析法和假设情境分析法,采用混合法来确定压力情境,即在分析和囊括历史情境的基础上,结合对将来更加严峻情境的假设进行压力情境设计。

一些实施场景中,设计的压力情境可以分为轻度、中度和重度三种情况。需要说明的是,压力情境的设定以期末数据为基准,轻度压力指标可以是通过在期末和平均指标的基础上轻度加压确定;中度压力指标可以是考察十年间外部宏观经济变量以及企业财务数据的下行变化情况,以一年内最大变化幅度为依据确定,相当于十年一遇的压力情境;重度压力可以是考虑了以前从未出现但有可能出现的严重经济衰退情况,以中度压力指标的1.5倍确定。其中,期末数据指会计期末,例如月末、年末。轻度加压指的是指标比期末指标或平均指标略差,例如略差5%。下行变化情况指恶化情况。以前从未出现但有可能出现的严重经济衰退情况可以包括战乱加重疫情导致经济下滑等。

一些实施场景中,在设计好压力情境后,可以利用建立的信用风险压力测试模型,测试出在轻度压力、中度压力、重度压力下银行的违约率、不良贷款率、回收率、资本充足率、贷款损失准备以及利润总额。进一步,银行业务人员可以根据压力测试结果,制定测试报告或应急方案,从而规避风险预警、提早补充资本金等。这样,通过压力测试结果的运用,银行可以有效控制风险,提高风险管理水平。

本说明书实施例中,通过合理设计压力情境,利用训练好的信用风险压力测试模型进行压力测试,可以有效提高对信用风险压力测试的准确度。

当然,上述只是进行示例性说明,本说明书实施例不限于上述举例,所属领域技术人员在本申请技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本申请相同或相似,均应涵盖于本申请保护范围内。

从以上的描述中,可以看出,本申请实施例可以确定压力指标和承压指标,根据压力指标和承压指标,获取指标数据集;进一步,可以将指标数据集划分为训练集和测试集,基于训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练,获得信用风险压力测试模型;其中,在训练过程中,利用测试集对训练获得的模型进行验证,当训练集对应的误差与测试集对应的误差满足预设条件时停止训练,压力指标表示影响信用风险的因素,承压指标表示受压力指标影响的因素,指标数据集中每条指标数据包括与压力指标对应的数据和与承压指标对应的数据。相比现有技术中专家根据历史经验设定信用风险压力测试模型的参数,然后将各类风险参数输入信用风险压力测试模型进行测试,本说明书实施例可以有效提高信用风险压力测试的准确度。

本说明书中上述方法的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参加即可,每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。

基于上述所述一种信用风险压力测试模型的训练方法,本说明书一个或多个实施例还提供一种信用风险压力测试模型的训练装置。所述的装置可以包括使用了本说明书实施例所述方法的系统(包括分布式系统)、软件(应用)、模块、组件、服务器、客户端等并结合必要的实施硬件的装置。基于同一创新构思,本说明书实施例提供的一个或多个实施例中的装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似,因此本说明书实施例具体的装置的实施可以参见前述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

具体地,图3是本说明书提供的一种信用风险压力测试模型的训练装置的一个实施例的模块结构示意图,如图3所示,本说明书提供的一种信用风险压力测试模型的训练装置可以包括:确定模块120,获取模块122,划分模块124,训练模块126。

确定模块120,可以用于确定压力指标和承压指标;其中,所述压力指标表示影响信用风险的因素,所述承压指标表示受压力指标影响的因素;

获取模块122,可以用于根据所述压力指标和所述承压指标,获取指标数据集;其中,所述指标数据集中每条指标数据包括与所述压力指标对应的数据和与所述承压指标对应的数据;

划分模块124,可以用于将所述指标数据集划分为训练集和测试集;

训练模块126,可以用于基于所述训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练,获得信用风险压力测试模型;其中,在训练过程中,利用所述测试集对训练获得的模型进行验证,当训练集对应的误差与测试集对应的误差满足预设条件时停止训练。

需要说明的,上述所述的装置根据方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。

本说明书还提供一种信用风险压力测试模型的训练设备的实施例,包括处理器及用于存储处理器可执行指令的存储器,所述指令被所述处理器执行时实现包括以下步骤:确定压力指标和承压指标;其中,所述压力指标表示影响信用风险的因素,所述承压指标表示受压力指标影响的因素;根据所述压力指标和所述承压指标,获取指标数据集;其中,所述指标数据集中每条指标数据包括与所述压力指标对应的数据和与所述承压指标对应的数据;将所述指标数据集划分为训练集和测试集;基于所述训练集、随机梯度下降算法以及模拟退火算法对预设神经网络模型进行训练,获得信用风险压力测试模型;其中,在训练过程中,利用所述测试集对训练获得的模型进行验证,当训练集对应的误差与测试集对应的误差满足预设条件时停止训练。

需要说明的,上述所述的设备根据方法或装置实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。

本说明书所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图4是本说明书提供的一种信用风险压力测试模型的训练服务器的一个实施例的硬件结构框图,该服务器可以是上述实施例中的信用风险压力测试模型的训练装置或信用风险压力测试模型的训练设备。如图4所示,服务器10可以包括一个或多个(图中仅示出一个)处理器100(处理器100可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器200、以及用于通信功能的传输模块300。本领域普通技术人员可以理解,图4所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器10还可包括比图4中所示更多或者更少的组件,例如还可以包括其他的处理硬件,如数据库或多级缓存、GPU,或者具有与图4所示不同的配置。

存储器200可用于存储应用软件的软件程序以及模块,如本说明书实施例中的信用风险压力测试模型的训练方法对应的程序指令/模块,处理器100通过运行存储在存储器200内的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器200可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器200可进一步包括相对于处理器100远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输模块300用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输模块300包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块300可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

本说明书提供的上述实施例所述的方法或装置可以通过计算机程序实现业务逻辑并记录在存储介质上,所述的存储介质可以计算机读取并执行,实现本说明书实施例所描述方案的效果。所述存储介质可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。所述存储介质可以包括:利用电能方式存储信息的装置如,各式存储器,如RAM、ROM等;利用磁能方式存储信息的装置如,硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置如,CD或DVD。当然,还有其他方式的可读存储介质,例如量子存储器、石墨烯存储器等等。

本说明书提供的上述信用风险压力测试模型的训练方法或装置实施例可以在计算机中由处理器执行相应的程序指令来实现,如使用windows操作系统的c++语言在PC端实现、linux系统实现,或其他例如使用android、iOS系统程序设计语言在智能终端实现,以及基于量子计算机的处理逻辑实现等。

需要说明的是说明书上述所述的装置、设备、系统根据相关方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照对应方法实施例的描述,在此不作一一赘述。

本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个时可以把部分模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。

本发明是参照根据本发明实施例的方法、装置、设备、系统的流程图和/或方框图来描述的。应理解可由计算机程序指令实现,可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

本领域技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。

以上所述仅为本说明书一个或多个实施例的实施例而已,并不用于限制本本说明书一个或多个实施例。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在权利要求范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号