首页> 中国专利> 一种嵌入平滑参数的信用风险评分方法

一种嵌入平滑参数的信用风险评分方法

摘要

本发明公开了一种嵌入平滑参数的信用风险评分方法,包括以下步骤:步骤1.数据集准备,将大数据集群上的数据文件转换成csv文件,并处理数据中的缺失值、类别变量和日期变量等,用作线下单机模型训练的样本;步骤2.变量分箱,运用常见的分箱方法,例如等频分箱、卡方分箱、best‑ks分箱、决策树分箱等,对变量分箱。本专利针对经典的信用评分技术中存在的不同分箱之间评分相对差异较大的问题,通过嵌入平滑参数和K‑Fold交叉验证进行修正,其中平滑参数依赖变量分箱中违约正常比的均值、方差及先验参数,最终对原有的评分方法进行了一个调和加权平均,将变量各个分箱的信用评分调整为可解释的范围,并提高了模型稳定性。

著录项

  • 公开/公告号CN112396515A

    专利类型发明专利

  • 公开/公告日2021-02-23

    原文格式PDF

  • 申请/专利权人 天翼电子商务有限公司;

    申请/专利号CN202011394365.9

  • 发明设计人 朱桂菊;谢巍盛;徐小龙;

    申请日2020-12-02

  • 分类号G06Q40/02(20120101);G06Q10/06(20120101);G06K9/62(20060101);

  • 代理机构

  • 代理人

  • 地址 102200 北京市昌平区未来科技城南区中国电信集团公司院内

  • 入库时间 2023-06-19 10:00:31

说明书

技术领域

本发明涉及信用风险评估领域,特别涉及一种嵌入平滑参数的信用风险评分方法。

背景技术

如今在信用风险评估和金融风险控制领域,普遍使用信用评分,信用评分是指根据客户的各种历史信用资料,利用模型得到不同等级的信用分数,根据客户的信用分数,授信者可以通过分析客户按时还款的可能性,据此决定是否给予授信以及授信的额度和利率,

如图2所示,经典的信用评分技术通常包括变量分箱、WOE值计算、模型建立、分数转换等步骤,却缺少对分箱后的分数进行可解释性检查的步骤,因此会出现其中一个分箱的分数过高或过低的状况;如图3所示,当用户近12月贷款逾期次数=0时分数为200,当用户近12月贷款逾期次数=1时分数为34,即用户近12月贷款逾期次数相差1次分数却相差166分,不能满足银监会对金融机构的可解释性要求。

发明内容

本发明要解决的技术问题是克服现有技术的缺陷,提供一种嵌入平滑参数的信用风险评分方法,本专利针对经典的信用评分技术中存在的不同分箱之间评分相对差异较大的问题,通过嵌入平滑参数和K-Fold交叉验证进行修正,其中平滑参数依赖变量分箱中违约正常比的均值、方差及先验参数,最终对原有的评分方法进行了一个调和加权平均,将变量各个分箱的信用评分调整为可解释的范围,并提高了模型稳定性。

为了解决上述技术问题,本发明提供了如下的技术方案:

本发明一种嵌入平滑参数的信用风险评分方法,包括以下步骤:

步骤1.数据集准备,将大数据集群上的数据文件转换成csv文件,并处理数据中的缺失值、类别变量和日期变量,用作线下单机模型训练的样本;

步骤2.变量分箱,运用常见的分箱方法,例如等频分箱、卡方分箱、best-ks分箱、决策树分箱等,对变量分箱;

步骤3.固定变量的分箱,划分数据集,将原始数据分成K组(K-Fold),对任意K-1组数据计算每个分箱的

步骤4.计算变量在每个分箱的WOE,此时将

步骤5.根据新的WOE值计算变量的IV值,筛选出IV>=0.02的变量,利用LR方法训练模型,得到每个变量的系数β

步骤6.根据新的WOE公式及上一步所得变量系数,计算变量分数;

步骤7.信用评分部署,通过pmml文件将信用评分通过接口传递至信贷业务系统,用于审批环节。

与现有技术相比,本发明的有益效果如下:

本专利针对经典的信用评分技术中存在的不同分箱之间评分相对差异较大的问题,通过嵌入平滑参数和K-Fold交叉验证进行修正,其中平滑参数依赖变量分箱中违约正常比的均值、方差及先验参数,最终对原有的评分方法进行了一个调和加权平均,将变量各个分箱的信用评分调整为可解释的范围,并提高了模型稳定性。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1是本发明的整体方案示意图;

图2是现有经典的信用评分表格图;

图3是基于现有经典的信用评分表格图的基础上做出的示例图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

实施例1

本发明如图1-3所示,本发明提供一种嵌入平滑参数的信用风险评分方法,包括以下步骤:

步骤1.数据集准备,将大数据集群上的数据文件转换成csv文件,并处理数据中的缺失值、类别变量和日期变量等,用作线下单机模型训练的样本;

步骤2.变量分箱,运用常见的分箱方法,例如等频分箱、卡方分箱、best-ks分箱、决策树分箱等,对变量分箱;

步骤3.固定变量的分箱,划分数据集,将原始数据分成K组(K-Fold),对任意K-1组数据计算每个分箱的

步骤4.计算变量在每个分箱的WOE,此时将

步骤5.根据新的WOE值计算变量的IV值,筛选出IV>=0.02的变量,利用LR方法训练模型,得到每个变量的系数β

步骤6.根据新的WOE公式及上一步所得变量系数,按照下表方式计算变量分数:

步骤7.信用评分部署,通过pmml文件将信用评分通过接口传递至信贷业务系统,用于审批环节。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号