首页> 中文期刊> 《系统管理学报》 >基于Class Balanced Loss修正交叉熵的非均衡样本信用风险评价模型

基于Class Balanced Loss修正交叉熵的非均衡样本信用风险评价模型

         

摘要

针对传统信用风险预测模型存在对非违约样本识别过度、对违约样本识别不足的问题,将平衡损失Class Balanced Loss函数引入信用风险评价,构建Class Balanced Loss修正交叉熵的非均衡样本信用风险评价模型。利用所建模型与交叉熵神经网络、支持向量机、决策树、随机森林和K最近邻5种分类模型进行对比,验证BPNN-CBCE对中国某金融机构1 534笔农户贷款数据信用风险预测的有效性;在此基础上,利用UCI公开的德国信贷数据验证BPNN-CBCE模型的稳健性。研究表明:对于农户数据,BPNN-CBCE模型在AUC、违约召回率Default recall方面普遍优于BPNN-CE、SVM、DT、RF和KNN模型,其中,BPNN-CBCE的Default recall相比5种对比模型提升了41.3个百分点,AUC相比5种对比模型提升了15.6个百分点;对于德国数据集,BPNN-CBCE评级模型在AUC、违约召回率Default recall方面也均优于5种对比模型。因此,BPNN-CBCE信用评价模型对农户不均衡信贷数据中的违约样本具有较好的识别能力,可有效降低金融机构客户误判带来的损失。创新与特色:①利用Class Balanced Loss中的平衡因子ω,增大违约样本在目标损失中的权重、降低非违约样本在目标损失中的权重,客观调节正负样本损失在目标损失中权重,弥补交叉熵函数无法调节两类样本损失权重的缺陷,克服由样本不均衡带来的评价模型对非违约样本识别过度、对违约样本识别不足。②通过考虑数据重叠,利用随机覆盖方法,分别对贷款数据中违约、非违约样本进行不放回采样,以对全样本空间X_(违约)、X_(非违约)进行不重叠覆盖,计算两类贷款客户的有效样本数量。既反映由于真实数据之间的内在相似性,随着样本数量的增加,新添加样本很可能是现有样本近似重复的客观事实,也保证基于有效样本对两类样本损失进行重新加权的客观性。将图像识别领域中的Class Balanced Loss函数引入信用评价领域,既拓展了Class Balanced Loss的使用边界,也为解决不均衡样本的信用风险评价提供了新的研究思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号