高维非平衡数据的集成分类方法及其在个人信用风险评估中的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在当前国家大力发展“普惠金融”，推动建设社会信用体系的背景下，大数据征信越来越成为学术界和金融界关注的热点问题。相比于数据的体量而言，大数据征信中更为关键的问题在于处理征信数据本身维度的多样性和结构的复杂性。例如大部分征信样本数据从结构上说都是类别非平衡的，其中的违约样本在整体中往往只占到很小的比例。而目前现行的关于个人信用风险评估的多数方法和模型都没有重视数据的这些特征。如果忽略数据本身带有的特点，直接套用现有的模型和方法，自然而然其结果和可靠性都会受到一定程度上的影响。
　　从统计学习的角度而言，可以将个人信用风险评估转化成一个分类问题，通过将贷款申请人分为信用好客户和信用差的客户，提供贷款或增加额度给还款概率大的信用好客户，拒绝或降低贷款额度给违约概率大的信用差客户。因此本文首先从分类学习的角度出发，进行数学抽象成无约束的最优化问题，从而构建了统计学习的理论框架。并在此理论框架下梳理总结了当前处理分类问题的单分类器方法和集成分类方法。其次从数据的高维不平衡特点出发，建立了与之相适应的分类性能评估指标。然后结合集成分类方法，在随机森林模型的基础上引入代价因子，建立了基于高维非平衡数据的随机森林模型。并将新建立的随机森林模型应用到个人信用风险评估的实证研究上，实证结果表明新建立的随机森林模型在处理不平衡数据的分类问题上有很好的效果，尤其是在对占少数的违约客户的分类准确率上远远高于逻辑回归，单棵决策树，以及普通随机森林模型。并且随着不平衡程度的加深，其效果越明显。

著录项

作者
高光银;
展开▼
作者单位

厦门大学;

展开▼
授予单位厦门大学;
学科应用数学
授予学位硕士
导师姓名谭忠;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类信贷;
关键词
信贷管理; 个人信用; 风险评估; 高维非平衡数据; 集成分类;
入库时间 2022-08-17 10:23:58

相似文献

中文文献
外文文献
专利

1. 优化的支持向量机集成分类器在非平衡数据集分类中的应用 [J] . 章少平 ,梁雪春 . 计算机应用 . 2015,第005期
2. Lasso-Cox模型在个人信用风险评估中的应用 [J] . 李淑锦 ,嵇晓佳 . 资源开发与市场 . 2021,第002期
3. 熵权—TOPSIS模型在个人信用风险评估中的应用 [J] . 徐琴 ,李云飞 . 金融理论与教学 . 2020,第002期
4. Fisher判别法在个人信用风险评估中的应用 [J] . 唐煜 ,崔海浪 . 中国市场 . 2020,第019期
5. 一种基于Boosting的集成学习算法在银行个人信用评级中的应用 [J] . 陈力 ,黄艳莹 ,游德创 . 价值工程 . 2017,第018期
6. 基于协同进化的集成学习在个人信用评估中的应用 [C] . 田津 ,李敏强 ,陈富赞 . 第七届（2012）中国管理学年会——新经济环境下中国管理变革与范式探索 . 2012
7. 非平衡数据分类方法及其在恶意网址检测中的应用 [A] . 陈晓辉 . 2017

高维非平衡数据的集成分类方法及其在个人信用风险评估中的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅