首页> 中文学位 >基于XGBoost的互联网小贷贷后风险评级
【6h】

基于XGBoost的互联网小贷贷后风险评级

代理获取

目录

第一个书签之前

摘 要

Abstract

1 绪论

1.1 研究背景

1.2 研究意义

1.3 本文主要研究内容

2 贷后风险评级模型开发流程

2.1 引言

2.2 业务定义

2.3 数据收集与数据清洗

2.4 变量筛选

2.5 模型检验

2.6 本章小结

3 贷后风险评级模型

3.1 引言

3.2 XGBoost模型

3.2.1 模型的建立

3.2.2 模型的训练

3.3 模型的评估

3.3.1 准确率、精确率和F1

3.3.2 kappa系数

3.3.3 ROC曲线

3.4 本章小结

4 实验与结果分析

4.1 引言

4.2 建立样本数据及预处理

4.2.1 业务定义与数据收集

4.2.2 变量解释

4.2.3 缺失值、异常值处理

4.2.4 不平衡样本的处理

4.3 特征变量筛选

4.3.1 特征相关性研究

4.3.2 特征重要性研究

4.4 实验结果分析

4.4.1 参数设置

4.4.2 训练结果与分析

4.5 本章小结

结论

参 考 文 献

附录 A

致 谢

大连理工大学学位论文版权使用授权书

展开▼

摘要

随着国民消费观念的转变和互联网金融技术的进步,互联网小额贷款行业得到了快速发展。提供网络小贷的公司数量、客户规模和贷款额度都出现了显著增长。然而,在行业不断向前发展的同时,逾期未偿还金额也在大幅度提高。为了保证行业健康、稳定和持续的发展,提高信贷的风险管理水平成为互联网小额信用贷款的核心内容。基于以上背景,本文以LendingClub的借贷数据为研究对象,基于XGBoost算法从实践的角度建立贷后风险评级模型,对影响客户违约概率的风险因素进行研究和分析。 首先,基于业务知识,本文对国内互联网小额贷款的发展历程和现状进行了分析,包括小额贷款方式的变更和国内对于互联网小额贷款的监管政策,并通过分析指出构建合理、高效的信用风险评估模型的重要性。 其次,本文基于机器学习中的XGBoost算法,构建一种贷后风险评级模型。使用泰勒函数二阶展开来近似损失函数,以提高模型训练的计算速度;采用L2正则化来减小模型复杂度;使用贪心算法来衡量分裂条件和树的后剪枝;采用稀疏感知算法自动学习缺失数据的分裂方向,有效地保持了数据的分布特征;使用分布式加权直方图算法寻找分裂节点。 然后,针对贷后风险模型的开发流程,本文以国外借贷平台LendingClub公司的借贷数据为研究对象,根据业务知识,对数据中的特征变量进行探索性分析,并对数据中的缺失值、异常值和不平衡样本进行处理,在结合特征相关性分析和特征重要性研究的基础上,对模型训练所使用的变量进行筛选。 最后,采用控制变量法确定模型训练参数的最优解,并对模型进行训练。训练结果表明,所构建的贷后风险评级模型能够获得较高的AUC值和F1值,验证了模型的有效性。针对实验结果,本文分析了影响客户违约概率的几个重要因素,为实际应用提供参考。

著录项

  • 作者

    刘炎梅;

  • 作者单位

    大连理工大学;

  • 授予单位 大连理工大学;
  • 学科 应用统计
  • 授予学位 硕士
  • 导师姓名 冯敬海;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    互联网;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号