首页> 中文学位 >基于随机森林的P2P贷款信用风险评价方法
【6h】

基于随机森林的P2P贷款信用风险评价方法

代理获取

目录

声明

1 绪论

1.1 研究背景与问题提出

1.2 研究意义

1.3 技术路线与主要研究内容

2 相关文献综述

2.1 P2P贷款信用风险评价方法研究现状

2.1.1 传统信用风险评价方法研究

2.1.2 基于机器学习的信用风险评价方法研究

2.2 随机森林改进研究现状

2.3 机器学习模型可解释性研究现状

2.3.1 分解式方法

2.3.2 教学式方法

3 以投资者收益评价函数为目标的基于GA-RF的信用风险评价方法

3.1投资者收益评价函数 Profit score

3.2 方法框架

3.3 基于遗传算法的随机森林优化

3.3.1 问题描述

3.3.2 遗传算法

3.4 实验与分析

3.4.1 数据集与特征选择

3.4.2 模型评价准则

3.4.3 随机森林参数优化

3.4.4 实验设置

3.4.5 实验结果分析

3.4.6 讨论与建议

4 一种面向可解释信用风险评价的改进教学式方法

4.1 改进教学式方法框架

4.2 基于Weight-SMOTE的伪数据集抽样方法

4.3 教学式方法评价指标

4.4 实验与分析

4.4.1 模型评价准则

4.4.2 实验设置

4.4.3 实验结果与讨论

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

大连理工大学学位论文版权使用授权书

展开▼

摘要

近年来,P2P贷款行业高速发展,已成为我国重要的金融产业之一,为我国经济发展带来了诸多的机遇。P2P贷款在为个人融资带来便利的同时,也存在贷款违约率高的问题,阻碍了P2P贷款行业的正常发展。P2P贷款信用风险评价研究也成为企业与学者们关注的重点。随着人工智能浪潮的来袭,基于机器学习的P2P贷款信用风险评价方法以精准的预测精度受到了P2P贷款平台和学者们的青睐,但现有研究仍存在不足。一方面,以贷款违约率最小化或预测准确率最大化为目标的机器学习方法,无法保证投资者在P2P贷款投资过程中收益的最大化;另一方面,与逻辑回归和评分卡等传统信用风险评价方法相比,基于机器学习的P2P贷款信用风险评价方法缺乏可解释性,预测结果无法被投资者与P2P贷款平台完全信任。 针对上述问题,本文进行了以下两方面研究。 (1)针对机器学习方法无法保证P2P贷款投资者收益最大化的局限,本文采用遗传算法对P2P贷款信用风险评价中表现较好的随机森林模型进行了改进(GA-RF),提出了以投资者收益函数(Profit score)为目标的基于GA-RF的信用风险评价方法。本文首先从投资者实际收益与实际损失和潜在收益与潜在损失四个方面,构建了投资者收益评价函数Profit score,并以此为目标,采用遗传算法对随机森林中决策树组合进行优化。对比实验采用Lending Club借款平台真实贷款数据,实验结果表明,所提出方法与现有方法相比能够有效的提高投资者收益,保证投资者收益的最大化。 (2)针对基于机器学习的P2P贷款信用风险评价方法缺乏可解释性的问题,进行了探索性的研究,提出了一种面向可解释信用风险评价的改进教学式方法。该方法在传统教学式方法基础上,引入了基于Weight Synthetic Minority Over-sampling Technique(Weight-SMOTE)的伪数据集抽样方法,促进了决策树对于底层黑箱模型中正确且高价值的映射关系的学习能力。同时针对现有保真度评价方法的局限,提出了真保真度评价方法,以有效的衡量决策树对于底层黑箱模型中正确映射关系的学习和模拟能力。实验结果表明,本文所提出方法能够有效的辅助投资者与P2P贷款平台理解信用风险评价的黑箱模型。 本文所提出的基于随机森林的P2P贷款信用风险评价方法研究,可进一步丰富P2P贷款信用风险评价的理论方法体系,并推动机器学习方法在P2P贷款信用风险评价中的应用,具有较好的实际应用前景。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号