首页> 中文学位 >基于数据挖掘技术的商业银行客户违约预测研究
【6h】

基于数据挖掘技术的商业银行客户违约预测研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 研究意义

1.3 国内外研究综述

1.3.1 变量选择的文献综述

1.3.2 模型建立的文献综述

1.4 论文框架

第二章 相关理论介绍

2.1 变量选择方法概述

2.1.1 预测力指标

2.1.2 自适应LASSO方法

2.2 模型建立方法概述

2.2.1 决策树模型

2.2.2 随机森林模型

2.2.3 支持向量机模型

2.2.4 K近邻模型

第三章 实证研究

3.1.2 数据标准化处理

3.1.3 缺失值的处理

3.1.4 删除”无效”变量

3.1.5 删除强相关的变量

3.1.6 数据不平衡问题

3.2 特征选择

3.2.1 基于预测力指标的特征选择

3.2.2 基于自适应LASSO的特征选择

3.2.3 基于基尼方差为权重的自适应LASSO的特征选择

3.2.4 特征选择方法比较

3.2.5 特征变量描述

3.3 模型建立

3.3.1 决策树模型

3.3.2 随机森林模型

3.3.3 支持向量机模型

3.3.4 K近邻模型

3.4 模型评估

第四章 总结

参考文献

致谢

附录

展开▼

摘要

随着我国经济的不断发展,个人信贷已经成为日常消费的重要组成部分。商业银行作为个人信贷的主要机构,信用风险也随之上升,建立有效的个人信用评分制度,降低商业银行运作风险,能够促进社会经济和生活的良性运转。随着信息技术和互联网的迅猛发展,商业银行个人信用库越来越完善,传统的信用评分模型已经无法应对海量数据,数据挖掘方法应运而生。在商业银行违约客户预测研究中,数据挖掘技术无论在特征选择还是模型建立方面都能取得较好的效果。
  本文将数据挖掘技术运用到商业银行违约客户预测的模型研究中,以2017年SAS大赛中某商业银行客户违约数据进行实证研究,从特征选择和模型构建两方面着手。在特征选择方面,采取了预测力指标、自适应LASSO方法和基于基尼方差为权重的自适应LASSO方法,对三种特征选择方法进行比较,结果显示基于基尼方差为权重的自适应LASSO方法具有更好的准确率。
  在模型构建方面,对四种常见的分类模型进行了比较,模型预测结果表明:随机森林预测能力最强,分类精度好;决策树模型总体预测能力略低于随机森林模型,但是在对违约客户识别率达到100%;支持向量机模型在信用评分各方面处于中间水平,但模型缺乏可解释性;K近邻模型对违约客户识别能力较差。总体而言,四种方法建立的模型,总体正确率都能达到90%以上,说明这四种模型对商业银行违约客户的预测能力都较好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号