首页> 中文学位 >基于数据挖掘的个人信用风险评估单一模型与集成模型的研究
【6h】

基于数据挖掘的个人信用风险评估单一模型与集成模型的研究

代理获取

目录

声明

摘要

第一章 引言

1.1 选题背景以及研究意义

1.2 国内外研究现状

1.2.1 统计方法

1.2.2 非统计方法

1.2.3 各种方法比较研究

1.2.4 集成方法

1.3 技术路线及论文主要研究内容

1.3.1 技术路线

1.3.2 论文结构

1.4 论文创新点

1.5 个人信用风险评估与数据分类技术

1.5.1 个人信用风险评估

1.5.2 数据分类方法

1.5.3 数据分类的过程

第二章 面向个人信用风险评估的数据分类方法

2.1 个人信用风险评估的统计模型

2.1.1 决策树模型

2.1.2 朴素贝叶斯模型

2.2 个人信用风险评估的非统计模型

2.2.1 BP神经网络模型

2.2.2 支持彘量机(SVM)模型

第三章 个人信用风险评估中单一模型的实验对比分析

3.1 对比模型设计

3.2 个人信用风险评估单一模型的数据预处理

3.3 个人信用风险评估单一模型的性能比较

3.3.1 操作过程以及结果

3.3.2 单一模型性能对比分析

第四章 个人风险评估的集成模型应用对比

4.1 集成模型的概述

4.1.1 集成模型的原理

4.1.2 集成模型的结构分类

4.1.3 单一模型的选取

4.1.4 单一模型的合成

4.2 基于同态并行结构的个人信用风险评估集成模型

4.2.1 Bagging集成技术

4.2.2 Boosting集成技术

4.2.3 数值实验

4.3 基于异态并行结构的个人信用风险评估集成模型

4.3.1 基于异态并行结构的个人信用风险评估集成模型的原理

4.3.2 数值实验

结论

参考文献

致谢

展开▼

摘要

个人信用是集体信用和国家信用的基础,代表一个人遵守约定的程度,影响着社会和他人对其的信任度。建立个人信用风险评估系统能在一定程度上降低银行的信贷风险,提高银行市场竞争力。在我国,个人信用制度的建立是从2000年起步,典型方法要求申请人填写一个表格,根据预定义的计分表评分每个指标,银行直接确定是否接受申请人的请求。得分表中每一项的分数仅根据专家的主观经验给出,因此并不是那么的公平可靠。此外,若要修改某条评分条件再调整得分表是很麻烦的。因此,银行要降低信贷风险、发展个人信贷业务,必须科学而有效的对个人信用风险状况进行评估。  本文所完成的主要工作如下:  利用统计模型(C4.5决策树、朴素贝叶斯)和非统计模型(SVM和BP神经网络)建立个人信用风险评估模型,对它们进行比较分析,在三个UCI数据集上采用分类准确率、模型稳定性和可解释性三个指标来评价几个模型的分类效果。实验结果表明:SVM模型的总分类精度最高(82.65%),第二类错误率最低(14%),但其稳定性最差;BP神经网络模型除了稳定性略优于SVM,其余的性能均比SVM差;朴素贝叶斯模型的平均总精度变化最小(3.7%),稳定性最佳,但分类精度最低,第二类错误率最高;C4.5模型在分类精度和稳定性上的表现都不是最出色,对于可解释性来说,统计模型占有绝对的优势。综上所述,现有的信用风险评估模型都各有特点,但没有任何一种模型能让各个统计量都达到较高的水平。  利用集成思想在三个信用数据集上构建了同态并行结构集成模型(bagging集成和boosting集成)和异态并行结构集成模型。实验表明使用集成思想能有效提高单一分类模型分类精度和稳定性。对于同态集成算法,使用bagging集成后模型的分类精度高于boosting集成;使用bagging集成和boosting集成模型两者稳定性效果相当;使用boosting集成后模型第二类错误率比使用bagging集成低。对于异态集成算法,调参前使用集成模型比单一模型的分类精度高4%,调参后集成模型相比于单一模型分类精度提高了2%;集成模型在训练集和测试集上的变化率为6.759%,和单一分类模型决策树(7.24%)接近,较为稳定,表现良好。两种并行结构模型在分类精度和稳定性上都有良好表现,但由于异态并行结构模型的计算过程过于复杂且研中依赖专家知识,故同态并行结构模型更适合在该领域中推广使用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号