首页> 中文学位 >基于海量数据分析的银行担保圈风险识别方法的研究
【6h】

基于海量数据分析的银行担保圈风险识别方法的研究

代理获取

目录

声明

第一章 引言

1.1 研究背景及意义

1.2 研究内容与创新点

1.3 论文结构组织

第二章 相关研究

2.1 担保圈行为分析

2.2 担保圈风险识别研究现状

2.3 基于复杂网络的重要节点发现方法的研究

2.4 基于银行业务风险识别方法的研究

2.5 银行担保圈风险识别评价指标

2.6 本章小结

第三章 担保圈内重点企业的发现方法

3.1 识别担保圈

3.2 基于链入关系的PageRank算法

3.3 担保圈关键属性

3.4 本章小结

第四章 基于特征选择的SMOTE-LR的风险识别模型

4.1 数据预处理

4.2 样本均衡化

4.3 FW-FS特征选择算法

4.4 模型训练

4.5 本章小结

第五章 实验与分析

5.1 实验环境

5.2 实验数据

5.3 实验过程

5.4 方法评估

5.5 本章小结

第六章 结论及下一步工作

6.1 论文工作总结

6.2 下一步工作

参考文献

致谢

攻读硕士期间发表的学术论文

参加项目

展开▼

摘要

随着信贷市场的发展,由个人贷款或企业贷款导致的贷款风险的发生,造成银行不良贷款金额逐年增高,至2018年年底,不良贷款余额达到20254(亿元),为了降低不良贷款的发生,银行多采用抵押、担保等形式进行贷款业务,担保网络随之产生,同时也带来了各种风险。如何从海量数据中有效地识别出银行担保圈风险,做到及时止损,是本文研究的重点。 常规情况下担保网络比较庞大,直接分析比较复杂,因此本文从以下三个方面进行担保圈风险识别方法的研究: 第一,通过有向图的深度优先遍历,从复杂的担保关系中识别出一个个互不交叉的担保圈,实现大型担保网络的分割。然后提出一种基于链入关系的PageRank算法,综合考虑了链入度和链入强度对节点的影响,更全面的发现担保圈内重点企业。 第二,提出一种FW-FS特征选择算法,对企业的原始信贷数据进行预处理,选择出最具代表性且覆盖全部或者大部分原始数据信息的无冗余的最优特征子集,同时避免了传统特征选择算法在特征聚类时K值的问题。 第三,基于特征选择的SMOTE-LR风险识别模型,对重点企业进行风险排查,定位圈内的高危企业,逐步降低担保圈风险带来的多米诺骨牌效应。同时解决了原始样本数据分布不平衡的问题。 最后,本文针对数据不平衡问题和FW-FS特征选择算法对识别结果的影响进行了验证,并与目前较为流行的算法包括决策树、AdaBoost和SVM进行了比较,实验结果表明本文方法在处理担保圈风险识别问题上表现较好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号