多种分类模型在个人信用评估中的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着信息科技高速发展，互联网与传统行业相继结合，类似于互联网金融等新兴概念正在颠覆传统金融业。在个人信用评估领域，由于数据挖掘技术的快速发展，已具有完全不同的信用分析方式，如机器学习、数据挖掘等。论文研究了其中的三种分类模型：logistic模型、决策树模型、随机森林模型在个人信用评估中的应用。
　　Logistic回归模型是个人信用评级中应用最广泛的方法，也是其他方法的分类能力基准。论文选用UCL数据库中德国某银行个人信用数据，采用logistic模型对其进行客户分类，分类过程中采用变量筛选前后对比、筛选变量时采用Enter法、Backwards法来得出分类结果。
　　决策树模型是机器学习中最具有影响力的方法，具有易于解释、识别效率高、产生判别规则等优势。论文将决策树模型用于银行客户分类，采用C5.0算法进行分类，分类过程中引入树的后剪枝、误判成本矩阵、boosting算法提高模型适用性，同时进行变量筛选对比来得出分类结果。
　　随机森林模型是多颗决策树的集成，论文使用随机森林分类银行客户，主要在于对比决策树及随机森林的分类效果，通过调整各类参数，引入代价敏感学习建立加权随机森林模型，并对各变量重要性进行排序。
　　最后，论文对以上三种分类模型进行评价，通过ROC曲线、AUC值、Lift曲线等标准以及各模型的泛化误差估计，基于论文数据得出结论：随机森林模型具有最低的总错误率；决策树C5.0具有最低的A类错误率，但其B类错误率较高；没有一种模型在各类错误率均低于其他模型。
　　论文在建立三种模型的过程中，将数据分为训练数据、测试数据、验证数据，每一个参数均通过不断测试以便取得最优结果，先对每个模型进行分析对比，再对三个模型进行对比，分类评价采用准确率和ROC曲线等指标综合评价。这种方式更大限度确保模型对于实际数据的可应用性，因此对于实际分类需求上具有一定的实践参考价值。

著录项

作者
杨蕴涵;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科应用统计
授予学位硕士
导师姓名钟波;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类货币流通和信用;数量经济学;
关键词
互联网金融; logistic回归; 决策树; 随机森林模型; 个人信用评估; ROC曲线;

相似文献

中文文献
外文文献
专利

1. 基于粗糙集属性约简与多种分类模型的个人信用评估 [J] . 曹宁1 ,李淑锦1 . 金融 . 2018,第004期
2. 分类树在个人信用评估中的应用 [J] . 姜明辉 ,王欢 ,王雅林 . 商业研究 . 2003,第021期
3. Lasso-Cox模型在个人信用风险评估中的应用 [J] . 李淑锦 ,嵇晓佳 . 资源开发与市场 . 2021,第002期
4. 熵权—TOPSIS模型在个人信用风险评估中的应用 [J] . 徐琴 ,李云飞 . 金融理论与教学 . 2020,第002期
5. 基于GCV的LS-SVM模型选择在个人信用评估中的应用 [J] . 李娴 . 河南大学学报：自然科学版 . 2011,第3期
6. Logistic回归与线性回归组合模型及在个人信用评估中的应用 [C] . 姜明辉 ,解晓璐 . 中国系统工程学会第十四届学术年会 . 2006
7. 人工神经网络在金融领域信用风险评估中的应用——基于个人信用风险评估体系的B-P网络模型实证 [A] . 于鸣燕 . 2007

多种分类模型在个人信用评估中的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅