基于数据挖掘技术的P2P借贷违约风险识别模型研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在互联网经济日益扩张的今天，为满足多样化的投资和借贷需求，互联网金融产业下的P2P借贷业务快速扩张。但近年来，P2P借贷业务发展遇到了一系列问题，尤其是较高的违约率带来的坏账问题，导致P2P平台和投资者遭受损失。建立有效的P2P借贷违约风险识别模型，对于平台的风险控制和行业的长远发展，有着重要的意义。本文旨在运用当前较为主流的数据挖掘方法，寻找并构建能够有效识别P2P借贷违约风险的模型，从而实现P2P平台中潜在违约情况的及时预测，有效降低P2P平台因高违约率而带来的损失，进而提高生存能力。
　　本文首先对P2P借贷业务进行了基本分析，阐述了所采用的几类数据挖掘模型的基本思想和特点。然后，以“拍拍贷”公开的借款人数据集为例进行数据采集，对所采集得到的P2P借贷记录数据进行数据清洗和特征工程。此后，对清洗以后的数据集分别建立逻辑回归(Logistic)、神经网络、支持向量机(SVM)、C50决策树、随机森林、GBDT迭代树和XGBoost等P2P违约风险识别的数据挖据模型，并且选择准确度、精确度、召回度和F1统计值等评估指标来对各个模型的预测效果进行评估和对比。最后，分别选择其中表现效果较佳的XGBoost模型和逻辑回归模型作为基模型和第二阶段的模型，采用Stacking集成学习的方法，建立最终的违约识别组合模型。
　　本文的最终研究结果表明，运用开源工具R语言，基于包含P2P借款用户的基本信息、网络行为、教育信息、社交网络和第三方数据等多维度数据，采用当前流行的数据挖据模型XGBoost建立的Stacking模型组合在对P2P借贷违约风险的识别中具有比单一预测模型更好的预测效果。在测试数据的表现情况来看，该模型不仅能够识别出相当比例的违约用户，同时也能避免过度“误杀”正常借款用户。因此，本文的研究结果可以有效辅助P2P平台及时预测和识别潜在的违约风险，帮助投资者保障合法收益，并且促进P2P行业的监管。

著录项

作者
王嘉琪;
展开▼
作者单位

浙江工商大学;

展开▼
授予单位浙江工商大学;
学科应用统计学
授予学位硕士
导师姓名徐蔼婷;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类信贷;
关键词
网络借贷; 违约风险; 数据挖掘; 生存能力;

相似文献

中文文献
外文文献
专利

1. P2P借贷违约风险识别模型比较 [J] . . 会计之友 . 2019,第002期
2. P2P借贷中借款人的违约风险评估——基于“人人贷”数据的实证分析 [J] . 阮素梅 ,何浩然 ,李敬明 . 经济问题 . 2017,第12期
3. 基于机器学习的P2P网络借贷违约风险识别模型比较——以"人人贷"为例 [J] . 裴晓伟 ,张馨予 . 江苏科技信息 . 2020,第016期
4. 考虑社会网络关系的P2P借贷项目违约风险预测 [J] . 游运 ,万常选 ,江腾蛟 . 计算机工程与应用 . 2021,第013期
5. "弱势"投资者能有效评估P2P借贷违约风险吗? [J] . LIU Zhiyang ,SONG Yuying . 经济与管理评论 . 2019,第004期
6. 基于二层组合神经网络的舞弊风险识别模型研究——来自中国舞弊上市公司的经验证据 [C] . 王泽霞 ,李冬艳 . 中国会计学会高等工科院校分会第二十三届学术年会 . 2016
7. 基于数据挖掘技术的P2P借贷违约预测研究 [A] . 陈雅琪 . 2020

基于数据挖掘技术的P2P借贷违约风险识别模型研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅