摘要
第一章 绪论
第一节 研究背景与研究意义
二、研究意义
第二节 研究思路与研究内容
一、研究思路
二、研究内容
三、基本框架
第三节 国内外研究综述
一、数据挖掘的概念和行业应用
二、传统金融领域的信用评估和违约识别方法
三、互联网金融领域的P2P借贷违约识别方法
四、对已有研究的评价
第四节 可能的创新点与不足之处
一、可能的创新点
二、不足之处
第二章 P2P借贷违约风险与数据挖掘技术相关理论分析
第一节 P2P借贷违约风险相关理论分析
一、P2P借款业务及对借款人信用的考察维度
二、P2P借款违约风险与特征分析
三、P2P借款违约风险的影响因素分析
第二节 数据挖掘理论模型
一、逻辑回归、神经网络及其特点
二、支持向量机(SVM)模型及其特点
三、决策树类算法及其特点
四、本文对数据挖据模型的选择和应用
第三章 P2P借贷行为数据集采集与预处理
第一节 数据集概况与分割
一、数据集来源
二、数据集概况
三、数据集的分割
第二节 P2P借贷行为数据清洗
一、对缺失值的处理
二、对近零方差字段的剔除
三、对字段的转换
第三节 P2P借贷行为特征工程
一、缺失值的数量和违约率
二、地域信息
三、第三方信息
四、用户登录信息
五、用户对个人信息的修改
六、对特征的进一步处理
第四章 基于数据挖掘技术的P2P借贷违约风险模型训练与优化
第一节 不平衡数据集的处理与评估指标说明
一、对不平衡数据集的处理方法
二、评估指标说明
第二节 基于单一模型的P2P借贷违约预测与效果
一、逻辑回归模型和神经网络模型的预测效果
二、支持向量机模型(SVM)的预测效果
三、决策树类算法的预测效果
第三节 基于Stacking集成学习的P2P借贷违约预测与效果
一、Stacking集成学习方法
二、基于Stacking集成学习方法的P2P借贷违约预测与效果
第四节 Stacking集成学习方法的最终评价
一、基于ROC曲线和AUC值的最终评价
二、基于KS曲线和KS值的最终评价
第五章 研究结论与研究启示
第一节 研究结论
一、参考多维度数据能够有效辅助P2P借贷违约的识别
二、XGBoost等数据挖掘模型在预测中具有较好的性能
三、Stacking模型融合方法进一步提高预测效果
四、开源的建模工具在P2P借贷违约识别建模中具有优势
第二节 研究启示
一、对从事P2P借贷业务的平台的启示
二、对P2P的投资者的启示
三、对P2P借贷行业监管的启示
参考文献
附录
致谢
声明