首页> 中文学位 >基于惩罚回归的互金借贷逾期风险预测及应用研究
【6h】

基于惩罚回归的互金借贷逾期风险预测及应用研究

代理获取

目录

第一个书签之前

摘 要

ABSTRACT

第一章 绪论

1.1 互联网金融背景

1.1.1 征信

1.1.2 贷款

1.1.3 金融科技与风险控制

1.1.4 法规与网络信息安全

1.2 研究现状

1.3 研究内容

第二章 预备知识

2.1 核密度估计

2.2 线性模型与广义线性模型

2.2.1 线性回归模型

2.2.2 广义线性模型

2.2.3 Logistic回归

2.3 惩罚回归

2.4 逻辑回归与惩罚回归的模拟研究

第三章 二分类预测的性能评价

3.1 混淆矩阵的指标及ROC曲线

3.2 检验与评估

3.2.1 非参数McNemar检验

3.2.2 非参数K-S检验

3.3 基于R语言的分类性能评价

第四章 借贷数据分析应用

4.1 借贷数据介绍与处理

4.2 借贷数据的探索性数据分析

4.2.1 分类型变量探索

4.2.2 数值型变量探索

4.2.3 不同变量间的探索

4.3 逾期概率预测的风险模型

4.3.1 数据预处理

4.3.2 全训练集的logistic回归模型

4.3.3 利用训练集构建模型预测测试集数据

第五章 总结

参考文献

致 谢

展开▼

摘要

随着互联网金融新兴行业快速发展,监管政策落实,征信体系不断完善,网络借贷平台践行惠普金融过程中面临信用风险问题。本文运用惩罚回归的变量选择方法,应用到互联网金融的借贷逾期风险预测。 第一章介绍互联网金融的征信、贷款、金融科技公司及法律法规和网络信息安全问题,并简介Linux环境下的R语言应用,重点回顾二分类问题的研究进展,指出有监督学习方法面临泛化能力、过拟合及维度灾难问题。 第二章介绍线性模型理论、广义线性模型理论、带有惩罚项的回归模型,如L1范数的lasso惩罚、L1与L2范数的elastic-net惩罚、L2范数的ridge惩罚和SCAD惩罚等,结合多元正态分布随机数模拟结果对比各类方法的系数估计值。 第三章介绍分类器的性能评价方法,应用R语言实现混淆矩阵各指标的计算、非参数McNemar检验和K-S检验。数值模拟内容,则结合第二章的逻辑回归预测值,编程计算出最优准确率及最优阈值。 第四章为数据分析实例章节。使用R语言处理逾期数据,结合核密度估计等方法对互联网金融领域的借贷数据进行探索性数据分析,利用logistic回归、lasso惩罚回归、elastic-net(α=0.5)惩罚回归、岭回归等构建逾期风险预测模型,实现分类预测,并计算出逾期的概率。对比各类模型的准确率、召回率、AUC指标、卡方统计量、K-S检验D值等,统计检验表示惩罚回归能够较强地区分逾期和不逾期样本。另外,对不同模型在不同的阈值进行McNemar检验和准确率的对比,比较模型差异性问题。应用结果表明,lasso惩罚回归适合逾期的风险预警,在互联网金融的风控领域具有应用价值。

著录项

  • 作者

    汪谦;

  • 作者单位

    山东师范大学;

  • 授予单位 山东师范大学;
  • 学科 应用统计硕士
  • 授予学位 硕士
  • 导师姓名 王秀丽;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 数学;
  • 关键词

    罚回归; 借贷; 风险预测;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号