声明
摘要
1 绪论
1.1 研究背景
1.1.1 互联网金融的现状及发展趋势
1.1.2 P2P行业的风险概述
1.2 研究意义
1.3 国内外研究现状
1.4 研究目的
1.5 研究内容
1.6 论文实验路线
1.7 创新之处
2 基于大数据的创新征信模式
2.1 互联网征信与欺诈识别
2.2 互联网征信及其发展
2.3 互联网行为数据与个人信用的关系
2.4 互联网征信的优劣分析
2.4.1 互联网征信的优势
2.4.2 互联网征信可能存在的问题
2.4.3 行业痛点
3 基于大数据的用户分类方法探究
3.1 数据爬虫
3.1.1 爬虫概述
3.1.2 爬虫在本文中的应用
3.2 随机森林
3.2.1 决策树算法概述
3.2.2 Bagging集成算法
3.2.3 随机森林算法概述
3.2.4 随机森林算法的实现过程
3.2.5 随机森林的优点
3.3 逻辑回归模型
3.3.1 Sigmoid函数
3.3.2 逻辑回归常规过程
4 实证分析
4.1 数据说明
4.1.1 数据整合
4.1.2 规则制定
4.2 各规则描述性统计
4.3 各规则评分及指标重要性度量
4.4 模型验证
4.5 计算信用评分
4.6 实证结论
4.7 逻辑回归建模及对比
4.7.1 参数估计
4.7.2 模型验证
4.7.3 与随机森林算法的对比
5 结论与展望
5.1 结论
5.2 展望
参考文献
致谢
在学期间发表的学术论文及研究成果