声明
摘要
第一章 绪论
1.1 研究背景
1.2 研究意义
1.3 国内外研究综述
1.3.1 变量选择的文献综述
1.3.2 模型建立的文献综述
1.4 论文框架
第二章 相关理论介绍
2.1 变量选择方法概述
2.1.1 预测力指标
2.1.2 自适应LASSO方法
2.2 模型建立方法概述
2.2.1 决策树模型
2.2.2 随机森林模型
2.2.3 支持向量机模型
2.2.4 K近邻模型
第三章 实证研究
3.1.2 数据标准化处理
3.1.3 缺失值的处理
3.1.4 删除”无效”变量
3.1.5 删除强相关的变量
3.1.6 数据不平衡问题
3.2 特征选择
3.2.1 基于预测力指标的特征选择
3.2.2 基于自适应LASSO的特征选择
3.2.3 基于基尼方差为权重的自适应LASSO的特征选择
3.2.4 特征选择方法比较
3.2.5 特征变量描述
3.3 模型建立
3.3.1 决策树模型
3.3.2 随机森林模型
3.3.3 支持向量机模型
3.3.4 K近邻模型
3.4 模型评估
第四章 总结
参考文献
致谢
附录