声明
1 绪 论
1.1背景描述
1.2学习模型综述
1.3国内研究现状
2 模型理论
2.1 支持向量机
2.1.1线性支持向量机
2.1.2引入软间隔
2.1.3 引入核函数
2.2 Adaboost
2.2.1 Adaboost算法原理
2.2.2 Adaboost算法示例
2.3 决策树算法
2.3.1 信息增益
2.3.2 信息增益率
2.3.3 C5.0算法
2.4 模型评估
2.4.1 分类矩阵
2.4.2 ROC曲线与AUC面积
2.4.3 交叉验证
2.4.4 Kappa系数
2.4.5 非参数模型比较
3 数据分析
3.1数据简介
3.2数据前期预处理
3.3描述性统计
3.3.1根据因变量对数值变量分组计算描述性统计量
3.3.2数值变量之间的相关性
3.3.3分组数值变量与因变量之间的关系
3.3.4分组类别变量与因变量之间的关系
3.4模型拟合
3.4.1支持向量机
3.4.2 Adaboost
3.4.3 C5.0
3.4.4模型评价与比较
结论
参考文献
致谢
大连理工大学;