声明
摘要
1 介绍
1.1 背景描述
1.2 研究目的
1.3 论文结构
1.4 研究工具
2 统计学习理论模型
2.1 k-NN
2.2 C4.5
2.3 Random Forest
2.4 SVM
3 数据
3.1 数据描述
3.1.1 航班延误数据
3.1.2 天气数据
3.2 数据清理
3.2.1 数据结构
3.2.2 空值处理
3.3 数据加工
3.3.1 增加公众节假日字段
3.3.2 简化计划起飞和到达时间段
4 探索性分析
4.1 航空公司与延误
4.2 月份与延误
4.3 星期与延误
4.4 航班时间与延误
4.5 节假日与延误
5 归类分析
5.1 数据
5.2 C4.5模型与预测结果
5.3 随机森林模型与预测结果
5.4 SVM模型及其预测结果
5.5 k-NN模型及其预测结果
6 决策树和归类分析优化
6.1 决策树和归类分析评价
6.2 引入新变量
6.3 评价基准
6.4 优化后的分析结果
6.4.1 C4.5
6.4.2 Random Forest
6.4.3 SVM
6.4.4 k-NN
7 回归分析
7.1 线性回归
7.2 随机梯度下降回归(Stochastic Gradient Descent Regressor)
8 结论与不足
参考文献