声明
致谢
1 引言
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 晚点预测国内外研究现状
1.2.2 晚点影响因素选择研究现状
1.3 研究内容及章节安排
1.4 本章小结
2 晚点预测相关理论
2.1 特征选择方法
2.1.1 特征选择的一般过程
2.1.2 特征选择方法分类
2.1.3 特征选择评价准则
2.2 集成学习算法
2.2.1 Bagging模型
2.2.2 Boosting模型
2.2.3 Stacking模型
2.3 超参数调优方法概述
2.4 本章小结
3 晚点影响因素识别及改进特征选择算法设计
3.1 列车晚点案例介绍
3.2 晚点影响因素分析与识别
3.2.1 基于TF-IDF的关键词提取
3.2.2 晚点影响因素识别
3.2.3 晚点特征数值化处理
3.3 特征相关性分析与特征选择算法设计
3.3.1 晚点数据标准化
3.3.2 晚点特征相关性及冗余分析
3.3.3 基于mRMR特征选择算法
3.3.4 改进mRMR算法设计
3.4 本章小结
4 基于集成学习的晚点预测方法设计
4.1 晚点预测模型应用场景描述
4.2 基于决策树的集成学习算法
4.2.1 随机森林算法
4.2.2 GBDT算法
4.2.3 XGBoost算法
4.3 基于PSO的加权随机森林优化算法设计
4.3.1 粒子群优化算法
4.3.2 PSO-wRF优化算法设计
4.4 基于GS的GBDT与XGBoost 优化算法设计
4.5 本章小结
5 实验分析及系统实现
5.1 实验结果分析
5.1.1 特征选择结果分析
5.1.2 回归模型评价指标
5.1.3 预测模型超参数优化结果
5.1.4 晚点时间预测结果与分析
5.2 基于Django的晚点预测系统实现
5.2.1 系统开发环境
5.2.2 Django框架设计
5.2.3 MySQL数据库设计
5.2.4 系统功能实现
5.3 本章小结
6 结论
6.1 论文工作总结
6.2 未来工作展望
参考文献
图索引
表索引
作者简历及攻读硕士学位期间取得的研究成果
独创性声明
学位论文数据集
北京交通大学;