首页> 中文学位 >轨迹大数据驱动的乘客预测应用研究
【6h】

轨迹大数据驱动的乘客预测应用研究

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 轨迹大数据研究现状

1.2.2 乘客分布研究现状

1.3 论文研究内容与组织结构

2 轨迹大数据预处理

2.1.1 软硬件环境

2.1.2 浮动车数据介绍

2.1.3 浮动车数据清洗

2.1.4 天气数据预处理

2.2 乘客分布估计并行算法

2.2.1 符号说明

2.2.2 网格划分

2.2.3 乘客分布估计

2.2.4 乘客分布估计并行算法的实现

2.3 本章总结

3 乘客分布特征探测分析

3.1 符号定义

3.2 时空分布特征

3.2.1 交通枢纽区

3.2.2 核心商业区

3.2.3 住宅周边区域

3.3 不同天气下的乘客时序分析

3.4 变量分析

3.5 本章小结

4 乘客分布预测模型

4.1 背景知识

4.1.1 卡尔曼滤波

4.1.2 非齐次泊松模型

4.2 优化非齐次泊松模型

4.2.1 非齐次泊松模型的局限性

4.2.2 相关系数法

4.2.3 平滑指数法

4.2.4 优化模型

4.3 组合预测模型

4.4 本章总结

5 实验结果与分析

5.1 模型性能评价指标

5.2 不同乘客密度的预测结果

5.3 不同天气状态下的预测结果

5.4 与其他模型的对比分析

5.5 时间分析

5.6 本章小结

6 总结与展望

参考文献

个人简历、在学期间发表的学术论文与研究成果

致谢

展开▼

摘要

随着国民经济的发展,浮动车逐渐成为交通系统中不可分割的一部分,为居民提供了方便快捷的出行方式。然而,在实际环境中,乘客分布具有较高随机性和波动性,驾驶员往往很难预测不同区域内的乘客数量,从而导致浮动车供需失衡的现象,极大的浪费了社会资源和用户的时间。通过预测乘客分布,可以引导驾驶员到达乘客较多的区域,从而解决浮动车供需不平衡的矛盾,对提高浮动车运营效率和构建智慧城市具有重要的意义。
  首先,本文基于Spark平台设计并实现了乘客分布估计并行算法,提高获取乘客分布信息的效率。该算法利用分布式计算框架Spark降低获取乘客分布信息的时间,通过网格划分和分布估计两个步骤,实现了不同时段和不同区域乘客分布信息的提取。基于该乘客分布信息,本文以不同的土地利用类型为区分方式,选取了交通枢纽区,核心商业区和住宅周边区域等三种不同类型区域,分别对不同条件下的乘客分布特征进行了分析,为预测乘客分布提供了依据。
  其次,针对非齐次泊松模型存乘客分布预测方面的缺陷,提出了优化非齐次泊松模型。该模型利用相关系数法对历史数据进行筛选,剔除与目标时段乘客分布相差较大的数据;按照数据之间的相关程度,采用平滑指数法对历史数据进行加权,实现了数据之间的平滑过渡。在此基础上,进一步建立了基于优化非齐次泊松模型和卡尔曼滤波模型的组合模型。组合模型充分发挥优化非齐次泊松模型具备的预测优势,综合考虑实时乘客分布和天气状况,进一步提高了乘客分布的预测精度。
  最后,本文基于真实数据集,从多个方面对组合模型的预测效果进行了分析,证明了组合模型的在乘客预测方面的高效性。同时,本文将组合模型与其他模型进行对比,结果表明组合模型在均衡误差、最大相对误差和最大绝对误差方面具有突出优势。

著录项

  • 作者

    李盼乐;

  • 作者单位

    郑州大学;

  • 授予单位 郑州大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 商建东;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 U492.413;
  • 关键词

    浮动车; 乘客分布; 预测模型; 大数据;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号