文摘
英文文摘
第一章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 交通信息流数据挖掘研究现状
1.2.2 分布式序列模式挖掘的研究现状
1.3 本文研究内容与创新点
1.3.1 研究内容
1.3.2 创新点
1.4 本文组织结构
1.5 本章小结
第二章 相关技术简介
2.1 Hadoop简介
2.2 分布式文件系统HDFS简介
2.3 基于Hadoop的MapReduce实现简介
2.4 序列模式挖掘基本概念及形式化描述
2.5 序列模式挖掘主要应用与发展前景
2.5.1 序列模式挖掘主要应用领域
2.5.2 序列模式挖掘发展前景
2.6 本章小结
第三章 基于HDFS的交通信息流数据预处理
3.1 HDFS数据存储原理
3.1.1 数据复制
3.1.2 副本存放
3.1.3 副本选择
3.2 HDFS数据流程剖析
3.2.1 文件读取剖析
3.2.2 文件写入剖析
3.3 应用数据提取与处理
3.3.1 目的与意义
3.3.2 交通信息流基本特征
3.3.3 交通信息流数据清理
3.3.4 交通信息流数据离散化
3.3.5 交通信息流数据堆规约
3.4 本章小结
第四章 基于MapReduce的交通信息流分布式序列模式挖掘研究和应用
4.1 问题描述
4.2 相关定义
4.3 HTDSM算法描述
4.3.1 基本思想
4.3.2 算法描述
4.3.3 应用举例
4.3.4 算法性能分析
4.4 实验结果与分析
4.4.1 实验软硬件描述
4.4.2 Hadoop平台的搭建
4.4.3 实验结果分析
4.5 本章小结
第五章 Hadoop环境下基于分布式BIDE算法的交通信息流序列模式挖掘研究和应用
5.1 BIDE算法特征描述
5.1.1 BIDE算法出现背景
5.1.2 BIDE算法描述
5.2 HTBIDE算法并行设计
5.2.1 基本思想
5.2.2 算法描述
5.3 实验结果与分析
5.3.1 实验环境配置
5.3.2 伴随车序列模式挖掘Map类的实现
5.3.3 伴随车序列模式挖掘Reducer类的实现
5.3.4 伴随车序列模式挖掘作业启动类的实现
5.3.5 其他相关类实现说明
5.3.6 实验结果分析
5.4 本章小结
第六章 总结与展望
6.1 研究工作总结
6.2 未来展望
致 谢
参考文献
附 录