声明
致谢
摘要
1绪论
1.1 研究背景及意义
1.2 国内外相关研究现状
1.3 问题发现与解决思路
1.4 论文主要工作
1.5 论文结构
1.6 本章小结
2相关理论与技术
2.1 开源大数据框架
2.1.1 分布式处理框架-Hadoop
2.1.3 分布式存储系统-Hbase
2.1.4 分布式全文搜索引擎-ElasticSearch
2.2.1 数据仓库技术-ETL
2.2.2 物化视图
2.2.3 二级索引
2.3 数据序列化的系统-Apache Avro
2.4 Web开发框架-JFinal
2.5 状态机
2.6 本章小结
3系统需求分析
3.1 系统业务范围及业务需求分析
3.2 系统功能性需求分析
3.2.1 数据管理模块需求分析
3.2.2 规则转化模块需求分析
3.2.3 数据处理模块需求分析
3.2.4 任务调度模块需求分析
3.3 系统非功能性需求分析
3.4 本章小结
4系统概要设计
4.1 架构设计
4.2 功能模块概要设计
4.2.1 数据管理模块概要设计
4.2.2 数据处理模块概要设计
4.2.3 规则转化模块概要设计
4.2.4 任务调度模块概要设计
4.3 数据库的设计
4.3.1 数据库概念模型设计
4.3.2 数据库逻辑模型设计
4.3.3 数据库物理模型设计
4.4 本章小结
5系统详细设计与实现
5.1 数据管理模块的详细设计与实现
5.2 数据处理模块的详细设计与实现
5.3 规则转化模块的详细设计与实现
5.4 任务调度模块的详细设计与实现
5.5 重点难点部分设计
5.5.1 TypeExtract
5.5.2 DataNormalize
5.5.3 InternalIndex
5.5.4 Enrichment
5.5.5 过载保护
5.6 本章小结
6系统测试与实现效果
6.1 系统环境测试
6.2 系统功能测试
6.2.1 数据处理模块测试
6.2.2 规则转化模块测试
6.2.3 任务调度模块测试
6.3 非功能性测试
6.4 实现效果展示
6.5 本章小结
7总结与展望
7.1 工作总结
7.2 工作展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集
北京交通大学;