声明
摘要
图目录
表目录
第1章 绪论
1.1 课题背景与研究意义
1.2 模糊查询和大数据分析处理研究情况
1.3 本文工作与贡献
1.4 论文结构
1.5 本章小结
第2章 在线聚集相关技术
2.1 在线聚集的基本描述
2.1.1 在线聚集基本原则
2.1.2 在线聚集的基本过程
2.2 统计分析模型
2.2.1 置信区间类型
2.2.2 置信区间的计算
2.3 多表聚集
2.4 本章小结
第3章 基于模糊查询的大数据分析处理系统架构
3.1 随机混淆模块
3.2 用户查询模块
3.3 样本管理模块
3.4 查询引擎模块
3.5 统计估计模块
3.6 本章小结
第4章 样本和中间结果管理
4.1 树节点介绍
4.2 分裂方式
4.3 节点分裂
4.3.1 按离散型维度分裂
4.3.2 按连续型维度分裂
4.4 节点合并
4.5 层次转换
4.6 样本存储
4.7 本章小结
第5章 查询引擎和统计估计量
5.1 查询引擎
5.1.1 在样本管理树的查询过程
5.1.2 在数据源中查询
5.2 统计估计量
5.2.1 叶子节点的统计估计量
5.2.2 统计估计量的合并
5.3 本章小结
第6章 实验结果及分析
6.1 实验配置
6.1.1 运行环境
6.1.2 实验数据
6.1.3 实验设置
6.1.4 用户界面
6.2 实验结果与分析
6.2.1 数据集大小对实验结果的影响
6.2.2 置信度和误差界限对查询时间的影响
6.2.3 聚合结果的准确性
6.3 本章小结
第7章 总结与展望
7.1 本文主要工作与贡献
7.2 未来研究工作展望
参考文献
攻读硕士学位期间主要的研究成果
致谢