声明
摘要
第1章绪论
1.1研究背景
1.1.1大数据的查询处理研究
1.1.2稀疏性数据研究
1.1.3抽样技术及典型应用
1.1.4个性化需求
1.2研究内容
1.3主要贡献
1.4论文组织结构
第2章相关工作
2.1数据仓库中的数据分析技术
2.2模式分析
2.2.1查询模式分析
2.2.2离线计算与在线计算模式分析
2.3抽样策略
2.4 MYSQL Cluster
2.5本章总结
第3章原型系统概述及问题定义
3.1原型系统概述
3.2问题定义
3.2.1样本创建模块问题定义
3.2.2样本选择模块问题定义
3.3形式化定义
第4章样本创建模块
4.1样本创建算法
4.1.1创建简单随机样本
4.1.2创建单个分层样本
4.1.3分层样本存储结构
4.2创建分层样本集合
4.2.1 QCS的选择因素
4.2.2 QCS的选择算法
4.2.3个性化分层样本更新
4.3本章小结
第5章样本选择模块
5.1样本选择策略
5.1.1随机样本的在线选择
5.1.2分层样本的在线选择
5.2查询请求的处理
5.2.1分层子样本大小的确定
5.2.2查询日志统计模块
5.3本章小结
第6章系统实现与实验评价
6.1实现环境详述
6.1.1实验环境和数据集
6.1.2环境架构实现
6.1.3数据预处理
6.2样本创建的实现与分析
6.2.1 K值的选择
6.2.2实现初始样本建立
6.2.3实现动态样本建立
6.3查询性能分析
6.3.1个性化交互式查询
6.3.2该系统与精确查询的比较
6.4个性化服务性能分析
6.5单节点与集群性能的比较
6.6本章小结
第7章总结与展望
7.1内容总结
7.2未来展望
参考文献
致谢
攻硕期间参加的项目及发表的论文
东北大学;