首页> 中文学位 >数据流上aD-hoc查询的自适应处理
【6h】

数据流上aD-hoc查询的自适应处理

代理获取

目录

指导小组成员名单

摘要

第一章 绪论

1.1.引言

1.2.本文工作

1.3.本文组织结构

第二章 相关工作及研究背景

2.1.数据流与查询处理

2.1.1.数据流

2.1.2.数据流上的查询处理

2.2.自适应ad-hoc查询处理

第三章 查询计划索引和查询处理

3.1.问题描述和相关定义

3.2.系统框架介绍

3.3.查询计划索引Plan-X

3.3.1.流查询的语义构建块

3.3.2.索引结构

3.3.3.索引维护

3.3.4.索引查询

3.4.自适应更新算法AQU

3.4.1.Cost模型

3.4.2.Na?ve-AQu

3.4.3.AQU-1和AQU-2

3.5.本章小结

第四章 实验

4.1 实验环境和数据集

4.2 索引实验

4.2.1 索引的评估方法

4.2.2 存储空间的结果分析

4.2.3 查询效率的结果分析

4.3 自适应算法AQU实验

4.3.1 AQU评估方法

4.3.2 AQU算法的性能比较分析

4.3.3 AQU-1和AQU-2的性能比较分析

第五章 总结和将来工作

5.1 本文贡献

5.1.1 查询计划索引

5.1.2 查询计划更新权值模型

5.1.3 自适应查询计划更新的排序

5.2 将来工作

参考文献

攻读学位期间作者的研究成果

致谢

声明

展开▼

摘要

在以查询计划为执行模型的数据流持续性查询处理中,大多数的自适应方法假设查询是预先确定的,因此可以进行全局性的查询计划优化。与预定义查询不同的是,在实际应用场景中需要对ad-hoc查询的支持。例如对于高速到达的股票数据流,分析人员会针对市场动态即时提交一些流查询来对最新的数据流进行处理和分析以验证自己的判断。数据流上的ad-hoc查询的自适应处理需要及时将查询语义更新到现有的查询计划中以保证已有查询计划的快速在线更新和迁移,同时能自适应不断到达的查询,防止对已有查询计划的结构性破坏。已有的方法实现新旧查询计划的更新需要大量的滑动窗口状态转换工作而耗时较长,无法保证较快的查询响应。
  为了解决ad-hoc查询的自适应问题,本文首先提出层状查询计划索引来收集已有查询计划的中间算子输出数据流的分布特性,新的查询若能直接复用已有算子是查询计划增量更新的关键,该索引能即时返回查询所能匹配的中间算子及其置信度。然后,根据查询计划评分模型来对索引返回的算子集合进行筛选,计算出能形成最优查询计划的算子集合并物化到已有的查询计划中,完成查询计划的增量更新。实验表明,本文提出的自适应方法在内存使用程度和响应延迟上都是优于其它方法的。

著录项

  • 作者

    黄浩;

  • 作者单位

    复旦大学;

  • 授予单位 复旦大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 杨卫东;
  • 年度 2013
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    数据流; Ad-hoc查询; 自适应算法; 分布特性;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号