Selectivity estimation of queries is an important and well-studied problem in relational database systems. In this paper, we examine selectivity estimation in the context of Geographic Information Systems, which manage spatial data such as points, lines, poly-lines and polygons. In particular, we focus on point and range queries over two-dimensional rectangular data. We propose several techniques based on using spatial indices, histograms, binary space partitionings (BSPs), and the novel notion of spatial skew. Our techniques carefully partition the input rectangles into subsets and approximate each partition accurately. We present a detailed experimental study comparing the proposed techniques and the best known sampling and parametric techniques. We evaluate them using synthetic as well as real-life TIGER datasets. Based on our experiments, we identify a BSP based partitioning that we call
查询的选择性估计是关系数据库系统中一个重要且经过充分研究的问题。在本文中,我们在地理信息系统的背景下研究了选择性估计,地理信息系统管理诸如点,线,折线和多边形之类的空间数据。特别是,我们专注于对二维矩形数据的点和范围查询。我们基于使用空间索引,直方图,二进制空间分区(BSP)和新颖的空间偏斜概念,提出了几种技术。我们的技术将输入矩形仔细地划分为子集,并精确地近似每个划分。我们提供了一项详细的实验研究,将建议的技术与最著名的采样和参数技术进行了比较。我们使用合成的和真实的TIGER数据集对它们进行评估。根据我们的实验,我们确定了基于BSP的分区,称为
机译:空间数据库管理系统空间选择性估计的通用累积环形桶直方图
机译:在小面积估算中合并两个数据库的挑战:使用儿童贫困的空间微观模拟的示例
机译:空间网络中范围查询的节点和边缘选择性估计
机译:空间数据库中选择性估计的自适应采样
机译:用于模糊空间数据的数据模型的设计,实现和数据库集成,是下一代空间数据库和地理信息系统的基础。
机译:比较Epithor临床国家数据库和药物管理数据库,以确定病例组合对医院离群值估计的影响
机译:基于直方图的选择性估算方法在时空数据库中
机译:时态数据库中的选择性估计。