首页> 中文学位 >空间文本数据查询处理技术研究与实现
【6h】

空间文本数据查询处理技术研究与实现

代理获取

目录

第一个书签之前

展开▼

摘要

随着定位技术的广泛应用以及互联网的蓬勃发展,大量的文本数据融合了地理位置信息。如何快速从大量空间文本数据中获取用户感兴趣的对象近年来成为研究热点。现有的空间关键词查询处理技术存在如下不足和局限性:对于多个用户共同提出的空间关键词查询,无法返回满足所有用户需求的结果对象;处理用户偏好约束的空间关键词范围查询时,现有索引未考虑用户偏好属性导致查询效率低下;处理海量空间文本数据时查询处理的响应速度无法保证。针对现有算法的不足,本文从实际场景出发,研究高效的空间文本数据查询处理技术,主要研究内容如下: (1)传统空间关键词查询由单用户提出,包含一个查询位置和一组查询关键词。协同空间关键词top-k查询(TKCSKQ)返回离多个查询位置近、文本与多组查询关键词相关度高的top-k对象。针对TKCSKQ中多组查询关键词存在重复和近义关键词,设计了基于查询关键词权重的关键词相关度计算公式。对IR-tree索引进行了扩展,提出了支持近义关键词匹配的SKNIR-tree索引,并基于SKNIR-tree提出了高效的协同空间关键词top-k查询处理算法(TKCSK)。通过维护一个优先队列以及计算每个节点与查询的最小空间文本相关度以达到剪枝目的,快速查找结果对象。实验结果表明,TKCSK算法优于现有算法。 (2)针对现有面向空间关键词范围查询的索引未考虑用户偏好属性而导致剪枝性能和查询效率低的问题,提出了一种支持用户偏好属性、空间位置、关键词协同剪枝的混合索引BRPQ(Boolean Range with Preferences Query index)。并在此基础上,提出了一种高效的用户偏好约束的空间关键词范围查询处理算法。实验结果表明相比现有索引,BRPQ索引的构建时间平均减少13%、查询效率平均提升20%。 (3)对于海量空间文本数据,传统的索引结构和查询算法存在单机局限性,在存储能力和处理速度上满足不了用户的需求。针对这一问题,提出了基于HBase的空间关键词范围查询机制,设计了空间区域划分策略和rowkey同时索引空间信息与文本信息,从而支持空间关键词范围查询并行处理,且具有可扩展性。实验结果表明,提出的算法优于传统的单机算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号