首页> 中国专利> 基于多样性的地理空间兴趣点检索方法

基于多样性的地理空间兴趣点检索方法

摘要

本发明公开了基于多样性的地理空间兴趣点检索方法,以期要得到前k个空间位置,方法的实现步骤如下:步骤一:对于给定的位置点或位置点与关键词的组合进行初始化排序;步骤二:根据选择的分数最高的节点所在的地理位置对其他节点进行地理空间的削弱;步骤三:当不满足结束条件时,选择新节点;综上,计算出R中剩余节点通过对文本和空间的削弱后的新的分数,再从中选出分数最高的节点。最终对用户所输入的位置点或位置点与关键词的组合,运用算法得到前k个空间位置,再根据文本与空间位置所占的权重返回给用户k条最全面的信息。

著录项

  • 公开/公告号CN106649846A

    专利类型发明专利

  • 公开/公告日2017-05-10

    原文格式PDF

  • 申请/专利权人 北京工业大学;

    申请/专利号CN201611254804.X

  • 发明设计人 才智;李彤;兰许;曹阳;丁治明;

    申请日2016-12-30

  • 分类号G06F17/30;

  • 代理机构北京思海天达知识产权代理有限公司;

  • 代理人沈波

  • 地址 100124 北京市朝阳区平乐园100号

  • 入库时间 2023-06-19 02:06:38

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-12-20

    授权

    授权

  • 2017-06-06

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20161230

    实质审查的生效

  • 2017-05-10

    公开

    公开

说明书

技术领域

本发明属于数据挖掘领域,涉及一种基于多样性的地理空间兴趣点检索方法。

背景技术

近年来,由于移动设备(如智能手机)上全球定位系统GPS的普及,基于位置的服务(LBS)得到了学术界和工业界的广泛关注。很多基于位置的服务都得到了普及和应用,带给了用户位置相关的检索体验。

现有的LBS系统采用关键词检索的方式帮助用户从空间数据库中找到位置相关的结果。具体来说,假设空间数据库中有一组兴趣点(POI点),其中每个POI点都包含位置信息和一定的文本信息。给定用户的位置和一组查询关键词,LBS系统返回从空间和文本上都与查询相关的POI点。但是现在大多数的LBS系统只是从数据库中直接抽取分数排名前k条的信息,为了弥补没有全面的考虑空间位置的不足,本发明提出一种对文本和空间都进行削弱的算法,使得到最终结果尽可能的包含每一个方向上。

该技术引入了元组集合(Object Summaries,缩写为OS),它是在包含位置信息和一定的文本信息的空间数据库中生成的基于空间位置和文本的信息元组的集合。一个OS可以是以包含给定文本信息和空间位置的数据元组为根,以空间位置和文本的信息的相邻节点为它的子孙节点的树形结构。为了生成OS,一是要拥有关于查询数据主体(DataSubjects,缩写为DS)信息的关系,把这个关系简写为RDS,即是树形结构的根;另一个需要与RDS链接的关系,也就是生成RDS的子孙。对于每个RDS来说都能够形成一个DS模式图,也就是GDS。此技术是根据生成的OS来不断地进行剪枝优化最终得出重要的信息。

一个完整的OS中可能有成千上万条元组信息,将这些信息全部列举出来不但会消耗更多的时间,而且对用户在其中选取对自己来说有用的信息也是非常困难的,所以选择选取k条最有用的元组信息;对输入的自然数k,将在整个的OS中运用算法(详见步骤3.3)得到k条较全面的信息,为了避免多条相似的信息重复出现,使这k条信息能够在最大限度上呈现给用户更多样化的信息,使用户能够更全面的了解信息,本发明引入空间多样性和文本与空间所占权重两种权衡信息重要性的方法。这种方法不仅能够大大减少时间的消耗,提高返回信息的效率,而且能够满足用户对搜索信息的多样化需求,使得到的空间位置点不仅仅只偏向某一方位。

发明内容

本发明的目的在于提供一种基于多样性的地理空间兴趣点检索方法,对用户所输入的位置点或位置点与关键词的组合,运用算法得到前k个空间位置,再根据文本与空间位置所占的权重返回给用户k条最全面的信息。

为实现上述目的,本发明采用的技术方案为基于多样性的地理空间兴趣点检索方法,以期要得到前k个空间位置,方法的实现步骤如下:

步骤一:对于给定的位置点或位置点与关键词的组合进行初始化排序;

步骤1.1:收集并整理数据集,构建数据关系。这时定义有向图G(V,E),其中V(v1,...,vn)是节点(顶点)集,这里的节点代表各类信息,E是代表边(弧)的集合,E={<vi,vj>|vi,vj∈V},<vi,vj>表示从vi到vj的一条边(弧),v1,...,vn代表有向图中的任意节点,这里n为自然数;

步骤1.2:通过以下公式来计算R中每个节点vi的分数:

DF(vi)=[fs(vi)*ds(vi)]as*[ft(vi)*dt(vi)]at*[fg(vi)*dg(vi)]ag>

其中fs(.),ft(.),fg(.)分别为社会(social)参数,文本(textual)参数以及地理(geographical)参数的分数,ds(.),dt(.),dg(.)分别为对应的多样性分数,as、at、ag的和为1,用于控制每个参数影响。

通过以下公式来计算多样性分数:

其中ss(vi,vj)是vi和vjsocial参数的不同,使用Jaccard距离计算同上,计算dt(.)和dg(.)的值。

综上,迭代计算出数据集中各个节点的分数,并且选择节点中分数最高的节点v0

步骤二:根据选择的分数最高的节点所在的地理位置对其他节点进行地理空间的削弱;

步骤2.1:根据步骤一中选择的分数最高的节点对其他顶点进行关联关系的削弱的同时也进行地理空间的削弱,假设分数最高节点v0的位置点到初始位置点p的距离为d(p,v0),初始位置点到其他节点的距离为d(p,vi),v0到其他节点的距离为d(v0,vi),则通过以下公式来计算地理空间值:

从公式3中可知,d(v0,vi)即v0到其他节点的距离越大,所求的地理空间值越大,说明节点vi与已选择的节点距离越大,两个节点在空间上的方向也就不同。

综上,依次计算出所选节点到其余剩余节点的地理空间值di

步骤三:当不满足结束条件时,选择新节点;

步骤3.1:假设对关联关系削弱后的结果为a,文本所占权重为α,则剩余节点削弱后的文本值为a×α;

步骤3.2:假设对空间所占权重为β,其中α+β=1,则剩余节点削弱后的空间值为d×β;

步骤3.3:通过以下公式来计算剩余节点对文本和空间进行削弱后的分数:

DF′(vi)=DF(vi)×(a×α+d×β)>

综上,计算出R中剩余节点通过对文本和空间的削弱后的新的分数,再从中选出分数最高的节点。所以选出k个结果的过程为:

1.)初始化队列Hk为空,输入位置点或位置点与关键词的组合;

2.)根据输入信息,构建数据关系;

3.)计算每一个节点的分数;

4.)得到分数最高的节点加入Hk中,l=1;

5.)当l<k时转6.),否则转9.);

6.)根据已所选的节点进行关联关系的削弱,并计算di值;

7.)根据文本和空间的削弱和所占权重,计算新的分数;

8.)得到分数最高的节点加入Hk中,l++,转5.);

9.)返回队列Hk

此时返回的Hk即所需的将要检索到的k条信息。

经实验结果证明,本方法得到的实验效果显著。

附图说明

图1为本发明方法的实施流程图。

图2为检索结果信息的空间位置示意图

具体实施方式

下面结合相关附图1-2对本发明所涉及的方法进行解释和阐述:

步骤一:对于给定的位置点或位置点与关键词的组合进行初始化排序;

根据公式(1)计算数据集各个节点的初始值。

假设给定位置点为“天安门广场”,关键词为“大学”,k=5,根据公式计算初始分数,结果如表1所示:

表1 13个节点的初始化分数

节点分数中央戏剧学院9.5中央音乐学院9北京财贸职业学院8.7北京师范大学北校区8.1中国佛学院7.5中国协和医科大学护理学院7.3中国伊斯兰教经学院6北京教育学院宣武分院5.8北京交通大学5.3北京工业大学5中央财经大学4.6中国中医科学院3中国政法大学2

步骤二:根据选择的分数最高的节点所在的地理位置对其他节点进行地理空间的削弱;

步骤2.1:根据步骤一中选择的分数最高的节点对其他顶点进行关联关系的削弱;

选取分数最高的节点“中央戏剧学院”,根据“中央戏剧学院”与其他节点的关联关系进行削弱,结果如表2所示。

步骤2.2:计算出各节点的空间值;

根据“天安门广场”到各节点的距离(如表3所示)和“中央戏剧学院”到剩余节点的距离(如表4所示)可以计算出各节点的空间值,其中

表2 根据“中央戏剧学院”与其他节点的关联关系削弱结果

节点关联关系削弱中央音乐学院0.255北京财贸职业学院0.538北京师范大学北校区0.435中国佛学院0.856中国协和医科大学护理学院0.801中国伊斯兰教经学院0.756北京教育学院宣武分院0.522北京交通大学0.373北京工业大学0.689中央财经大学0.617中国中医科学院0.493中国政法大学0.345

表3 “天安门广场”到节点的距离

节点距离(km)中央戏剧学院3.69中央音乐学院3.27北京财贸职业学院3.08北京师范大学北校区3.78中国佛学院3.22中国协和医科大学护理学院2.08中国伊斯兰教经学院3.30北京教育学院宣武分院3.23北京交通大学7.05北京工业大学7.87中央财经大学7.84中国中医科学院4.65中国政法大学7.78

表4 “中央戏剧学院”到剩余节点的距离

节点距离(km)中央音乐学院5.40北京财贸职业学院2.24北京师范大学北校区1.18中国佛学院5.72中国协和医科大学护理学院3.09中国伊斯兰教经学院6.58北京教育学院宣武分院6.90北京交通大学5.53北京工业大学9.66中央财经大学1.97中国中医科学院5.80中国政法大学5.39

步骤三:当不满足结束条件时,选择新节点

假设文本和空间所占的权重值α=β=0.5,所以根据式(1)、(2)、(3)求得新的分数,例如DF’(中央音乐学院)=9×(0.5×0.255+0.5×0.729)=4.428,DF’(北京财贸职业学院)=8.7×(0.5×0.538+0.5×0.331)=3.780结果如表5所示:

表5 选择“中央戏剧学院”节点后新的分数结果

节点分数中央音乐学院4.428北京财贸职业学院3.780北京师范大学北校区2.402中国佛学院6.315中国协和医科大学护理学院5.034中国伊斯兰教经学院5.091北京教育学院宣武分院4.405北京交通大学2.353北京工业大学3.813中央财经大学1.812中国中医科学院1.782中国政法大学0.185

根据表5的结果得到分数最高的节点“中国佛学院”,现在得到了两个节点“中央戏剧学院”和“中国佛学院”,因为2<k=5,继续根据算法求得4个节点。

在选择“中国佛学院”后剩余节点的新的分数结果如表6所示:

表6 选择“中国佛学院”节点后新的分数结果

节点分数中央音乐学院1.242北京财贸职业学院2.767北京师范大学北校区1.546中国协和医科大学护理学院4.367中国伊斯兰教经学院1.392北京教育学院宣武分院1.821北京交通大学1.320北京工业大学2.926中央财经大学1.242中国中医科学院1.295中国政法大学0.477

根据表6的结果得到分数最高的节点“中国协和医科大学护理学院”,剩余节点的新的分数结果如表7所示:

表7 选择“中国协和医科大学护理学院”节点后新的分数结果

节点分数中央音乐学院0.738北京财贸职业学院0.876北京师范大学北校区0.843中国伊斯兰教经学院1.027北京教育学院宣武分院1.216北京交通大学0.725北京工业大学1.719中央财经大学0.806中国中医科学院0.520中国政法大学0.256

根据表7的结果得到分数最高的节点“北京工业大学”,剩余节点的新的分数结果如表8所示:

表8 选择“北京工业大学”节点后新的分数结果

节点分数中央音乐学院0435北京财贸职业学院0.493北京师范大学北校区0.523中国伊斯兰教经学院0.613北京教育学院宣武分院0.580北京交通大学0.394中央财经大学0.645中国中医科学院0.261中国政法大学0.136

根据表8的结果得到分数最高的节点“中央财经大学”,现在l=5=k,即得到5条信息,“中央戏剧学院”,“中国佛学院”,“中国协和医科大学护理学院”,“北京工业大学”,“中央财经大学”其具体空间位置如图2所示:图2为检索结果信息的空间位置示意图。根据图2可以看出检索到的5条信息覆盖了“天安门广场”周边的各方向,没有局限某一个方向。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号