首页> 中国专利> 一种地理敏感动态社交环境下用户访问位置的预测方法

一种地理敏感动态社交环境下用户访问位置的预测方法

摘要

本发明公开了一种地理敏感动态社交环境下用户访问位置的预测方法,该方法包括如下步骤:首先,对移动社交网络用户活动区域进行网格划分;其次,计算社交好友的影响力隐含表示;再次,对用户的隐含访问偏好进行动态更新;然后,将位置预测问题视作多分类问题,求得用户下一个访问位置的概率分布;针对构建的循环神经网络模型构造损失函数并进行模型优化,获得模型的优化参数;最后,根据模型计算用户的下一次移动行为针对不同候选位置的访问概率,按照概率值降序排序得到预测结果列表。本发明方法兼顾了地理敏感性与动态性特征,能够对地理敏感社交环境下的用户下一个访问位置进行有效预测。

著录项

  • 公开/公告号CN113010803A

    专利类型发明专利

  • 公开/公告日2021-06-22

    原文格式PDF

  • 申请/专利权人 南京航空航天大学;

    申请/专利号CN202110578856.7

  • 发明设计人 胥帅;许建秋;关东海;

    申请日2021-05-26

  • 分类号G06F16/9536(20190101);G06F16/9537(20190101);G06Q50/00(20120101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构37283 青岛锦佳专利代理事务所(普通合伙);

  • 代理人朱玉建

  • 地址 211106 江苏省南京市江宁区将军大道29号

  • 入库时间 2023-06-19 11:32:36

说明书

技术领域

本发明涉及一种地理敏感动态社交环境下用户访问位置的预测方法。

背景技术

移动社交网络具有社会化、本地化和移动性等信息服务特征,其产生的海量位置轨迹数据记录了人们在真实物理世界的移动过程,反映了人们的生活与出行习惯,蕴含了极为丰富的时空语义信息。在分析挖掘移动社交网络用户位置轨迹的基础上预测用户未来的访问位置,不仅能为活动推荐与商品精准化营销带来价值,还有助于构筑智慧交通与智慧城市,因而,具有重要的现实与社会意义。基于用户位置预测衍生出的位置服务,将成为我国数字产业化高质量发展的重要支撑,有利于促进信息技术与实体经济在更深层面上融合。

社交关系是移动社交网络的固有属性,好友用户之间往往拥有一致的访问偏好,依据社交从众性理论,用户的移动行为都显式或隐式地受到好友影响,因此,对好友位置轨迹的合理利用能够强化用户访问位置的可预测性。现有技术方案多从统计角度量化好友关系对用户未来移动行为的影响,并未考虑用户在网络中的时序交互行为,因此,难以用于移动社交环境下的好友动态交互建模。当前,针对社交因素的探索主要面向在线社会化推荐场景,移动社交网络中的好友交互机制与社会化推荐场景截然不同,根本区别在于用户是否在现实世界与物品发生交互行为。在线社会化推荐(如书籍、电影推荐)场景中,人们在线上的行为不受地域空间限制,社交因素对用户行为的影响能够得到清晰的体现。

然而,在线下物理空间人们的活动范围受地域限制,即使是兴趣偏好一致的线上好友也难以对用户的移动行为产生实质影响,受制于地理距离,用户难以访问线上好友造访过的位置。相关统计结果指出,移动社交网络中超过50%的社交好友之间不存在共同访问的位置,这意味着传统的统计方法和神经网络模型难以深入刻画移动社交环境下的社会影响力传播。

总体上,现有技术方案是将社交因素视作静态权重或固定因素,将其集成至预测模型以提升预测准确性。然而,就移动社交网络中的社交影响力而言,由于好友用户的位置轨迹在逻辑上彼此交织,并且随着轨迹延伸相互激励,因此,兼具地理敏感性与动态性特点,而动态变化的社交影响力,相比静态社交影响力更难建模,因此,如何能够融入地理敏感的动态社交影响力,以预测用户的未来访问位置是本发明需要解决的重要问题。

发明内容

本发明的目的在于提出一种地理敏感动态社交环境下用户访问位置的预测方法,兼顾了地理敏感性与动态性特征,能够对地理敏感社交环境下的用户下一个访问位置进行有效预测。

本发明为了实现上述目的,采用如下技术方案:

一种地理敏感动态社交环境下用户访问位置的预测方法,包括如下步骤:

步骤1. 对移动社交网络用户活动区域进行网格划分;

首先将用户活动区域进行网格化处理,划分为多个大小相等的正方形网格单元,网格单元的地理坐标使用正方形区域的中心坐标表示;

将用户签到记录集合中的签到位置与所属网格单元一一对应,此时,每个网格单元内所有的兴趣点均以该网格单元表示,用户的签到位置以正方形网格的形式呈现;

步骤2. 计算社交好友的影响力隐含表示;

将用户签到记录集合按时间顺序依次输入循环神经网络架构;

在时刻t,根据用户与好友间的地理距离计算地理系数,利用线性函数将地理系数与好友的隐含状态进行加权聚合,得到用户的社交好友在t时刻隐含状态的线性聚合;

然后利用非线性函数对线性聚合进行激活,得到此时社交好友的影响力隐含表示;

步骤3. 对用户的隐含访问偏好进行动态更新;

在t+1时刻,利用循环神经网络隐藏层对用户的隐含访问偏好进行动态更新;

其更新过程为:融合用户在t时刻的隐含访问偏好、t时刻社交好友的影响力隐含表示以及用户在t+1时刻的位置向量,利用循环神经网络隐藏层计算t+1时刻用户的隐含访问偏好;

步骤4. 对循环神经网络模型进行模型训练;

将用户访问位置预测问题视作分类问题,求得用户下一个访问位置的概率分布;

在此基础上,构建循环神经网络模型的目标函数,通过最小化目标函数来优化循环神经网络模型的模型参数,进而获得训练好的循环神经网络模型;

步骤5. 对用户的下一个访问位置进行预测;

在步骤4的基础上,为预测用户的下一个访问位置,利用训练好的循环神经网络模型,针对每一个候选位置计算该用户的访问概率,对所有候选位置的访问概率降序排序;

最后,选取top-K概率值对应的候选位置形成有序列表作为预测结果。

优选地,步骤2具体为:

定义t时刻用户u

r

定义t时刻用户u

其中,Ni为用户u

随后,对H

其中,函数φ(·)表示非线性激活函数。

优选地,步骤3具体为:

在t+1时刻,循环神经网络的输入变量不仅包括用户u

定义t+1时刻用户u

h

其中,函数GRU(·)表示门控形式的循环神经网络的计算单元,⊕表示拼接操作。

优选地,步骤4具体为:

定义用户u

P(v

其中,v

v

P(v

给定t时刻之前用户u

W表示用于分类的权重矩阵,W

构建目标函数,全体用户签到集合的负对数似然损失函数Loss表示为:

其中,P(v

给定t时刻之前用户u

L

利用自适应矩估计算法对损失函数Loss最小化,完成梯度下降的自主步长学习,获得循环神经网络模型的模型参数,得到训练好的循环神经网络模型。

优选地,步骤5具体为:

步骤5.1. 针对目标用户u

其中,P(v

步骤5.2. 对所有候选位置的访问概率降序排序;

步骤5.3. 选取top-K概率值对应的候选位置,形成有序列表作为最终的预测结果。

本发明具有如下优点:

如上所述,本发明述及了一种地理敏感动态社交环境下用户访问位置的预测方法,该方法针对好友用户之间耦合的签到行为进行时序建模,在任意时刻通过一种新颖的“社交池化”结构聚合好友的隐含状态,从而模拟真实场景下的动态社交互动激励,由于兼顾了地理敏感性与动态性特征,本发明能够对地理敏感社交环境下的用户下一个访问位置进行有效预测。

附图说明

图1为本发明实施例中地理敏感动态社交环境下用户访问位置的预测方法的流程图;

图2为本发明方法解决的用户访问位置预测问题示意图;

图3为本发明实施例中的网格划分示意图;

图4为本发明实施例中地理敏感动态社交环境下用户访问位置的预测方法的总体框图。

具体实施方式

下面结合附图以及具体实施方式对本发明作进一步详细说明:

本实施例述及了一种地理敏感动态社交环境下用户访问位置的预测方法,以便对地理敏感社交环境下的用户访问位置进行有效预测。

在对本发明方法进行详细说明之前,首先给出如下定义或说明。

用户在移动社交网络中的签到记录集合,通过公开的接口程序(API)进行抓取,每一次签到记录均由用户、签到时间以及签到位置(即兴趣点)三个要素构成。

在获取用户签到记录集合的基础上,本发明融合地理距离和社交关系,使用户的隐含访问偏好由自身移动模式、好友移动行为、好友与用户的地理距离三个因素共同决定。

由于不同用户之间的隐含访问偏好,随着移动轨迹的延伸互相影响、逐步更新,最终,使得本发明能够实现多名用户下一次移动行为的访问位置预测。

为了方便说明,针对地理敏感动态社交环境下用户访问位置预测问题给出如下定义:

定义U为已知的移动社交网络用户集合,V表示位置集合,L

本发明所要解决的技术问题可以通过图2进行说明。假设用户1与用户2、用户4、用户5为社交好友,每名用户都拥有自己的签到记录集合,反映自身的生活与出行习惯。

就用户1而言,已知用户1在t

用户1下一次移动行为的访问目的地不仅应考虑用户1自身的移动行为模式(如图2中实线箭头

假设用户2和用户5距离用户1较近,那么用户2和用户5的移动行为应对用户1的下一次移动行为的访问目的地具有较大的影响力(如图2中实线箭头

假设用户4距离用户1较远,那么用户4的移动行为应对用户1的下一次移动行为的访问目的地具有较小的影响力(如图2中虚线箭头

真实情况下,每名用户在每个时刻的移动行为均可能受到社交好友的影响,本发明实施例中将这种好友用户间移动行为的相互影响,称为动态社交互动激励。

本发明基于移动社交网络用户与好友间的地理距离以及好友的隐含状态,对用户即时的隐含访问偏好进行动态更新,在此基础上以分类的方式实现用户下一个访问位置预测。

具体的,如图1所示,该预测方法包括如下步骤:

步骤1. 考虑到好友之间共享的签到位置极度稀疏,绝大多数好友甚至没有共同访问的兴趣点,因此,如果直接利用社交关系预测用户下一个访问位置一定程度上欠缺合理性。

基于此,本发明方法提出对用户活动区域进行网格划分,利用形状规则、大小合适的正方形区域作为用户的访问位置,如图3所示。具体划分过程如下:

首先将用户活动区域进行网格化处理,划分为多个大小相等的正方形网格单元,网格单元的地理坐标使用正方形区域的中心坐标表示。

将用户签到记录集合中的签到位置与所属网格单元一一对应,此时,每个网格单元内所有的兴趣点均以该网格单元表示,用户的签到位置以正方形网格的形式呈现。

以图3为例说明,假设用户u’依次访问过位置v

通过将兴趣点粒度的位置预测问题转化为区域粒度的位置预测问题,利于提升基于社交关系预测用户未来移动行为的合理性和可操作性。

图3展示了移动社交网络用户活动区域划分的示意图,每个网格单元A

在上述网格划分的基础上,用户访问过的位置(即签到位置),均能够以正方形区域的形式在图3中呈现。真实场景下,社交好友之间由适当大小的正方形网格所构成的签到位置序列存在一定比例的重叠,好友之间针对相同区域不同兴趣点的访问行为很大程度上具有相似的时空语义,此时,基于社交关系预测用户未来访问位置具有更大的合理性。

步骤2. 基于用户和好友之间的地理距离,计算社交好友的影响力隐含表示。

为刻画地理敏感的动态社交互动激励,本发明提出一种新颖的循环神经网络架构,如图4所示,该架构针对每名用户的签到集合使用循环神经网络进行时序建模。

对于用户访问过的每个位置v,依据神经嵌入思想,将该位置v嵌入d维连续向量空间,得到其嵌入表示e

每一条循环神经网络运行一步后都会进行信息共享,通过地理敏感的“社交池化”结构将好友在此时刻的隐含状态(即好友的隐含访问偏好)进行加权聚合,在进行聚合的过程中,需要考虑此时刻用户与好友之间的地理距离影响。

为便于表述,定义h

在图4所示网络架构下,每名用户的下一个访问位置,将由用户自身以及好友的移动行为共同决定,并且用户与好友之间的地理距离越近,其受好友的影响程度越大。

在图4中,为了形象地表示这种地理敏感的“社交池化”结构,使用虚线框和Geo-Social Influence Aggregation(简记为GS-I-A)代表该过程。此外,本发明使用GRU单元作为循环神经网络架构的运算单元,其相比LSTM等运算单元具有更好的计算效率。

将用户u

每一个时刻根据用户与好友间的地理距离计算地理系数,利用线性函数将地理系数与好友的隐含状态进行加权聚合,得到用户的社交好友在t时刻隐含状态的线性聚合H

然后利用非线性函数对H

地理系数取值含义如下:t时刻用户与某好友之间的地理距离越大,此时,二人之间的地理系数越小,表明好友的签到行为对用户的影响程度越小,反之亦然。

在t时刻,需要计算用户u

其中,a表示平滑因子。在t时刻,依据图4所示的循环神经网络架构,需要将社交好友的隐含状态,依据地理系数进行线性聚合,得到H

将社交好友u

其中,Ni表示用户u

对H

由上述步骤2的过程能够得到,本发明方法兼顾了用户与好友之间的地理距离,以及用户的好友的隐含访问偏好,利用新颖的地理敏感的“社交池化”结构,将社交好友的隐含访问偏好进行加权聚合并激活,从而获得社交好友的影响力隐含表示。

步骤3. 对用户的隐含访问偏好进行动态更新。

如图4所示,在t+1时刻,利用循环神经网络隐藏层对用户在上一时刻,即t时刻的隐含访问偏好,进行动态更新,得到t+1时刻的用户隐含访问偏好。具体过程如下:

在t+1时刻,循环神经网络的输入变量不仅包括用户u

e

定义t+1时刻用户u

h

其中,函数GRU(·)表示门控形式的循环神经网络的计算单元,⊕表示拼接操作。

需要指出,GRU(·)计算单元在每一时刻包含两个输入变量,即e

步骤4. 对循环神经网络模型进行模型训练。

在步骤1-步骤3的基础上,将用户访问位置预测问题视作分类问题。

定义用户u

P(v

其中,v

P(v

给定t时刻之前用户u

W表示用于分类的权重矩阵,W

针对构建的带有“社交池化”结构的循环神经网络架构,本发明方法通过最小化负对数似然损失,来学习循环神经网络模型的模型参数。具体过程如下:

设用户u

其中,P(v

给定t时刻之前用户u

其中,t∈[1,|L

利用自适应矩估计算法对损失函数Loss最小化,完成梯度下降的自主步长学习,获得循环神经网络模型的模型参数,包括权重矩阵W,得到训练好的循环神经网络模型。

本发明述及的循环神经网络架构与传统循环神经网络相比,核心区别在于,多条循环神经网络(如图4中的用户5、用户1、用户2所示,三条循环神经网络)通过地理敏感的“社交池化”结构耦合,因此,模型训练阶段需要针对多个GRU单元执行梯度联合反向传播。

步骤5. 利用训练好的循环神经网络模型,对用户的访问位置进行预测。

步骤5.1. 针对目标用户u

其中,P(v

P(v

步骤5.2. 对所有候选位置的访问概率降序排序;

步骤5.3. 选取top-K概率值对应的候选位置,形成有序列表作为最终的预测结果。

从图4的框架图能够得到,在移动社交网络中,每名用户的位置轨迹是彼此耦合的,他们在每一个t时刻的访问位置是彼此关联、互相影响的,因此,本发明方法不仅能预测某一个用户的下一个访问位置,还能预测跟他关联的多个好友的下一个访问位置。

综上,本发明方法能够同时实现针对多名用户的下一个访问位置的预测。

以图4中的三名用户为例,依次记三名用户为u

当然,以上说明仅仅为本发明的较佳实施例,本发明并不限于列举上述实施例,应当说明的是,任何熟悉本领域的技术人员在本说明书的教导下,所做出的所有等同替代、明显变形形式,均落在本说明书的实质范围之内,理应受到本发明的保护。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号