首页> 中国专利> 基于移动轨迹中停留点的用户群体行为规律检测方法

基于移动轨迹中停留点的用户群体行为规律检测方法

摘要

本发明公开了一种基于移动轨迹中停留点的用户群体行为规律检测方法,该方法首先接收来自数据采集器的多用户轨迹数据;其次从轨迹数据中提取停留地点序列,并将其变换为代表用户日程行为的地点偏好向量;然后提取日程行为向量,并利用加权平均法计算日程行为模式向量;最后基于日程行为模式计算用户间相似度,采用Kmeans聚类算法检测用户群体的行为规律模式。本发明采用基于停留点的日程行为模式计算用户间相似度,解决了用户停留区域不重叠的问题,可有效检测到用户群体的行为规律模式。

著录项

  • 公开/公告号CN106339417A

    专利类型发明专利

  • 公开/公告日2017-01-18

    原文格式PDF

  • 申请/专利权人 浙江大学;

    申请/专利号CN201610668942.6

  • 发明设计人 贾晓霞;程鹏;陈积明;

    申请日2016-08-15

  • 分类号G06F17/30(20060101);G06K9/62(20060101);

  • 代理机构33200 杭州求是专利事务所有限公司;

  • 代理人邱启旺

  • 地址 310027 浙江省杭州市西湖区浙大路38号

  • 入库时间 2023-06-19 01:24:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-10-01

    授权

    授权

  • 2017-02-15

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20160815

    实质审查的生效

  • 2017-01-18

    公开

    公开

说明书

技术领域

本发明涉及一种用户群体行为规律检测方法,更具体地说,涉及一种基于移动轨迹中停留点的用户群体行为规律检测方法。

背景技术

近年来,利用轨迹数据挖掘用户行为规律受到了越来越多的关注。长期的行为规律反映了用户的生活习惯,是一种高层次的上下文信息,可帮助位置感知应用更好地适应其用户的需求。例如,推荐系统可根据用户行为规律向其推荐朋友、地点或其它位置相关信息。信息推送系统可向具有相似生活规律的用户推送和分享相关信息。

基于加速度传感器等检测的用户短期行为(如吃饭、散步等),无法反映其长期的行为规律和生活习惯;基于相似访问地点序列计算用户行为相似度的方法,由于依赖于不同用户停留区域的交叠,无法对无访问交叠的用户(如生活在不同城市的用户)相似度进行度量;基于反向地理编码技术将用户的物理轨迹转化为语义轨迹,然后从语义轨迹中提取出序列模式,基于最长语义轨迹模式度量用户行为相似度的方法,虽然解除了对用户访问区域交叠的限制,但其局限于对用户短期运动行为的分析,并且用户访问地点的个性化语义(如家、工作地点等)无法通过反向地理编码得到;而且用户行为具有多样性和复杂性,单靠数据很难把握其趋势和规律性。因此,关于利用轨迹数据有效挖掘及展示用户行为,计算用户行为相似度进而检测用户群体行为规律的技术有待深入研究与探讨。

发明内容

本发明的目的在于针对现有技术的不足,提供一种基于移动轨迹中停留点的用户群体行为规律检测方法,本发明能够有效地度量用户行为相似度,检测用户行为规律。

本发明的目的是通过以下技术方案来实现的:一种基于移动轨迹中停留点的用户群体行为规律检测方法,该方法包括以下内容:

步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;

步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,即用户在某个区域内停留时间超过一定阈值,则该区域视为一个停留地点;

步骤3,将用户每天的停留地点序列转换为地点偏好向量V1×24,该向量代表用户一天的日程行为,向量中的元素v1t表示在t时刻用户的停留地点标号;

步骤4,对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间长短,并计算得到日程行为向量A1×4,向量中的元素a1×i分别表示停留时间超过5小时、3小时、1小时、0小时的停留点个数;

步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量,并采用加权平均法计算日程行为模式向量R1×4,向量中元素r1×i表示用户平均每天各个停留时间段的停留点的个数;

步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,并以日程行为模式向量为特征,利用欧式距离计算用户间行为相似度,采用Kmeans算法对用户进行聚类,得到用户群体的行为规律模式。

本发明所述的基于移动轨迹中停留点的用户群体行为规律检测方法,可挖掘用户的长期行为规律,度量无区域交叠的用户行为相似度。与现有技术相比,本发明具有如下技术效果:

1、由于用户每天大部分时间在某些地点停留,所以本发明从停留地点的角度表示用户行为,可以挖掘用户长期行为规律和生活习惯,具有更强的实际应用价值;

2、本发明不基于停留地点的地理空间特征度量用户相似度,因此可以度量无停留区域交叠的用户间行为的相似度,进而检测用户群体行为规律,适用范围广;

3、本发明不涉及反向地理编码技术将用户的地理轨迹转化为语义轨迹,可以解决停留地点的个性化语义(如家、工作地点等)无法得到的问题,检测的准确率更高;

附图说明

图1是停留地点检测流程图;

图2是用户群体行为规律检测流程图;

图3是表示用户群体行为规律的折线图。

图4是表示用户群体行为规律的折线图。

图5是表示用户群体行为规律的折线图。

图6是表示用户群体行为规律的折线图。

具体实施方式

以下结合附图对本发明作进一步详细说明。

如图2所示,本发明给出了一种基于移动轨迹中停留点的用户群体行为规律检测方法,本发明所述的检测方法,包括以下步骤:

步骤1,接收来自数据采集器的多个用户的多天的移动轨迹数据;

步骤2,针对每个用户,采用基于时间和空间的停留点检测方法从轨迹数据中提取停留地点,如图1所示,其中Ts为时间阈值,Ds为距离阈值,i,j为定位点编号,N为轨迹点个数。当用户在某个区域内停留时间超过一定阈值时,则该区域视为一个停留地点。首先给定时间阈值为Ts,空间阈值为Ds,i从第一个定位点开始,计算下一个定位点j与i之间的距离,若小于空间阈值Ds,则j转移到下一个定位点,否则计算j与i之间的时间间隔,若小于时间阈值Ts,则i转移到第i+1个定位点开始新一轮的检测,否则检测到一个停留点,该停留点的位置为i~j之间的点的中心位置,并且i转移到定位点j开始新一轮的检测,直到i为最后一个定位点。这样就将轨迹数据转化为停留点序列;

步骤3,由于一般用户每天大部分时间在某些地点停留,其某一天的行为可被看作是不同时间段在不同地点的停留,因此将一天划分为24个小时,将用户每天的停留地点序列转换为地点偏好向量该向量代表用户k一天的日程行为,向量中的元素v1t表示用户k在t时刻的停留地点标号;

步骤4,由于用户一天的行为可抽象化为在多少个地点停留以及各个地点的停留时间长短,因此对得到的地点偏好向量进行统计分析,得到每个停留地点的停留时间,并计算得到日程行为向量向量中的元素a1i分别表示用户k一天内停留时间超过5小时、3小时、1小时、0小时的停留地点个数;

步骤5,对用户每天的停留点序列重复步骤3-4,得到用户每天的日程行为向量。由于用户长期的行为规律可看作用户每天行为的平均,因此对得到的日程行为向量采用加权平均法计算日程行为模式向量向量中元素r1×i表示用户k平均每天各个停留时间段的停留点的个数;

步骤6,对所有用户的轨迹数据重复步骤2-5,得到每个用户的日程行为模式向量,以日程行为模式向量表示每个用户的长期行为规律;

步骤7,以得到的日程行为模式向量为特征,利用欧式距离计算两两用户间行为相似性,向量Rm、Rn分别表示用户m、n的日程行为模式向量,并采用Kmeans算法对用户进行聚类,得到用户的行为规律模式。

本发明所述检测方法采取的技术方案是:对接收到的多个用户的轨迹数据进行停留点检测,然后针对每个用户,将停留点序列变换为地点偏好向量,并提取日程行为向量,采用加权平均的方法得到日程行为模式向量,最后使用Kmeans聚类算法检测用户群体的行为规律。

本发明中停留点检测方法的时间阈值和空间阈值可根据轨迹数据类型与实际应用需求进行设置,因此可适应不同的应用场景。

本发明的效果可以通过以下实际的实验来验证:

本发明收集了某市区211辆电动自行车5个星期的轨迹数据,数据包含电动车编号ID、时间timestamp、经度longitude、纬度latitude。

图3-6展示了表示用户群体行为规律模式的折线图。图中横坐标表示停留时间长短,纵坐标表示停留点个数。从图中可看出,实验中的211个用户的行为规律可分为四类,各类间差异性大而同一类内差异性小。图3表示的用户群体,其行为规律为一天中停留点个数较多,而且停留时间差异较大;图4表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为2个,其余停留时间范围内的停留点个数很少,该类用户可推断为有固定工作地的上班族;图5表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为1个,并且其余停留时间范围内的停留点个数很少,该类用户可推断为绝大部分时间停留在居住地且很少出行的用户;图6表示的用户群体,其行为规律为一天内停留时间超过5个小时的停留点个数大约为1个,并且停留时间低于3小时的停留点个数也大约为1,该类用户可推断为除居住地外,每天会去某个地方,但停留时间较短。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号