首页> 中国专利> 一种基于手机信令数据的对外出行人群识别方法

一种基于手机信令数据的对外出行人群识别方法

摘要

本发明公开了一种基于手机信令数据的对外出行人群识别方法,包括以下步骤:S1、获取手机信令数据以及其对应的手机用户基本属性信息;S2、基于手机信令数据的人群出行相关特征提取;S3、基于手机信令数据界定对外出行行为并进行细化分类;S4、结合各类对外出行人群时空特征分布情况设计对外出行行为判别规则;S5、运用滑动窗口法对对外出行人群进行识别,获得用户对外出行状态。本发明不同于以往仅考虑单一目标人群的识别提取,本专利基于手机信令数据运用滑动窗口算法实现了不同类型对外出行人群分类与识别,并可降低调查成本与模型运算效率。

著录项

说明书

技术领域

本发明属于通讯领域,具体是一种基于手机信令数据的对外出行人群识别方法。

背景技术

通信与互联网技术的发展与普及应用,应运而生的是对其背后蕴藏的大量潜在信息的大数据的挖掘研究。据工信部统计,截止2015年底,全国手机用户已达12.86亿,手机普及率为每百人94.5部。手机信令数据以其内涵丰富、采样率高以及时效性好等优良特性吸引了大量学者的关注。然而手机信令数据出于保护隐私以及数据采集字段自身的一些局限性的缘故,很难获取准确的带有标签的样本信息,如出行者的类型属性以及出行方式,这将阻碍交通分析、交通规划等相关专题研究的进一步推进。

用户画像概念最初由交互设计之父Cooper提出,被用来作为一种交互式设计工具,以促进和巩固以用户为中心的设计思路。作为用户研究的重要组成部分,用户画像是实现以用户为中心的交互设计的重要工具。通过用户画像,设计团队在产品、服务设计过程中能时刻关注用户及其需求,从而与用户达成共识。在交通领域,出行者即为交通系统中的用户,通过对出行者进行用户画像研究即为人群类型识别,可以为交通规划中人口专题研究提供技术支持。构建用户画像的过程本质上是以短文本描述虚拟用户的过程,即把用户特征抽象成短语标签,其中每个组内的虚拟用户具有相似的目标、需求和行为等。这一描述过程中所涉及的短文本称为画像描述。现有研究中存在两类用户画像构建过程:一类是产品设计人员、运营人员根据用户需求从用户群体中抽象出典型用户;另一类是根据每个用户在产品、服务中的行为、观点等数据,生成描述用户的标签集合。前者得到的画像本质上是一个描述用户需求的工具,用于帮助不同设计人员在产品、服务设计过程中站在用户的角度去思考问题。而后者得到的画像本质上是一个标签化的用户模型,用于刻画用户意图。很显然,前者重定性分析而轻定量计算,后者重定量计算而轻定性分析。

现阶段,国内外对于对外交通或城际交通的研究主要集中在运用传统的数据调查采集方法对出行方式选择以及需求预测进行研究,只有较少的一部分学者开始考虑引入交通大数据以改进城市对外交通出行量采集方法。手机信令数据作为交通大数据的一种,以其高覆盖率、良好的时效性及丰富的内涵信息吸引了大量交通领域研究者的关注。在手机信令数据研究方面,已有相关学者将其应用于出行者的出行模式识别研究,而目前尚无研究者将其应用于对外出行人群识别。

目前,马春景等人公开了一种基于手机信令数据的流动人口识别方法。包括以下步骤:1)以每个用户作为研究单元,提取该用户一天的手机信令数据,并按时间顺序排列;2)将研究区域划分成中心城区、市域以及省域,对每个区域赋予属性值字段attribute;3)定义流动人口,然后根据手机信令数据在区域间的移动规律将流动人口进一步细化分类;4)根据区域间的移动规律制定流动人口的判别规则算法;5)利用Java编程实现不同类别的流动人口的识别与统计。该方案只提取了用户一天的手机信令数据,从空间分布的维度来识别流动人口,而忽略了时间维度对出行人群识别的影响。

发明内容

本发明针对“现有技术中对外出行人群识别统计方法主要为交通调查法,由于城市对外交通枢纽站及对外公路出入口之间的信息互通性较差,难以实时精准的获取城市对外出行交通量,因此多采取人工实地调查的方法对对外出行人群进行统计。而随着城市基础设施建设的不断完善,城市间的交流日益频繁,这种人工调查方法不仅成本较高,而且时效性较差,难以满足精细化研究的需求”的问题。本发明从交通大数据角度出发,通过手机信令数据提取人群出行相关特征以及用户基本属性信息,对对外出行行为进行界定与细化分类;然后根据各类对外出行人群的手机信令数据时空分布特征设计出判别规则;最后创建用户手机信令数据状态列表,并运用滑动窗口法对用户对外出行行为类型进行识别。利用交通大数据进行对外出行人群识别极大降低了交通量调查的成本,并增强了数据统计结果的实时性。同时,运用滑动窗口法可在深入挖掘用户手机信令数据时空分布特征的基础上大幅降低模型计算复杂度,减少计算时间成本。

技术方案:

本发明公开了一种基于手机信令数据的对外出行人群识别方法,包括以下步骤:

S1、获取手机信令数据以及其对应的手机用户基本属性信息;

S2、基于手机信令数据的人群出行相关特征提取;

S3、基于手机信令数据界定对外出行行为并进行细化分类;

S4、结合各类对外出行人群时空特征分布情况设计对外出行行为判别规则;

S5、运用滑动窗口法对对外出行人群进行识别。

优选的,步骤S1先获取研究地区研究时间范围内的手机信令数据,然后从运营商获取对应手机用户基本属性信息,如年龄、性别、号码归属地、户籍所在地等。

优选的,步骤S2基于手机信令数据的人群出行相关特征提取,包括以下步骤:

S21、遍历数据集,分别统计在研究时间范围内所有出现的手机用户的出现日期、当日获取的首条信令数据对应时间戳FIRST_TIME、当日获取的最后一条信令数据对应时间戳LAST_TIME、当日获取的首条信令数据对应基站编号FIRST_BASE以及当日获取的最后一条信令数据对应基站编号LAST_BASE。

S22、判别各手机用户居住基站LIVE_BASE。基于居民生活起居特点考虑,绝大多数人通常在夜间处于睡眠休息状态,在此时间段内手机用户活跃度较低,定位基站相对稳定,可根据手机用户在此时间段内的逗留情况确定其居住地所对应的基站位置。因此,结合前人研究以及社会现状综合考虑,将早上一点至七点设定为居住时间。同时,考虑到因手机定位方法自身存在一定的局限性,可能会导致手机端未发生移动时而在临近基站之间产生切换数据的现象,所以将基站日均逗留时间阈值设为2小时。同时考虑到部分用户在此期间可能会选择关机睡觉,导致此时间段内无手机信令数据记录。因此,为准确识别此类人的居住地,假设其开关机时所在位置相近,即当日前最后一条手机信令数据对应基站与次日首条手机信令数据对应基站之间的距离小于空间阈值500米时,则将当日前最后一条手机信令数据与次日首条手机信令数据之间的时间差作为其基站逗留时间。基于以上假设,对研究期间内手机用户进行居住地识别,将手机用户在[1:00,7:00]之间逗留时间最长且日均逗留时间大于2小时的基站作为其居住地基站。若无满足条件的基站,则将其居住地基站记为null。

S23、计算各手机用户手机信令数据记录时间间隔,具体包括信令数据记录前时间间隔PREVIOUS_GAP与信令数据记录前后时间间隔NEXT_GAP。其中,信令数据记录前时间间隔PREVIOUS_GAP,通过计算该条信令数据所记录的时间戳与前一条信令数据所记录的时间戳之间的时间间隔,以表征信令数据的时间前向连续性,当该条信令数据为当日首条信令数据时则计算其与当日零点之间的时间间隔;信令数据记录后时间间隔NEXT_GAP,通过计算该条信令数据所记录的时间戳与后一条信令数据所记录的时间戳之间的时间间隔,以表征信令数据的时间后向连续性,当该条信令数据为当日末条信令数据时则计算其与次日零点之间的时间间隔。计算公式如下(其中,BEGIN_TIME

PREVIOUS_GAP

NEXT_GAP

S24、计算各手机用户当前基站与居住基站之间的距离L_D,计算公式如下(其中d

优选的,步骤S3基于手机信令数据界定对外出行行为并进行细化分类,包括以下步骤:

S31、确定对外出行行为内涵定义。基于特定的研究需求,将交通出行者的出行起点和讫点皆落于同一城市(城镇)内部的移动过程定义为城市(城镇)对内出行,而交通出行者的出行起点或讫点有一端落于不同城市(城镇)内部的移动过程定义为城市(城镇)对外出行,并将发生对外出行时的移动行为定义为对外出行行为,发生对外出行时采用的交通方式定义为对外出行方式。根据出行方向将对外出行行为分为离境行为与入境行为,其中将出行者离开研究区域前往其他非研究区域的交通出行行为定义为离境行为,出行者从其他非研究区域进入研究区域的交通出行行为定义为入境行为。

S32、根据手机用户出行特性对对外出行行为进行细化分类。结合手机信令数据时间特性以及对外出行频率、出行目的等特性综合考虑,可将对外出行行为归纳为日间单次对外出行行为与日间多次对外出行行为两类。其中日间单次对外出行行为是指某一手机用户在当天有且仅有一次对外出行行为,日间多次对外出行行为是指某一手机用户在当天发生两次及两次以上对外出行行为。并根据手机信令数据在时间序列下的变化差异,可将其进一步细化分类。

优选的,步骤S4结合各类对外出行人群时空特征分布情况设计对外出行行为判别规则,包括以下步骤:

S41、根据用户在研究日期内的出行情况,创建用户状态flag列表:将T天连续的研究日期标准化到区间[1,T]内,如果用户当天在研究区域有手机信令数据记录,则将记为1,反之则记为0。

S42、遍历数据集,依次将连续三天的用户状态flag作为一个研究窗口,并将其中中间日期的手机信令数据作为研究对象。

S43、综合手机信令数据采集特性及用户对外出行特性,确定手机用户即将发生对外出行时手机信令数据记录时间间隔阈值θ

S44、结合flag窗口、手机信令数据记录时间间隔阈值θ

优选的,步骤S5运用滑动窗口法对用户在[2,T-1]之间各日的对外出行状态进行判别:首先从i=2开始,以[flag

本发明的有益效果

本发明提供了一种基于手机信令数据和滑动窗口算法的对外出行人群识别的方法,通过细化对外出行行为类型,基于手机信令数据定位原理及手机用户对外出行行为特性,运用滑动窗口法对手机用户对外出行行为进行识别,不同于以往仅考虑单一目标人群的识别提取,本专利基于手机信令数据运用滑动窗口算法实现了不同类型对外出行人群分类与识别,并可降低调查成本与模型运算效率。

附图说明

图1为本发明的流程示意图

图2为实施例中各类对外出行行为示例图

图3为实施例中手机用户某日对外出行频数统计分布图

图4为实施例中手机用户某年五月对外出行频数日变化图

图5为实施例中手机用户对外出行行为类型时间变化对比统计图

具体实施方式

下面结合实施例对本发明作进一步说明,但本发明的保护范围不限于此:

本发明从通信网络获取研究区域内手机用户的手机信令数据,根据用户交通出行行为与研究区域边界的交互情况,明确对外出行行为定义;并结合路网信息,分析用户交通出行时空特性差异,将用户对外出行行为进一步细化分类;然后结合各类型对外出行行为的手机信令数据时空分布特征,设计出相对应的判别规则;最后创建用户手机信令数据状态列表,基于设计出的判别规则运用滑动窗口法对用户对外出行行为类型进行识别,从而为人群画像以及对外交通规划人口专题研究建立一种简单有效全面的对外出行人群识别方法。

结合图1进行实例操作:

S1、获取手机信令数据以及其对应的手机用户基本属性信息;步骤S1中以江苏省昆山市某月手机信令数据为例,其中手机用户基本属性信息如表1所示:

表1手机用户基本属性信息

S2、基于手机信令数据的人群出行相关特征提取;步骤S2中基于手机信令数据的人群出行提取的相关特征类型及释义及如表2所示:

表2人群出行相关特征类型及释义

S3、基于手机信令数据界定对外出行行为并进行细化分类;根据手机信令数据在时间序列下的变化差异,步骤S3中基于手机信令数据对对外出行行为进行细化分类,进一步将日间单次对外出行行为细化分成八小类,日间多次对外出行行为细化分成五小类。为直观地展示各类对外出行行为所产生的手机信令数据在时间维度下的变化情况,分别绘制了日间单次对外出行行为与日间多次对外出行行为的手机信令数据示例表,如下表3和表4所示,其中每一行表格分别代表一种对外出行行为所产生的手机信令数据,每一列分别表示各种对外出行行为在不同时刻或日期下手机信令数据的出现情况,表格中线段连线时间段或日期下内有手机信令数据,没有线段连接的表示该时间断或日期下没有实际信令数据,表格左下角▲图形的表示手机用户在这个时间段或日期下有发生入境行为,表格右下角有

表3日间单次对外出行行为手机信令数据示例表

表中day

(a)A类:手机信令数据从第一天一直连续出现到最后一天,并且存在满足day

(b)B类:手机信令数据仅在day

(c)C类:手机信令数据仅在day

(d)D类:手机信令数据仅在day

(e)E类:手机信令数据分别在day

(f)F类:手机信令数据分别在day

(g)G类:手机信令数据分别在day

(h)H类:手机信令数据分别在day

表4日间多次对外出行行为手机信令数据示例表

以某日采集到的手机信令数据为研究对象,t

(i)I类:手机信令数据仅在t

(j)J类:手机信令数据分别在t

(k)K类:手机信令数据分别在t

(I)L类:手机信令数据分别在t

(m)M类:产生该类手机信令数据的用户日间多次进出研究区域,有大于等于3次离境或入境行为,是为其他类型的复式组合。

综上所述,日间单次对外出行行为即为异地入境行为与当地离境行为的单次或多次的不同组合,日间多次对外出行行为则为异地过境、异地往返以及当地往返等行为的不同组合。绘制的各类对外出行行为示例图如图2所示,其中从异地停驻点A到当地停驻点B的行为称为异地入境;从当地停驻点C到异地停驻点D的行为称为当地离境;从异地停驻点E到当异地停驻点F的行为称为异地过境;从异地停驻点G到当地停驻点H再返回异地停驻点I的行为称为异地往返行为;从当地停驻点J到异地停驻点K再返回当地停驻点L的行为称为当地往返行为。

S4、结合各类对外出行人群时空特征分布情况设计对外出行行为判别规则;步骤S4中基于用户手机信令数据定位原理与对外出行行为特性拟确定手机信令数据记录时间间隔阈值θ

S5、运用滑动窗口法对对外出行人群进行识别,获得用户对外出行状态。步骤S5中运用滑动窗口法对用户对外出行行为进行识别,其中手机用户某日对外出行频数统计分布如图3所示,手机用户某年五月对外出行频数日变化情况如图4所示,其对外出行行为各种类型统计结果如图5所示。

本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号