首页> 中国专利> 一种基于信令数据的交通小区人口特征估计方法

一种基于信令数据的交通小区人口特征估计方法

摘要

本发明公开了一种基于信令数据的交通小区人口特征估计方法,包括如下步骤:(1)基于手机信令数据获取各手机基站服务范围内的居住用户;(2)将获取到的居住用户信息与运营商的用户信息进行匹配,得到各手机基站覆盖范围内居住用户的个人信息;(3)基于手机基站与交通小区的对应关系,将步骤(2)所获得的手机基站所对应的居住用户个人信息转化成交通小区居住用户特征信息。本发明能够利用移动网络运营商数据,在无需额外设备的情况下,获得交通规划所必需的交通小区人口特征信息。

著录项

  • 公开/公告号CN108495254A

    专利类型发明专利

  • 公开/公告日2018-09-04

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN201810182037.9

  • 申请日2018-03-06

  • 分类号

  • 代理机构南京苏高专利商标事务所(普通合伙);

  • 代理人王安琪

  • 地址 211189 江苏省南京市江宁区东南大学路2号

  • 入库时间 2023-06-19 06:21:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-04-24

    授权

    授权

  • 2018-09-28

    实质审查的生效 IPC(主分类):H04W4/02 申请日:20180306

    实质审查的生效

  • 2018-09-04

    公开

    公开

说明书

技术领域

本发明涉及交通大数据技术领域,尤其是一种基于信令数据的交通小区人口特征估计方法。

背景技术

交通规划四阶段法以居民出行调查为基础,由交通生成、交通分布、交通方式划分、交通量分配四个阶段组成。居民出行调查是交通规划的基础数据,传统的调查方式为间隔几年进行问卷式的出行调查,抽样率比较低且需要耗费大量的人力物力和时间成本,而且由于样本量和记忆准确性的限制,得到的结果不能满足分析需求。随着数据采集技术的不断发展,交通研究数据源逐渐从传统的问卷、线圈向雷达、微波检测器、卡口、GPS浮动车、电子标签等发展。这些检测器需要在道路上安装设备,需要购买专门的设备,而且需要在道路上进行施工,耗费人力物力。此外,传统的方法对居民从宏观角度进行统计分析,其结果受采样方法、调查模式等影响较大,效果较差,难以得到准确信息。

21世纪以来,移动网络覆盖率越来越广,手机终端基本普及。截至2016年,中国移动电话用户达到13.2亿,庞大的用户基数和手机数据的时间跨度为信息采集提供了良好的基础。手机数据包含大范围的时间和空间信息,合理利用这些数据,对于表征交通运行状态、评估交通设施和政策效果以及交通管理辅助决策有着重要作用。此外,手机用户的实名制登记政策,使得用户的年龄性别等信息得以准确地记录。然而,由于手机信令数据和用户信息包含用户的电话、位置等个人隐私信息,不能被直接应用。

交通小区居民特征作为交通规划四阶段法中交通分布的重要参考特征,有着重要意义。目前交通领域除了传统问卷调查还没有其他方法被应用于出行者个人特征的提取,手机运营商数据使得提取出行者特征、分析出行行为成为可能。本发明挖掘手机数据价值,充分发挥其在样本量和准确性上的优势,弥补了出行调查耗费人力、物力、时间和依赖被采访者记忆准确性的缺陷;同时注重对个体信息的保密,将个人信息集计为交通小区群体的信息,避免泄露用户隐私,从而为交通规划提供一种新的数据获取方法。

发明内容

本发明所要解决的技术问题在于,提供一种基于信令数据的交通小区人口特征估计方法,能够利用移动网络运营商数据,在无需额外设备的情况下,获得交通规划所必需的交通小区人口特征信息。

为解决上述技术问题,本发明提供一种基于信令数据的交通小区人口特征估计方法,包括如下步骤:

(1)基于手机信令数据获取各手机基站服务范围内的居住用户;

(2)将获取到的居住用户信息与运营商的用户信息进行匹配,得到各手机基站覆盖范围内居住用户的个人信息;

(3)基于手机基站与交通小区的对应关系,将步骤(2)所获得的手机基站所对应的居住用户个人信息转化成交通小区居住用户特征信息。

优选的,步骤(1)中,基于手机信令数据获取各手机基站服务范围内的居住用户具体包括如下步骤:

(11)选取研究区域从研究日期往前连续若干天的信令数据,查询各基站每天休息时段所记录的数据集一;

(12)若上述数据集一中,某用户有足够天数的数据满足用户一天的记录中大部分的数据被同一基站所记录,则认为该用户居住于该基站服务范围内。

优选的,步骤(2)中,手机基站覆盖范围内居住用户个人信息获取方法为:根据基站居住用户的编号,统计用户APP使用偏好并关联查询含用户年龄性别等信息的基础表,得到用户性别、年龄、职业类别和APP使用偏好信息。

优选的,步骤(3)中,基于手机基站与交通小区的对应关系,将步骤(2)所获得的手机基站所对应的居住用户个人信息转化成交通小区居住用户特征信息,具体包括如下步骤:

(31)在ArcGIS中利用创建泰森多边形工具,将基站作为输入点,输出其泰森多边形区域,这些区域表示其中任何位置到其关联点的距离都比到任何其他点输入要素的距离近的全部区域,每个基站的服务范围为其泰森多边形区域,该区域内任何位置到其关联基站的距离都比到任何其他基站的距离近;

(32)设基站Ci所服务的泰森多边形为Ti,与泰森多边形区域Ti有重叠的交通小区为P为研究区域内用户属性;其中基站Ci服务多个交通小区,即Ti与交通小区有交集;同时,交通小区Zj被多个基站服务,即交通小区Zj被多个泰森多边形分割;

计算基站服务范围和交通小区的重叠关系,得到基站Ci所服务的X个交通小区及各自所占的比例则交通小区Zj的某属性用户数等于其Y个部分的该属性总数之和,其Y个部分的该属性人数等于所在泰森多边形所属基站总人数与其所占比例的乘积;具体计算方法为:

其中,

交通小区Za与泰森多边形Tb重叠的部分;

泰森多边形Ta与交通小区Zb重叠的部分;

与泰森多边形Tb有重叠的所有交通小区中,的面积占所有重叠部分面积和的比例;

基站Cn某类属性的用户数量;

X:某基站所服务的所有交通小区的合集;

Y:某交通小区被不同泰森多边形分割部分的合集;

S:区域面积。

优选的,步骤(31)中,在所有点中划分出符合Delaunay准则的不规则三角网,三角形各边的垂直平分线即可形成泰森多边形的边,各平分线的交点决定泰森多边形折点的位置。

本发明的有益效果为:本发明利用信令数据获取用户居住小区信息和人口特征,和传统的人工调查方法相比,节省了组织调查所需的大量人力物力和时间成本,且可避免由于被调查者的记忆误差引起的错误,准确度更高;信令数据样本量大,且无需用户提交数据,覆盖用户全面;此外,以交通小区为单位集计用户信息,最终结果中不含单个用户的个人信息,有效保护了个人隐私和单个用户数据的敏感性;利用移动网络运营商数据,在无需额外设备的情况下,获得交通规划所必需的交通小区人口特征信息。

附图说明

图1为本发明的方法流程示意图。

图2为本发明的手机基站居住用户识别方法示意图。

图3为本发明的基站服务范围泰森多边形示例示意图。

图4为本发明的泰森多边形和交通小区匹配关系示意图。

具体实施方式

如图1所示,一种基于信令数据的交通小区人口特征估计方法,包括如下步骤:

(1)基于手机信令数据获取各手机基站服务范围内的居住用户;

(2)将获取到的居住用户信息与运营商的用户信息进行匹配,得到各手机基站覆盖范围内居住用户的个人信息;

(3)基于手机基站与交通小区的对应关系,将步骤(2)所获得的手机基站所对应的居住用户个人信息转化成交通小区居住用户特征信息。

本发明的一种基于信令数据的交通小区人口特征估计方法,如图1所示,该方法包括:

1、获取研究区域的4G信令数据、基站信息、手机用户APP使用记录和交通小区信息。

其中,所述的4G信令数据包括研究日前30天的信息,可以包括用户编号、基站编号、信号发生时间等。其中,所述的用户编号可以使用IMSI号、电话号码等具有标识功能的信息。

其中,所述的基站信息可以包括基站编号、基站名称、基站经纬度等。

其中,所述的手机用户APP使用记录可以包括用户编号、APP名称、APP使用时间、APP使用流量等。

其中,所述的交通小区信息可以包括交通小区名称、交通小区编号、交通小区位置、交通小区形状等。

2、基于获取到的4G信令数据与基站信息进行匹配,得到手机基站服务范围内的居住用户。

其中,所述的手机基站的居住用户可以包括基站编号、位置、用户编号等。

其中,所述的手机基站的居住用户的实现方法,如图2所示,具体包括:

21、选取研究区域从研究日期往前连续30天的信令数据,查询各基站每天24点至次日7点所记录的数据集一;

22、若上述数据集一中,某用户30天中有20天数据满足条件1),则认为该用户居住于该基站服务范围内。

条件1)用户一天的记录中,70%的数据被同一基站所记录。

23、对研究范围内所有基站的居住用户进行集计,得到每个基站服务范围内所有的居住用户。

3、将获取到的手机基站对应的居住用户与运营商用户信息以及APP使用数据进行匹配,得到手机基站居住用户个人特征。

其中,手机基站居住用户个人信息可以包括:性别、年龄、职业类别和APP使用偏好等。

其中,所述的手机基站覆盖范围内居住用户的个人特征的实现方法,具体包括:

31、根据所述基站居住用户的编号,关联运营商手机用户信息,生成交通小区人口的性别、年龄、职业等基本属性。

32、根据所述基站居住用户的编号,关联APP使用记录数据,得到用户使用APP类别、次数、时间。

33、以手机基站为单位,对居住用户信息进行集计,得到各基站不同属性类别居住用户的人数以及各基站各类APP使用人数和频次。

其中,不同属性类别居住用户可以包括:性别、年龄段、职业类别等。

4、根据手机基站与交通小区匹配关系,将居住用户个人特征信息分配至相应的交通小区。

其中,居住用户个人特征信息按相应交通小区占基站服务范围的比例分配至相应交通小区。

其中,所述的手机基站与交通小区匹配关系方法如下:

41、在ArcGIS中利用创建泰森多边形工具,将基站作为输入点,输出其泰森多边形区域。这些区域表示其中任何位置到其关联点的距离都比到任何其他点输入要素的距离近的全部区域,在本发明中即,每个基站的服务范围为其泰森多边形区域,该区域内任何位置到其关联基站的距离都比到任何其他基站的距离近。如图3,图中点代表手机基站,基站点周围线条围合的为泰森多边形。具体步骤为:

411在所有点中划分出符合Delaunay准则的不规则三角网(TIN)。

412三角形各边的垂直平分线即可形成泰森多边形的边。各平分线的交点决定泰森多边形折点的位置。

42、计算基站服务范围和交通小区的重叠关系,得到基站所服务的所有交通小区及各自所占的比例。设基站Ci所服务的泰森多边形为Ti,与泰森多边形区域Ti有重叠的交通小区为P为研究区域内用户属性。其中基站Ci服务多个交通小区,即Ti与交通小区(假设有X个)有交集;同时,交通小区Zj被多个基站服务,即交通小区Zj被多个泰森多边形分割(假设有Y个),如图4。

计算基站服务范围和交通小区的重叠关系,得到基站Ci所服务的X个交通小区及各自所占的比例(第m个交通小区部分面积与所涉及的全部X个交通小区部分面积之和的比例,见公式(1))。则交通小区Zj的某属性用户数等于其Y个部分的该属性总数之和,其Y个部分的该属性人数等于所在泰森多边形所属基站总人数与其所占比例的乘积。具体计算方法为:

其中,

交通小区Za与泰森多边形Tb重叠的部分;

泰森多边形Ta与交通小区Zb重叠的部分;

与泰森多边形Tb有重叠的所有交通小区中,的面积占所有重叠部分面积和的比例;

基站Cn某类属性的用户数量;

X:某基站所服务的所有交通小区的合集;

Y:某交通小区被不同泰森多边形分割部分的合集;

S:区域面积。

本发明提供的获取交通小区居住人口特征的方法,在不需要额外设备的基础上的大交通规划所必须的交通小区人口特征,可以降低人工作业量,降低成本,效率更高。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号