首页> 中国专利> 一种利用共享出行大数据进行人流量迁徙分析的系统

一种利用共享出行大数据进行人流量迁徙分析的系统

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明公开了一种利用共享出行大数据进行人流量迁徙分析的系统，属于智慧出行与公共安全领域；包括：数据存储层、内存计算层、人流迁徙分析层和可视化层；数据存储层用于存储增量数据；并加载至内存，内存计算层通过Map Reduce计算框架实现并行计算，利用Spark SQL计算框架实现全量式数据计算，借助SparkStreaming计算框架实现共享出行数据的增量式计算；同时将数据转换为具有分析价值的中间数据，人流迁徙分析层以上述中间数据为基础，进行商圈/城市的人流迁徙分析以及城市/商圈人流统计，最终分析的结果通过迁徙折线图及迁徙饼状图呈现。本发明具有实时性；高效性和可扩展性。

著录项

公开/公告号CN112434101A

专利类型发明专利
公开/公告日2021-03-02

原文格式PDF
申请/专利权人北京航空航天大学;
展开▼

申请/专利号CN202011317365.9
发明设计人童咏昕;郑鹏飞;张利鹏;许可;
展开▼

申请日2020-11-23
分类号G06F16/26(20190101);G06F16/27(20190101);G06F16/9537(20190101);
代理机构11121 北京永创新实专利事务所;
代理人易卜
地址 100191 北京市海淀区学院路37号
入库时间 2023-06-19 10:05:17

说明书

技术领域

本发明属于智慧出行与公共安全领域，涉及人流在不同区域之间的流动分析；具体是一种利用共享出行大数据进行人流量迁徙分析的系统。

背景技术

随着移动定位服务和移动终端的不断发展，逐渐积累的人流迁徙数据为进行人口流动和时空关联分析提供了数据基础。人流量迁徙分析主要面向于在某个时间段内，对不同区域之间人口流动数据进行统计和建模。此类研究在区域研究尺度上有不同的划分：一部分以省、自治区或直辖市为最小研究单元，另一部分以某个地区或特点城市为研究单元。

通过分析春运时期各大城市之间的人口流动，能够展示春运迁徙的情况并指导相关政策的制定。景区作为人流量聚集地之一，对人流量进行监测有助于制定相应预警和限流政策，从而缓解节假日期间景区人流超负荷，降低安全隐患。此外人流量迁徙分析可应用于疫情防控、城市人流管理、区域安全预警和购物中心选址等场景。

面向人流量迁徙分析的现有研究工作，在地理数据上可划分为：(1)基于用户的移动通信数据；(2)基于铁路，飞机，长途汽车和轮渡等跨城出行数据；(3)基于微博，Twitter，Facebook带地理位置的公开分享。但是不同数据源在人流量迁徙分析工作上存在不同的问题，具体如下：

基于移动通信数据的人流量迁徙分析，存在以下问题：基站信号不稳定、定位数据离散且稀疏、定位精度易受基站分布密度影响、收集轨迹数据易受基站跳变影响。限于移动基站数据分布的结构复杂和形式零散，以及数据处理和数据传输过程的时间开销，现有的研究多基于历史数据进行分析处理，缺少对增量式数据的分析。

基于铁路，飞机，长途汽车和轮渡等跨城出行数据的人流量迁徙分析，存在以下问题：需要进行停留区域的时序串联来生成用户的活动轨迹，活动轨迹中的异常点处理。

基于微博，Twitter，Facebook带地理位置信息的公开分享的人流量迁徙分析，存在以下问题：数据在短期时间不表现出迁徙特性，地理位置稀疏，时间维度稀疏，用户活动轨迹的还原难度较大。限于带地理位置信息的公开分享数据，限于数据量较多、用户地理位置数据关联性较大、活动轨迹还原难度较大，在增量式数据处理上相对较难实现。

此外，研究内容多关注于历史数据，但随着时间的推移人流迁徙数据会不断积累，上述工作缺少对增量式人流数据的处理和分析。

具体的文献参考如下：

1、蒋小荣,汪胜兰,杨永春.中国城市人口流动网络研究——基于百度LBS大数据分析 [J].人口与发展,2017,23(1):13-23.

2、王晓芹,张晓磊,李锦峰.一种运用大数据多点碰撞技术进行人口迁徙分析的方法:.

3、魏冶,修春亮,刘志敏,等.春运人口流动透视的转型期中国城市网络结构[J].地理科学,2016,036(011):1654-1660.

4、刘望保,石恩名.Spatial pattern of population daily flow among citiesbased on ICT:A case study of"Baidu Migration"％基于ICT的中国城市间人口日常流动空间格局——以百度迁徙为例[J].地理学报,2016,071(010):1667-1679.

5、刘望保,石恩名.“百度迁徙”下中国城市间的人口流动空间格局[J].华南师范大学学报(自然科学版),2016,48(05):67-73.

6、陈少杰,沈丽珍.基于腾讯位置大数据的三地同城化地区人口流动时空间特征研究[J]. 现代城市研究,2019(11):2-12.

7、董迦勒.基于大数据的区域人流监控平台的设计与实现[D].北京交通大学,2018.

8、叶强,张俪璇,彭鹏,黄军林.基于百度迁徙数据的长江中游城市群网络特征研究[J].经济地理,2017,37(08):53-59.

9、潘竟虎,赖建波.中国城市间人口流动空间格局的网络分析——以国庆-中秋长假和腾讯迁徙数据为例[J].地理研究,2019,38(07):1678-1693.

10、赖建波,潘竟虎.基于腾讯迁徙数据的中国“春运”城市间人口流动空间格局[J].人文地理,2019,34(03):108-117.

11、冯章献,张瑜,魏冶,赵梓渝,庞瑞秋,王士君.基于百度迁徙数据的长春市春运人口流动时空格局与动力机制[J].经济地理,2019,39(05):101-109.

14、洪东升.基于定位数据的人口分布特征研究[D].中国地质大学(北京),2015.

发明内容

为了解决现有人流量迁徙分析中数据还原难度大和缺少数据增量式分析等问题，本发明提出了一种利用共享出行大数据进行人流量迁徙分析的系统，通过将共享出行大数据与内存计算结合的方式，实现了全量式数据处理与分析，城市之间及商圈之间的人流量统一处理及分析框架，并且适用于数据增量性分析，具有数据处理速度快和一站式分析及可视化功能的优势。

所述的利用共享出行大数据进行人流量迁徙分析的系统，包括：数据存储层、内存计算层、人流迁徙分析层和可视化层。

其中，数据存储层用于存储地理元数据、历史数据以及持久化的增量数据；在处理查询以及实时计算时，上述数据流向内存计算层，经过内存计算层的加工，数据转换为具有分析价值的中间数据，人流迁徙分析层以上述中间数据为基础进行商圈/城市的人流迁徙分析，最终分析的结果通过可视化层呈现。

其中，数据存储层包括：共享出行订单数据存储至Hadoop集群；区域边界数据、城市 POI数据和城市商圈划分数据以json形式存储。

订单数据包含订单uuid，订单开始时间，订单结束时间，乘客uuid，司机uuid，订单起点，订单终点，订单价格和订单行驶距离等信息。

区域边界数据由全国各个城市的行政边界构成，每个城市的行政边界由一系列有序的经纬度坐标存储表示；通过依次连接城市的经纬度点，还原出城市的边界。

城市POI数据用于划分商圈以及标记城市交通枢纽信息；

每个城市商圈的存储包括：商圈uuid，商圈名称和有序的经纬度数组。每个商圈视为一个二维空间中的不规则多边形，商圈的顶点为有序数组，按照经纬度数组，依次首尾连接，即可在二维空间绘制出该商圈。

内存计算层包括：将数据存储层的数据加载至内存，并通过Map Reduce计算框架实现并行计算，利用Spark SQL计算框架实现全量式数据计算，借助SparkStreaming计算框架实现共享出行数据的增量式计算；

所述的内存计算层具体处理过程为：

当接收到数据存储层中的实时增量数据后，SparkStreaming计算框架将实时增量数据加载至内存，并按照固定时间窗口进行拆片，按照时间窗口完成城市间人流量统计和商圈间人流量统计，将结果按照固定大小时间窗口进行存储。

同时，SparkSQL计算框架动态调整内存中的实时增量数据，将其转换为DataFrame格式用于处理全量式计算，进而完成城市/商圈人流量迁徙的统计与分析；

MapReduce计算框架通过Map对各个计算节点并行计算，完成后使用Reduce操作收回合并结果，将结果按照固定大小的时间窗口进行切分，分布式存储于各个节点的DataFrame。

人流迁徙分析层包括：快速凸包算法、点在凸包内外快速判别算法、出行订单起终点空间位置映射、跨城市/商圈人流迁徙判别、商圈间人流量统计与分析、城市间人流量统计与分析；

所述的出行订单起终点空间位置映射包括出行订单与城市的映射，出行订单与商圈的映射；

所述的跨城市/商圈人流迁徙判别中，跨城市的人流迁徙判别流程如下：

统计从城市A迁徙至城市B的人流量，分为两类：(1)跨城出行订单，即存在从城市A出发抵达至城市B的订单；(2)非跨城订单，即某个用户从城市B的交通枢纽出发，存在城市B内的出行订单，则通过追溯此用户在历史两周内的出行订单，判断此用户两周内的出行轨迹是否存在城市A的出行订单。若此用户从城市B出发，且两周内的出行与城市A存在交集，则划入从城市A迁徙至城市B的人流量统计中，否则该用户迁徙不计入上述人流量统计。

跨商圈人流迁徙需判别流程如下：

统计从商圈C迁徙至商圈D的人流量，该部分统计存在下述两种情况：(1)商圈内出行订单，即存在出行订单其订单起点位于商圈C中，订单终点同样位于商圈C中，该部分人流量不计入从商圈C迁徙至商圈D的人流量；(2)跨商圈出行订单，即某个用户的出行订单起点位于商圈C中，出行订单终点不在商圈C中。若此用户的出行订单终点位于商圈D中，则划入从商圈C迁徙至商圈D的人流量统计中，否则不计入上述人流量统计。

城市间人流量统计与分析分为：城市间多迁出地-单迁入地的人流量迁徙分析、城市间单迁出地-多迁入地的人流量迁徙分析。

城市间多迁出地-单迁入地的人流量迁徙分析流程如下：

输入：订单数据、人流量统计时间窗口和迁入地城市

步骤一：按照时间窗口对订单数据进行过滤，过滤掉不在“人流量统计时间窗口”内的订单；

步骤二：统计时间窗口内在迁入地及其他城市有活动轨迹的乘客订单；

步骤三：使用跨城市人流迁徙判别算法判别上述订单，并统计订单终点为迁入地城市的人流量；

输出：单迁入地城市与其他城市的人流量统计数据。

城市间单迁出地-多迁入地的人流量迁徙分析流程如下：

输入：订单数据、人流量统计时间窗口和迁出地城市；

步骤一：按照时间窗口对订单数据进行过滤；

步骤二：统计时间窗口内在迁出地及其他城市有活动轨迹的乘客订单；

步骤三：使用跨城市人流迁徙判别算法判别上述订单，并统计订单起点为迁出地城市的人流量；

输出：单迁出地城市与其他城市的人流量统计数据。

所述的商圈间人流量统计与分析分为：商圈间多迁出地-单迁入地的人流量迁徙分析、商圈间单迁出地-多迁入地的人流量迁徙分析。

商圈间多迁出地-单迁入地的人流量迁徙分析流程如下：

输入：订单数据、人流量统计时间窗口和单迁入地商圈；

步骤一：按照时间窗口对订单数据进行过滤；

步骤二：统计时间窗口内在迁入地商圈与其他商圈有活动轨迹的乘客订单；

步骤三：使用跨商圈人流迁徙判别算法判别上述订单，并统计订单终点为迁入地商圈的人流量；

输出：单迁入地商圈与其他商圈的人流量统计数据。

商圈间单迁出地-多迁入地的人流量迁徙分析流程如下：

输入：订单数据、人流量统计时间窗口和单迁出地商圈；

步骤一：按照时间窗口对订单数据进行过滤；

步骤二：统计时间窗口内在迁出地商圈与其他商圈有活动轨迹的乘客订单；

步骤三：使用跨商圈人流迁徙判别算法判别上述订单，并统计订单起点为迁出地商圈的人流量；

输出：单迁出地商圈与其他商圈的人流量统计数据。

可视化层包括嵌套地理图层可视化设计、商圈/城市间人流量空间迁徙折线图、商圈/城市间人流量迁徙饼状图。

所述的可视化层包括城市地理图层和商圈地理图层的嵌套以及交互式操作，两层地理图层分别实现城市和商圈的人流量迁徙可视化，通过用户的点击行为触发。

可视化形式包括：人流量空间迁徙折线图及迁徙饼状图；

(1)城市间人流量空间迁徙折线图

输入数据：人流量统计时间窗口、城市多迁出-单迁入统计数据、城市单迁入-多迁出统计数据；

交互式操作：支持对人流量统计窗口的选择；支持迁入折线图与迁出折线图的切换；支持切换城市。

(2)城市间人流量迁徙饼状图

输入数据：人流量统计时间窗口、城市多迁出-单迁入统计数据、城市单迁入-多迁出统计数据

交互式操作：支持对人流量统计窗口的选择；支持top10迁入或迁出地城市显示；支持切换城市。

(1)商圈间人流量空间迁徙折线图

数据输入：人流量统计时间窗口、商圈多迁出-单迁入统计数据、商圈单迁入-多迁出统计数据；

交互式操作：支持对人流量统计窗口的选择；支持迁入折线图与迁出折线图的切换；支持切换商圈。

(2)商圈间人流量迁徙饼状图

输入数据：人流量统计时间窗口、商圈多迁出-单迁入统计数据、商圈单迁入-多迁出统计数据；

交互式操作：支持对人流量统计窗口的选择；支持top10迁入或迁出地商圈显示；支持切换商圈。

本发明的优点在于：

1)、一种利用共享出行大数据进行人流量迁徙分析的系统，通过流式计算的方式，将数据加载至内存中，提供实时统计及可视化展现；具有实时性。

2)、一种利用共享出行大数据进行人流量迁徙分析的系统，通过对时空数据的增量式分析，实现对人流量查询的高效查询与分析；具有高效性。

3)、一种利用共享出行大数据进行人流量迁徙分析的系统，基于区域间以及区域内人流量判别算法，可以将区域扩展至自定义的迁徙区域，能够对自定义区域内的人流量进行统计分析以及可视化展示；具有可扩展性。

附图说明

图1为本发明一种利用共享出行大数据进行人流量迁徙分析的系统架构图；

图2为本发明实施例中北京市商圈划分示意图；

图3为本发明给出的商圈存储json格式样例；

图4为本发明采用常规的出行订单与城市的映射流程图；

图5为本发明具体实施的出行订单与城市的高精度映射流程图；

图6为本发明出行订单与商圈的映射流程图；

图7为本发明跨城市人流迁徙判别流程图；

图8为本发明跨商圈人流迁徙判别流程图；

图9为本发明城市间多迁出地-单迁入地的人流量迁徙分析流程图；

图10为本发明城市间单迁出地-多迁入地的人流量迁徙分析流程图；

图11为本发明商圈间多迁出地-单迁入地的人流量迁徙分析流程图；

图12为本发明商圈间单迁出地-多迁入地的人流量迁徙分析流程图

图13为本发明某段时间内城市间人流量空间迁徙折线图；

图14为本发明某段时间内流入北京市人流量饼状图；

图15为本发明某段时间内北京市某商圈的人流量空间迁徙折线图；

图16为本发明某段时间内北京市的商圈流入某商圈人流量饼状图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图对本发明作进一步的详细和深入描述。

本发明一种利用共享出行大数据进行人流量迁徙分析的系统，将共享出行大数据与分析框架Spark结合，构建了一套出行订单在城市层面和商圈层面的空间位置映射方法以及跨城市和跨商圈的人流量判别算法；利用SparkSQL实现全量式人流量迁徙数据分析，并采用 SparkStreaming实现人流量迁徙数据增量式分析，实现城市层面与商圈层面的人流量迁徙分析系统架构设计。

所述的利用共享出行大数据进行人流量迁徙分析的系统，如图1所示，包括：数据存储层、Spark内存计算层、人流迁徙分析层和可视化层。

其中，数据存储层包括：共享出行订单数据存储至Hadoop集群；区域边界数据、城市 POI数据和城市商圈划分数据以json形式存储；

HBase作为面向列存储的数据库，在共享出行大数据平台中起着重要的作用。本发明主要使用共享出行大数据中的订单数据，订单数据包含订单uuid，订单开始时间，订单结束时间，乘客uuid，司机uuid，订单起点，订单终点，订单价格和订单行驶距离等信息。

城市POI数据，对于不同的城市而言，获取并存储城市的POI数据，一方面能够基于POI 数据实现商圈的划分，另一方面能够提供城市交通枢纽信息。

每个城市商圈的存储包括：商圈uuid，商圈名称和有序的经纬度数组。每个商圈视为一个二维空间中的不规则多边形，商圈的顶点为有序数组，按照经纬度数组，依次首尾连接，即可在二维空间绘制出该商圈，北京市的商圈划分数据，如图2所示；商圈的保存使用json 存储，其结构如图3所示。

Spark内存计算层包括三种存储结构和三种计算框架；

三种存储结构为：弹性分布式数据集RDD，DataFrame和DStream；

弹性分布式数据集RDD(Resilient Distributed DataSet)是Spark中的基本数据抽象。RDD 所具有的特性如下：(1)只读：RDD中数据不可修改；(2)分布式：支持多台数据分布存储；(3) 依赖关系：RDD的计算过程中不是立刻计算数据结果，通过构建有向无环图DAG(Directed Acyclic Graph)记录每个RDD的转换过程，一方面可以提高计算效率，另一方面可以提供错误恢复；(4)并行操作：不同节点上的RDD可以并行独立处理，然后根据DAG图生成新的 RDD。

DataFrame基于RDD衍生而来，主要提供了面向SQL的操作支持。存储在DataFrame中的数据可以视为一张关系型数据库的表，包括各列的名称及类型，每一行为一条数据。

DStream是一组连续的RDD序列，可以视为是在时间维度上对RDD的封装和抽象。随着时间的不断推移，连续的RDD序列不断组成DStream。DStream是构建在RDD上的微批处理工具，具备秒级的计算延迟，适用于数据增量性输入并完成持续性输出。

三种计算框架包括：将数据存储层的数据加载至内存，并通过Map Reduce计算框架实现并行计算，利用Spark SQL计算框架实现全量式数据计算，借助SparkStreaming计算框架实现共享出行数据的增量式计算；

MapReduce作为面向大数据并行处理的计算模型，通过Map和Reduce两个函数编程实现多种并行计算任务。

SparkSQL作为对结构化数据处理的数据分析引擎，结合共享出行平台的HBase集群，可以将共享出行大数据抽象为DataFrame进行存储。本发明采用SparkSQL实现对共享出行大数据的全量式数据处理与分析，进而完成人流量迁徙的统计与分析。

SparkStreaming作为实时流数据处理框架，支持高吞吐量且具备容错机制。SparkStreaming 将接收到的实时数据按照一定的时间间隔，对数据按照时间进行拆片。其底层依赖为DStream，在本发明中采用SparkStreaming实现对共享出行大数据的增量性处理与分析，进而完成人流量迁徙的持续性更新。

基于SparkStreaming的流式处理框架，通过划定时间窗口的方法，将数据统计进行定时输出，并将定时输出的数据按照城市级别和时间级别进行存储。当增量数据进入系统后，SparkStreaming将数据加载至内存，并按照固定时间窗口进行跨城市人流量统计和跨商圈人流量统计。所得结果按照系统自定的固定大小时间窗口进行存储。

所述的内存计算层具体处理过程为：

当接收到数据存储层中的实时增量数据后，SparkStreaming计算框架将增量数据加载至内存，构建RDD数据结构，并按照固定时间窗口进行城市间人流量统计和商圈间人流量统计，所得结果按照固定大小时间窗口进行存储。

此外，实时增量数据同时流入HBase集群以提供SparkSQL的计算，SparkSQL计算框架动态调整内存中的出行数据，将其转换为DataFrame格式用于处理全量式计算；涉及到大规模全量式计算，基于并行思想的MapReduce在各个计算节点的DataFrame中同时执行查询和计算任务，其中，Map操作将计算任务拆解分发至相关计算节点，在本系统中，计算任务为跨商圈/城市的判别以及人流量的统计；待并行计算完成后使用Reduce操作收回并合并计算结果，该结果同样按照固定大小的时间窗口进行切分，分布式存储于各个节点的DataFrame。

具体来说，当处理一条某时间范围内城市间和商圈间的人流量统计的查询时，首先将该时间范围按照固定时间窗口进行切分，若当前统计时间均可由历史查询得出结果，则对 SparkSQL处理后的DataFrame进行汇总计算；若当前统计时间包含部分未在历史窗口内数据，则对已有的历史统计数据累加，再对SparkStreaming处理所得的增量式数据进行累加，最终得到完整结果。

所述的出行订单起终点空间位置映射包括出行订单与城市的映射，出行订单与商圈的映射；其中，出行订单与城市的映射具体过程为：

在进行城市间人流量统计分析时，共享出行大数据的部分出行订单中存在缺少对起终点所处城市信息，为此需要将起终点经纬度与城市之间进行映射。为解决上述问题，本发明采用以下流程，如图4所示。

输入：城市边界数据、订单起终点。

输出：订单起点所在城市、订单终点所在城市。

首先，加载城市区域边界数据、并读取订单起终点坐标；

然后，对构成城市边界点的横纵坐标进行排序，分别求出最小/大的横纵坐标，共计四个，由这四个坐标构成的矩形即为包含城市的最小矩形区域；

接着，以最小矩形代替多边形作为城市的边界进行区域剪枝；

最后，使用点在矩形内外判别算法，求出起点所在城市、终点所在城市。

上述方法可实现快速地订单起终点映射，但由于采取的矩形剪枝方法，矩形的重叠面积相对较大，精度上的误差相对较高。为提高精度，本发明针对上述问题提出以下流程，如图 5所示。

输入：城市边界数据、订单起终点。

输出：订单起点所在城市、订单终点所在城市。

首先，加载城市区域边界数据、并读取订单起终点坐标；

然后，使用Google提供的构造函数将以城市边界的点转换为S2Polygon，并将起始点坐标转换为S2Point；

接着，基于Google S2算法将球面转为平面，利用点在多边形内外判断算法，实现订单起终点与城市建立映射，以此为标准遍历城市列表；

最后，确定订单起点所在城市、订单终点所在城市并输出映射关系。

出行订单与商圈的映射具体过程为：

在进行商圈间人流量统计分析时，需要将出行订单起终点经纬度与商圈之间进行映射，为解决上述问题，本发明采用以下流程，如图6所示，首先加载城市商圈数据，读取订单起终点坐标，对商圈多边形进行凸包化；利用点在凸包内外快速判别算法，输出起点所属商圈 uuid以及终点所属商圈uuid。具体为：

步骤一：将某一个城市的商圈json数据输入快速凸包算法中，输出该商圈凸包化的json 数据；

算法流程如下：

首先，解析当前商圈json数据，设置精度为0.1米，截断商圈经纬度，并进行去重操作，缩小点的规模；然后求出商圈中纬度最小的点，记为P

最后，通过遍历栈S，计算凸包化后的商圈重心记为G；构造凸包化后的商圈json并在 json中存储商圈重心G。

步骤二：针对某个城市点A，输入该点的经纬度坐标，将商圈凸包化的json数据输入到点在凸包内外快速判别算法中，输出点A所在的商圈；

算法流程如下：

首先，解析商圈凸包化的json数据，构造商圈名称与商圈重心的字典映射；然后，计算输入点A与所有商圈重心的距离，并按照距离对商圈进行排序，得到序列[G

步骤三：输入订单uuid，起终点经纬度，城市A所有商圈凸包化的json数据，利用出行订单起终点空间位置映射，输出订单uuid，起点所属商圈uuid，终点所属商圈uuid；

所述的跨城市/商圈人流迁徙判别包括(1)跨城市人流迁徙判别；(2)跨商圈人流迁徙判别；

本发明将研究尺度进一步细化为两个部分，实现两个层面上的人流量迁徙分析。以城市为第一层面的人流量迁徙分析，主要关注于城市之间的人流量迁徙分析，例如全国各个城市流入北京人流量统计；以城市内按照某些规则划分的商圈为第二层面的人流量迁徙分析，主要关注于城市内部不同商圈之间的人流量迁徙分析，例如在北京市内的王府井商圈与西单商圈之间的人流量统计。

本发明将人流量迁徙分析的最大范围限定在城市级别，分析内容主要为：城市内各区域人流量迁徙分析和城市间人流量迁徙分析。城市内各区域人流量迁徙分析是指对城市按照一定的规则进行区域划分，并对这些区域的人流迁入迁出进行统计分析。

基于共享出行大数据作为人流量迁徙分析的数据基础，其中共享出行大数据包括短途出行、中长途出行、长途出行等。短途出行主要为共享单车、最后一公里拼车等。中长途出行主要为共享汽车、出租车等。长途出行主要为顺风车、租车服务等。

基于共享出行大数据，跨城市的人流迁徙需判别用户的出发城市和终点城市。判别流程如图7所示，包括：a)、首先输入订单起终点和城市经纬度，分别计算起点和终点所在城市； b)、判断起点终点是否在同一所城市，如果是，提取起点所在的POI，进入c；否则，划入跨城迁徙人流量进行统计；c)、继续判断起点POI是否属于跨城交通枢纽，如果是，提取当前用户的历史两周内的出行数据，进入d)；否则，划入非跨城迁徙人流量进行统计；d)、判断用户历史所在城市是否与当前城市相同，如果是，划入非跨城迁徙人流量进行统计；否则，划入跨城迁徙人流量进行统计。

例如统计从城市A迁徙至城市B的人流量，该部分统计可分为两类：(1)跨城出行订单，即存在从城市A出发抵达至城市B的订单；(2)非跨城订单，即某个用户从城市B的交通枢纽出发，存在城市B内的出行订单，则通过追溯此用户在历史两周内的出行订单，判断此用户两周内的出行轨迹是否存在城市A的出行订单。若此用户从城市B出发，且两周内的出行与城市A存在交集，则划入从城市A迁徙至城市B的人流量统计中，否则该用户迁徙不计入上述人流量统计。

通过结合城市POI数据和一定的规则将城市划分为多个独立的商圈。共享出行大数据对商圈的人流迁徙需判别用户的出发商圈和终点商圈，如图8所示判别流程如下：首先输入订单起终点和城市经纬度，然后分别计算起点和终点所在商圈；判断起点终点是否位于相同商圈，如果是，则划入非跨商圈人流量进行统计；否则，划入跨商圈人流量进行统计。

所述的城市/商圈间人流量统计与分析包括：(1)城市间人流量统计与分析；(2)商圈间人流量统计与分析；

其中，城市间人流量统计与分析分为：城市间多迁出地-单迁入地的人流量迁徙分析、城市间单迁出地-多迁入地的人流量迁徙分析。通过将出行订单与城市的映射与跨城市人流迁徙判别进行结合，通过划分时间窗口，对城市内各个商圈分别进行人流量流入统计和人流量迁出统计。

城市间多迁出地-单迁入地的人流量迁徙分析流程如图9所示：

首先，输入订单数据、人流量统计时间窗口和迁入地城市；然后，按照时间窗口对订单数据进行过滤；统计时间窗口内在迁入地及其他城市有活动轨迹的乘客订单；使用跨城市人流迁徙判别算法，并统计订单终点为迁入地城市的人流量，最后，输出单迁入地城市与其他城市的人流量统计数据。

城市间单迁出地-多迁入地的人流量迁徙分析流程如图10所示：

首先，输入订单数据、人流量统计时间窗口和迁出地城市；然后，按照时间窗口对订单数据进行过滤；统计时间窗口内在迁出地及其他城市有活动轨迹的乘客订单；最后，使用跨城市人流迁徙判别算法，并统计订单起点为迁出地城市的人流量；输出单迁出地城市与其他城市的人流量统计数据。

但是，人流量迁徙分析还包括单迁出地-单迁入地的情况，如统计某段时间内北京市海淀区前往北京西站的人流量。对于此类需求，确定了人流迁出地和人流迁入地以及时间段。城市间人流量迁徙分析是指多个城市之间的人流迁入迁出的统计分析。例如：统计春节期间从上海前往北京的人流量。对于此类需求，同样确定了人流迁出地和人流迁入地以及时间段。

所述的商圈间人流量统计与分析分为：商圈间多迁出地-单迁入地的人流量迁徙分析、商圈间单迁出地-多迁入地的人流量迁徙分析。通过将出行订单与商圈的映射与跨商圈人流迁徙判别进行结合，通过划分时间窗口，对城市内各个商圈分别进行人流量流入统计和人流量迁出统计。

商圈间多迁出地-单迁入地的人流量迁徙分析流程如图11所示：

输入：订单数据、人流量统计时间窗口和单迁入地商圈；

步骤一：按照时间窗口对订单数据进行过滤；

步骤二：统计时间窗口内在迁入地商圈与其他商圈有活动轨迹的乘客订单，并进行初始化；

步骤三：使用跨商圈人流迁徙判别算法，并统计订单终点为迁入地商圈的人流量；

输出：单迁入地商圈与其他商圈的人流量统计数据。

商圈间单迁出地-多迁入地的人流量迁徙分析流程如图12所示：

输入：订单数据、人流量统计时间窗口和单迁出地商圈；

步骤一：按照时间窗口对订单数据进行过滤；

步骤二：统计时间窗口内在迁出地商圈与其他商圈有活动轨迹的乘客订单，并进行初始化；

步骤三：使用跨商圈人流迁徙判别算法，并统计订单起点为迁出地商圈的人流量；

输出：单迁出地商圈与其他商圈的人流量统计数据。

可视化层包括嵌套地理图层可视化设计、商圈/城市间人流量空间迁徙折线图、商圈/城市间人流量迁徙饼状图。

所述的嵌套地理图层可视化设计包括两层地理图层的嵌套以及交互式操作。

第一层为城市地理图层，该图层主要用于渲染和显示城市间的人流量迁徙可视化；第二层为商圈地理图层，该图层主要用于渲染和现实城市内商圈间的人流量迁徙可视化。上述两个图层间的交互通过用户的点击行为触发。

在城市地理图层中，用户通过点击地理图层中的城市名称或城市所在区域，实现图层的深入，进而显示该城市的商圈地理图层。

在商圈地理图层中，用户通过点击图层回退标签，实现图层的回退，进而显示城市地理图层。

所述的城市间人流量空间迁徙折线图及迁徙饼状图中包括：

(1)城市间人流量空间迁徙折线图

输入数据：人流量统计时间窗口、城市多迁出-单迁入统计数据、城市单迁入-多迁出统计数据；如图13所示，为某短时间北京及上海的人流量空间迁徙折线图可视化效果。

交互式操作：支持对人流量统计窗口的选择；支持迁入折线图与迁出折线图的切换；支持切换城市。

(2)城市间人流量迁徙饼状图

输入数据：人流量统计时间窗口、城市多迁出-单迁入统计数据、城市单迁入-多迁出统计数据；如图14所示，为某短时间流入北京市人流量饼状图可视化效果。

交互式操作：支持对人流量统计窗口的选择；支持top10迁入或迁出地城市显示；支持切换城市。

所述的商圈间人流量空间迁徙折线图及迁徙饼状图包括以下：

(1)商圈间人流量空间迁徙折线图

数据输入：人流量统计时间窗口、商圈多迁出-单迁入统计数据、商圈单迁入-多迁出统计数据；如图15所示，为某段时间内北京各商圈人流量空间迁徙折线图可视化效果。

交互式操作：支持对人流量统计窗口的选择；支持迁入折线图与迁出折线图的切换；支持切换商圈。

(2)商圈间人流量迁徙饼状图

输入数据：人流量统计时间窗口、商圈多迁出-单迁入统计数据、商圈单迁入-多迁出统计数据；如图16所示，为某短时间北京市的商圈流入某商圈人流量饼状图可视化效果。

交互式操作：支持对人流量统计窗口的选择；支持top10迁入或迁出地商圈显示；支持切换商圈。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种利用共享出行大数据进行人流量迁徙分析的系统 [P] . 中国专利： CN112434101B . 2021.06.25
2. 一种利用共享出行大数据进行人流量迁徙分析的系统 [P] . 中国专利： CN112434101A . 2021-03-02
3. SYSTEM AND METHOD FOR MATCHING WORKERS USING WORK AMOUNT BIG DATA ANALYSIS AND OVERALL WORK DESIGN METHOD USING SAME [P] . 韩国专利： KR20200031357A . 2020-03-24

机译：利用工作量大数据分析匹配工人的系统和方法以及使用相同方法进行整体工作设计的方法
4. POS ANALYSIS OF COMMERCIAL POWER BIG DATA SYSTEM USING FLOATING POPULATION DATA AND POS DATA [P] . 韩国专利： KR20190124114A . 2019-11-04

机译：利用浮动人口数据和POS数据进行商业大数据数据系统POS分析
5. Product recommendation system through big data analysis through user media utilization information [P] . 韩国专利： KR20190117830A . 2019-10-17

机译：通过用户媒体利用信息进行大数据分析的产品推荐系统