首页> 中国专利> 一种基于手机数据的精细尺度城市人群数量预测方法

一种基于手机数据的精细尺度城市人群数量预测方法

摘要

本发明公开了一种基于手机数据的精细尺度城市人群数量预测方法,其整体步骤为:手机定位数据时空重构;空间搜索邻域设定;人工神经网络模型构建;空间单元人群数量预测;人群数量预测结果精度评估。本发明突破了现有技术中仅考虑单一空间单元人群数量时间相关性的局限性,以及对较长时期人群数量历史数据的依赖,实现了精细时空尺度下的城市人群数量近实时预测,该预测结果可为探索城市居民活动规律、优化公共资源配置、协助城市交通诱导、制定公共安全应急预案等提供科学依据。

著录项

  • 公开/公告号CN108021980A

    专利类型发明专利

  • 公开/公告日2018-05-11

    原文格式PDF

  • 申请/专利权人 中国科学院地理科学与资源研究所;

    申请/专利号CN201711353043.8

  • 发明设计人 陈洁;裴韬;陆锋;李明晓;程诗奋;

    申请日2017-12-15

  • 分类号

  • 代理机构北京志霖恒远知识产权代理事务所(普通合伙);

  • 代理人孟阿妮

  • 地址 100101 北京市朝阳区大屯路甲11号

  • 入库时间 2023-06-19 05:21:36

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-04-17

    授权

    授权

  • 2018-06-05

    实质审查的生效 IPC(主分类):G06N3/04 申请日:20171215

    实质审查的生效

  • 2018-05-11

    公开

    公开

说明书

技术领域

本发明涉及一种预测方法,尤其涉及一种基于手机数据的精细尺度城市人群数量预测方法。

背景技术

精细尺度下,城市中每个空间单元上的人群数量随时间的发展变化均可视为一个时间序列。因此,现有的精细尺度城市人群数量预测问题,大多基于时间序列分析方法,转化为单一空间单元人群数量时间序列的预测问题。现有的时间序列分析方法主要包括两类:参数模型和非参数模型:参数模型形式简单明确,该模型由一些参数表达,假设函数形式已给定,仅需估计其中未知参数。当模型参数假设成立时,预测精度较高;相对于参数模型,非参数模型更具灵活性,该模型不是事先假定函数形式,而是从历史数据中获取因变量与自变量之间的关系进而建立一个近似模型。

总的来说,参数模型和非参数模型在精细尺度城市人群数量预测方面都具有一定的应用价值。然而,基于时间序列分析方法的城市人群数量预测研究存在两个方面的局限性:

第一,现有基于时间序列分析方法的人群数量预测过程中仅考虑单一空间单元上的人群数量时间相关性,未考虑不同空间单元之间的人群数量空间相关性,限制了精细尺度城市人群数量预测方法的精度;

第二,现有基于时间序列分析方法的人群数量预测过程中依赖于较长时期人群数量的历史数据,限制了精细尺度城市人群数量预测方法的响应速度。

发明内容

为了解决上述技术所存在的不足之处,本发明提供了一种基于手机数据的精细尺度城市人群数量预测方法。

为了解决以上技术问题,本发明采用的技术方案是:一种基于手机数据的精细尺度城市人群数量预测方法,其整体步骤为:

步骤一、手机定位数据时空重构;

步骤二、空间搜索邻域设定;

步骤三、人工神经网络模型构建;

步骤四、空间单元人群数量预测;

步骤五、人群数量预测结果精度评估。

进一步地,步骤一中手机定位数据时空重构的具体方法为:以手机基站的平均空间距离为边长划分规则网格空间单元、以手机定位数据采样的平均时间间隔为时长划分等长时段,对手机定位数据进行时空重构,从而统计生成各时段内、各空间单元上的城市人群数量观测值,以及针对任意两个相邻时段、从前一时段到后一时段流入任一空间单元的人群空间分布特征。

任一时段内,若某个手机用户的采样点多于一个,则选择停留时间最长的采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点有且仅有一个,则选择该采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点缺失,则选择上一时段该手机用户所在空间单元作为该用户在该时段所在空间单元。

进一步地,步骤二中空间搜索邻域设定的具体方法为:基于步骤一所获得的从前一时段ti到后一时段ti+1流入任一空间单元gc的人群空间分布特征,以gc为中心、以gc的网格边框为初始空间搜索邻域,并对该空间搜索邻域不断进行向外等比扩张,直至由该空间搜索邻域内流入gc的人群数量累计百分比占所有流入gc人群数量的95%时,记录该空间搜索邻域范围的大小;依次扫描所有时段、所有空间单元,选取最大的范围,将其设定为空间搜索邻域,并由此设定该空间搜索范围以内的所有空间单元gm与中心空间单元gc之间具有时空相关性。

进一步地,步骤三中人工神经网络模型构建的具体方法为:

Ⅰ、采用公式一表示不同空间单元之间的时空相关性的函数关系:

其中,表示中心空间单元gc在ti+1时段的人群数量预测值,表示空间单元gm在ti时段的人群数量观测值,gm为位于gc的空间搜索邻域内的所有空间单元;f表示之间的函数关系;

Ⅱ、将步骤Ⅰ中的输入数据代入人工神经网络中,进行网络模型的构建,具体为:将人工神经网络结构分为三层:第一层为输入层,输入数据为第二层为隐藏层,用于建立输入与输出之间的函数映射关系;第三层为输出层,输出数据为

进一步地,步骤四中空间单元人群数量预测包括模型训练和模型预测两个阶段:

模型训练阶段:基于步骤一生成的ti-1和ti时段内所有空间单元城市人群数量观测值,以及步骤三构建的人工神经网络模型,进行模型训练;

模型预测阶段:基于已训练模型,以及步骤一生成的ti时段内所有空间单元城市人群数量观测值,进行模型预测,预测结果为ti+1时段内所有空间单元城市人群数量预测值。

进一步地,步骤五中人群数量预测结果精度评估的具体方法为:基于步骤四生成的不同时段、不同空间单元的人群数量预测结果,采用统计方法,从时空分布、人口规模、多时间尺度的角度,进行模型预测精度分析。

本发明突破了现有技术中仅考虑单一空间单元人群数量时间相关性的局限性,以及对较长时期人群数量历史数据的依赖,实现了精细时空尺度下的城市人群数量近实时预测,该预测结果可为探索城市居民活动规律、优化公共资源配置、协助城市交通诱导、制定公共安全应急预案等提供科学依据。

附图说明

图1为本发明的整体流程示意图。

图2为步骤二中空间搜索邻域设定的效果展示图。

图3为步骤三中人工神经网络模型的构建过程示意图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1所示的一种基于手机数据的精细尺度城市人群数量预测方法,其整体步骤如下:

步骤一、手机定位数据时空重构:

该步骤的目的是将该手机定位数据集合中所有手机用户的采样点离散化地分布至各时段及各空间单元。以手机基站的平均空间距离为边长划分规则网格空间单元、以手机定位数据采样的平均时间间隔为时长划分等长时段,对手机定位数据进行时空重构。

具体地,任一时段内,若某个手机用户的采样点多于一个,则选择停留时间最长的采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点有且仅有一个,则选择该采样点所在空间单元作为该用户在该时段所在空间单元;若该手机用户的采样点缺失,则选择上一时段该手机用户所在空间单元作为该用户在该时段所在空间单元。

基于本步骤,可统计生成各时段内、各空间单元上的城市人群数量观测值,以及针对任意两个相邻时段、从前一时段到后一时段流入任一空间单元的人群空间分布特征。

步骤二、空间搜索邻域设定;

该步骤的目的是为步骤三中的输入数据设定一个空间搜索邻域。基于步骤一所获得的从前一时段ti到后一时段ti+1流入任一空间单元gc的人群空间分布特征,以gc为中心、以gc的网格边框为初始空间搜索邻域,并对该空间搜索邻域不断进行向外等比扩张,直至由该空间搜索邻域内流入gc的人群数量累计百分比占所有流入gc人群数量的95%时,记录该空间搜索邻域范围的大小,如图2所示。依次扫描所有时段、所有空间单元,选取最大的范围,将其设定为空间搜索邻域,并由此设定该空间搜索范围以内的所有空间单元gm与中心空间单元gc之间具有时空相关性。

步骤三、人工神经网络模型构建;

该步骤的目的是通过构建一个人工神经网络模型,以建立不同空间单元之间的时间、空间相关性。

首先,采用公式一表示不同空间单元之间的时空相关性的函数关系,该函数的目的在于采用周围空间单元gm在上一时刻ti的人群数量观测值去推断中心空间单元gc在下一时段ti+1的人群数量预测值,该分析方法综合了人群数量在空间、以及时间上的相关性,从而可以显著提高精细尺度城市人群数量预测精度;该结果预测是通过输入到人工神经网络中进行机器学习实现的;

其中,表示中心空间单元gc在ti+1时段的人群数量预测值,表示空间单元gm在ti时段的人群数量观测值,f表示之间的函数关系;gm为位于gc的空间搜索邻域内的所有空间单元,该空间搜索邻域由步骤二生成,由步骤一生成。

然后,将上述步骤中的输入数据代入人工神经网络中,进行网络模型的构建,通过构建人工神经网络模型来表达不同空间单元之间的时空相关性,如图3所示,具体为:将人工神经网络结构分为三层:第一层为输入层,输入数据为第二层为隐藏层,用于建立输入与输出之间的函数映射关系;第三层为输出层,输出数据为

通过建立不同空间单元上的人群数量时空相关性,改进了现有基于时间序列分析方法的人群数量预测过程中仅考虑单一空间单元上的人群数量时间相关性的局限性,可以有效提高精细尺度城市人群数量预测方法的精度。

步骤四、空间单元人群数量预测;

该步骤的目的是开展精细尺度城市人群数量预测,生成在不同时段、不同空间单元的人群数量预测结果。该步骤包括模型训练和模型预测两个阶段:首先,基于步骤一生成的ti-1和ti时段内所有空间单元城市人群数量观测值,以及步骤三构建的人工神经网络模型,进行模型训练;然后,基于已训练模型,以及步骤一生成的ti时段内所有空间单元城市人群数量观测值,进行模型预测,预测结果为ti+1时段内所有空间单元城市人群数量预测值。

由于模型训练过程仅涉及ti-1、ti时段,模型预测过程仅涉及ti、ti+1时段,摆脱了现有基于时间序列分析方法的人群数量预测过程中对于较长时期的历史人群数据的依赖,提高了模型预测的响应速度。

步骤五、人群数量预测结果精度评估。

该步骤的目的是评估模型的预测精度。具体地,基于步骤四生成的不同时段、不同空间单元的人群数量预测结果,采用统计方法,从时空分布、人口规模、多时间尺度的角度,进行模型预测精度分析。

本发明与现有技术相比,具有以下优势:

第一、通过建立不同空间单元上的人群数量时空相关性,改进了现有基于时间序列分析方法的人群数量预测过程中仅考虑单一空间单元上的人群数量时间相关性的局限性,提高了精细尺度城市人群数量预测方法的精度;

第二,通过构建人工神经网络模型,摆脱了现有基于时间序列分析方法的人群数量预测过程中对于较长时期的历史人群数据的依赖,提高了精细尺度城市人群数量预测方法的响应速度。

上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号