首页> 中国专利> 基于智能手机的实时城市人口密度及人群流动估计方法

基于智能手机的实时城市人口密度及人群流动估计方法

摘要

本发明公开了一种基于智能手机的实时城市人口密度及人群流动估计方法,通过测量手机扫描邻近被测量手机发出的蓝牙(或者Wi‑Fi)信号,并获取它们的MAC地址、信号强度、时间戳信息,然后结合测量手机自身的加速度计、陀螺仪、GPS传感器数据以及测量手机自身的位置信息,打包发送给中央服务器,以统计蓝牙(或者Wi‑Fi)用户数量和分布,并在此基础上确定城市不同区域的人口分布,然后结合城市地理结构以生成城市人口密度分布及城市人群流动地图。

著录项

  • 公开/公告号CN107396304A

    专利类型发明专利

  • 公开/公告日2017-11-24

    原文格式PDF

  • 申请/专利权人 毛国强;

    申请/专利号CN201710514073.6

  • 发明设计人 毛国强;

    申请日2017-06-29

  • 分类号H04W4/02(20090101);H04W24/08(20090101);H04W4/00(20090101);

  • 代理机构12103 天津市宗欣专利商标代理有限公司;

  • 代理人张淑华

  • 地址 澳大利亚新南威尔士州林德菲尔德区普弱文修路36号

  • 入库时间 2023-06-19 03:48:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-02-07

    授权

    授权

  • 2018-06-29

    专利申请权的转移 IPC(主分类):H04W4/02 登记生效日:20180611 变更前: 变更后: 申请日:20170629

    专利申请权、专利权的转移

  • 2017-12-22

    实质审查的生效 IPC(主分类):H04W4/02 申请日:20170629

    实质审查的生效

  • 2017-11-24

    公开

    公开

说明书

技术领域

本发明属于人口密度估计技术领域,特别涉及一种基于智能手机的城市人口密度及人群流动估计方法。

背景技术

人口是生活在特定社会制度、特定地域具有一定数量和质量人的总称。人口信息是重要的国情信息,它对行政管理、人口研究、了解市场供求、制定社会和经济发展计划等都具有重要意义。人口问题横跨自然、社会经济多个领域,是当今世界面临的影响可持续发展的重大问题之一。

现有技术中,人口密度计算方法通过定性描述与定量分析相结合,反演出人口密度在区域网格中的分布状态,实现人口数据与自然资源、环境等数据的集成,不能体现人口极度聚居地区和极度稀少地区人口分布独特的随机性分布规律和人口空间分布的区域特征,计算过程过于粗糙,从而影响了模型的精确性和实时性。

发明内容

本发明针对现有技术中存在的技术问题,提供一种基于智能手机的实时城市人口密度及人群流动估计方法。

为解决上述技术问题,本发明采用的技术方案是:

一种基于智能手机的实时城市人口密度及人群流动估计方法,包括如下步骤:

步骤一:构建图模型:将待测区域细分成多个晶格,所述图模型中的每个顶点唯一地表示一个晶格,相邻两个晶格之间通过有向边连接,用于表示人口的流动方向;

步骤二:每个晶格中,通过测量手机扫描邻近被测量手机发出的蓝牙(或Wi-Fi)信号,并获取它们的MAC地址、信号强度、时间戳信息,然后结合所述测量手机自身的加速度计、陀螺仪、GPS传感器数据以及自身的位置信息,打包发送给中央服务器;

步骤三:所述中央服务器收集来自不同晶格的所述测量手机发送的测量数据,以构成测量值{Z(t;s):t=t1,…,tT,s=s1,…,sm},其中t1,…,tT∈Dt表示测量时间点,s1,…,sm∈Ds表示所述测量手机的位置;

步骤四:计算蓝牙(或Wi-Fi)用户的渗透率ρ:检测到的蓝牙(或Wi-Fi)用户的个数和同一环境下人群个数的比值;

步骤五:计算蓝牙(或Wi-Fi)用户的检测概率f(x):其中x代表一对蓝牙(或Wi-Fi)用户的距离,f(x)代表在该距离下测量手机能检测到被测量手机的概率;

步骤六:构建测量模型:以将步骤三中的测量值Z与人口密度λρ关联起来,

(1)对应于单个测量的人群密度的估计:当人群均匀分布时,采用柏松分布近似:

在以上公式中,参数R为一个较大数值,以使距离R以上的蓝牙(或Wi-Fi)用户被检测到的概率可以被忽略不计,f(x)为蓝牙(或Wi-Fi)用户的检测概率,ρ为蓝牙(或Wi-Fi)用户的渗透率,λ为人口密度,即单位面积内的人口数量,k为在一次随机检测中检测到的蓝牙(或Wi-Fi)用户的个数,M代表检测到的蓝牙(或Wi-Fi)用户个数的随机数;

当人群非均匀分布时,可以经验选取其它统计分布函数近似,例如高斯分布函数,二项分布函数;

(2)对应于测量手机在行进中获取的一连串测量的人群密度的估计:采用卡尔曼滤波的方法利用行进中获取的一连串测量值对人口密度估计进行实时的更新;

(3)对于不同蓝牙(或Wi-Fi)用户测量值的相关性处理:利用数理统计的方法以及检测概率函数f(x)和不同蓝牙(或Wi-Fi)用户的相对位置对不同蓝牙(或Wi-Fi)用户测量值的相关性进行估计,并在此基础上对人群密度进行估计;f(x)

步骤七:晶格内人口密度预测

步骤八:从测量模型利用最大似然估计的方法估计出当前采样样本(即当前测量手机)周边的人口密度。并利用测量手机所在位置的人口密度和测量手机所在晶格的人口密度相对关系的经验估计,进一步估计出测量手机所在晶格的人口密度;

步骤九:晶格内人口密度预测;

步骤十:采用Krigging(中文翻译好像是克里格估计或克里金估计)的方法建立起不同晶格内人口密度Yi,i∈Γ时空相关性模型与动态模型建模;

步骤十一:所有晶格内人口密度估计:获取步骤八和步骤九的数据,并利用步骤十建立起来的不同晶格内人口密度相关性模型,利用一个晶格内的人口密度的估计以及其相对于前一时刻同一晶格内的人口密度的变化估计出所有晶格内人口密度的变化。并进一步估计出所有晶格内的人口密度;Yi,i∈Γ

步骤十二:人群在城市不同区域的流动性估计:利用步骤十一获取数据,以及各个晶格内的人口密度估计及其随时间及空间的变化,估计用户出行方式及人群在城市不同区域的流动性;

作为优选,所述步骤二和步骤三之间还具有一个采样误差校准的步骤,我们采用了一个更复杂的分层采样(相应的英文术语为stratified sampling)处理方法,其中样本值的时空相关性被考虑其中。

作为优选,所述步骤十一还包括获取道路传感器、监控视频、公交卡信息的步骤。

作为优选,所述步骤十二还包括获取道路传感器、监控视频、公交卡的信息以及用户出行估计信息的步骤。

与现有技术相比,本发明所具有的有益效果是:本发明通过测量手机检测周围环境中被测手机的蓝牙(或Wi-Fi)信号,统计接收蓝牙(或Wi-Fi)用户数量以确定城市不同区域的人口分布,然后结合城市地理结构以生成城市人口密度分布及城市人群流动地图。生成的城市人口密度分布及城市人群流动地图具有较强的实时性,而且在信息收集过程中不影响测量手机用户的正常使用。

附图说明

图1为本发明中的基于智能手机的城市人口密度及人群流动估计方法的结构框图;

图2为本发明中的基于智能手机的城市人口密度及人群流动估计方法的图模型的示意图。

具体实施方式

为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施例对本发明作详细说明。

如图1和图2所示,本发明的实施例公开了一种基于智能手机的城市人口密度及人群流动估计方法,包括如下步骤:

步骤一:构建图模型:将待测区域细分成多个晶格,所述图模型中的每个顶点唯一地表示一个晶格,相邻两个晶格之间通过有向边连接,用于表示人口的流动方向。具体地,目标地域首先会被细分成更小的区域,即“晶格”,图模型将以这些晶格作为基本单元。图模型不仅使得城市人群流动过程及不同区域人口密度的相关性变得可视化,而且能简化人群流动在时间和空间上的估计过程。假定Yi,i∈Γ被定义为第i个晶格(Yi,i∈Γ)中的人群密度,Γ表示所有晶格的集合合。每个晶格都有一个特征集合(如平均人口密度,人口数目及其统计分布等)。对目标地域进行细分和晶格化的同时也要考虑地理上人群流动的特点,例如,被一条河隔开的区域应该被划分成两个晶格(即使它们在人口密度分布上紧密关联)。区域细分及晶格化之后,相应的图模型可以建立起来。图模型中每个顶点唯一地表示一个晶格。只有当人群能够从一个晶格(代表的区域)直接流动到另外一个晶格(代表的区域)的时候才在对应于第一个晶格的顶点到相应于第二个晶格的顶点存在一条有向边。通过这样的方式建立起的图模型提供了一种较简便的方法来描述人口流动过程中不同区域之间的相关性。另外,图模型中的条件独立性也简化了对城市人群流动性的分析。为了说明这一点,考虑如下这个例子:如果区域Ds可以被分成三个晶格,分别为A1、A2和A3,人群可以从A1、经过A2、流动到A3,那么,Y1、Y2和Y3满足:[Y1,Y2,Y3]=[Y1|Y2,Y3][Y2,Y3]=[Y1|Y2][Y2|Y3][Y3],其中,[Y]表示随机量Y的概率分布。换言之,Y1和Y3是条件独立的(以Y2为条件)。条件独立的关系使得人群流动估计算法更加简化(尤其针对大规模系统),而且使得设计分布式的算法成为可能。在上述例子中,图模型中的顶点V1,V2和V3分别对应于A1,A2和A3,而顶点V1和V3之间没有连边。

本系统中对每个晶格里的人口密度估计的精度随该晶格内的测量值数量(即样本数量)变化。当样本数量增大时估计精度会提高。因而晶格的面积选取必须考虑到估计精度和分辨率的关系。当晶格面积增大时,估计精度提高但分辨率降低;当晶格面积减小时,估计精度降低但分辨率提高。在系统刚开始运行时,测量值数目会比较小,为了保证精度,晶格面积会设置比较大。随着系统运行时间增加,参与测量的用户数目会逐渐增加导致测量值数目会随时间逐步增加。在保证精度的前提下,晶格的面积可以逐步减小(大的晶格可以被细分为几个小的晶格)以逐步提高分辨率。另外,晶格的几何形状的选取还应该考虑到地球的弧度。综合以上考虑,本发明中采用了空间等边三角形(如图三所示)。值得一提的是,由于用户移动的不可控性,不同区域的样本数量不是均匀分布的。某些经常被用户访问的区域测量样本数量会比较高,相应的晶格面积也会比较小;反之,在测量样本数量较少的地方,晶格面积会比较大。

步骤二:每个晶格中,通过测量手机扫描邻近被测量手机发出的蓝牙(或Wi-Fi)信号,并获取它们的MAC地址、信号强度、时间戳信息,然后结合所述测量手机自身的加速度计、陀螺仪、GPS传感器数据以及自身的位置信息,打包发送给中央服务器;

步骤三:所述中央服务器收集来自不同晶格的所述测量手机发送的测量数据,以构成测量值{Z(t;s):t=t1,…,tT,s=s1,…,sm},其中t1,…,tT∈Dt表示测量时间点,s1,…,sm∈Ds表示所述测量手机的位置。例如,Z(t1,s1)表示在t1时刻、位置s1处的智能手机得到的测量值向量,该向量包含:1)智能手机在t1时刻、位置s1处检测到的蓝牙(或Wi-Fi)设备数量;2)被检测到的蓝牙(或Wi-Fi)设备的MAC地址及信号强度;3)智能手机中加速度计、陀螺仪、GPS传感器数据。

步骤四:计算蓝牙(或Wi-Fi)用户的渗透率ρ:检测到的蓝牙(或Wi-Fi)用户的个数和同一环境下人群个数的比值。并不是所有的人都有智能手机,而且在有智能手机的人中,并不是所有的智能手机用户都开启了蓝牙(或WI-FI)或者有些人带有多个蓝牙设备。所以,为了利用检测到的蓝牙(或Wi-Fi)用户个数估计人口密度,我们先要对蓝牙(或WI-FI)用户的渗透率,即检测到的蓝牙(或Wi-Fi)用户的个数和同一环境下人群个数的比值,进行估计。我们提出了两种方法进行估计。在本系统刚开始部署阶段,系统覆盖范围较小,这时需要对于典型环境(例如,火车站,居民小区,校园环境,社区广场等)的渗透率进行测量与估计。具体来说,对同一环境下检测到的蓝牙(或Wi-Fi)用户个数和该环境下的人群个数进行统计分析估计出该环境下的渗透率。当系统覆盖范围较大时可以利用第三方数据对以上提到的估计出的渗透率进行动态校正(例如利用北京市海淀区区测量的蓝牙(或Wi-Fi)用户个数和北京市海淀区通过人口普查得到的人口数据对比得到该区域的蓝牙(或Wi-Fi)渗透率)。以下我们用参数ρ来表示渗透率。该参数在不同环境中的取值不同。

步骤五:计算蓝牙(或Wi-Fi)用户的检测概率f(x):其中x代表一对蓝牙用户的距离,f(x)代表在该距离下测量手机能检测到被测量手机的概率。对于一对蓝牙(或Wi-Fi)用户来说,其中一个蓝牙(或Wi-Fi)用户可以检测到另外一个蓝牙(或Wi-Fi)用户的概率是随着两个蓝牙(或Wi-Fi)用户的距离变化的(距离越远,检测概率越低),并受到其它一些因素影响(例如周围环境,这两个蓝牙(或Wi-Fi)用户的时钟偏差)。该检测概率随距离变化的曲线对于特定环境(室内环境,户外环境,手机拿在手上,放在包里或衣服口袋里等)来说相对稳定。本系统对于上述典型环境进行测量,并用函数拟合的方法对于上述典型环境分别建立检测概率函数。以下我们用f(x)表示该检测概率函数。其中x代表一对蓝牙(或Wi-Fi)用户的距离,f(x)代表这对蓝牙(或Wi-Fi)用户相隔距离x的情况下其中一个用户可以检测到另一个用户的概率。

步骤六:构建测量模型:以将步骤三中的测量值Z与人口密度λρ关联起来,

(1)对应于单个测量的人群密度的估计:当人群均匀分布时,采用柏松分布近似:

在以上公式中,参数R为一个较大数值,以使距离R以上的蓝牙用户被检测到的概率可以被忽略不计,f(x)为蓝牙(或WI-FI)用户的检测概率,ρ为蓝牙(或WI-FI)用户的渗透虑。假设在一个蓝牙(或WI-FI)用户附近的人群是均匀分布的(如果人群的分布是非均匀的,对以下公式略作调整,本发明也适用于人群非均匀分布的情况)。用参数λ表示在该蓝牙用户附近的人群密度,即单位区域内的平均人口数。考虑渗透率的影响,在该区域内蓝牙用户的密度为ρ×λ。其中ρ为已知参数(见以上“蓝牙(或WI-FI)用户的渗透率的估计”部分),λ为待估计参数。用M表示在一次测量中可以检测到的蓝牙用户个数,M为一个随机整数,其统计分布可以用柏松分布近似(对于人群非均匀分布的情况柏松分布近似可能会产生较大误差,这时可以经验选取其它统计分布函数近似):

如果一个蓝牙(或WI-FI)用户在一次测量中检测到n个其它蓝牙(或WI-FI)用户,将该数值n带到以上公式中取代k,那么根据最大似然估计的方法,相应的λ值将以上公式的数值最大化的即为λ的最大似然估计。通过以上方法可以建立测量模型将测量到的蓝牙(WI-FI)个数与人群密度的关系建立起来并用最大似然估计的方法对人群密度进行估计。

当人群非均匀分布时,可以经验选取其它统计分布函数近似,例如高斯分布函数,二项分布函数。

(2)对应于测量手机在行进中获取的一连串测量的人群密度的估计:采用卡尔曼滤波的方法利用行进中获取的一连串测量值对人口密度估计进行实时的更新。当一个蓝牙(WI-FI)用户在移动时,对应于该蓝牙(WI-FI)用户的不同位置在不同时间点上会采集到一连串的测量。该组测量值有时间和空间上的相关性。而且当相邻测量点的测量范围有重叠或者其它蓝牙用户和该蓝牙用户移动方向一致时,会导致同一个(或几个)蓝牙(WI-FI)用户在相邻测量中被重复测量到。被重复测量的蓝牙(WI-FI)用户可以用该用户的MAC地址区分出来。相邻测量的测量范围的重叠可以用测量蓝牙用户的位置变化(通过该用户的GPS,加速度计和陀螺仪等传感器数据估计出来并考虑定位精度的影响)来估计,并在此基础上建立相邻测量值的相关性模型。进一步利用卡尔曼滤波的方法,可以对相邻测量值的相关性进行处理从而实现用户移动状态情况下测量值的实时处理以及人群密度估计的及时更新

(3)对于不同蓝牙(WI-FI)用户测量值的相关性处理:利用数理统计的方法以及检测概率函数f(x)和不同蓝牙(或Wi-Fi)用户的相对位置对不同蓝牙(或Wi-Fi)用户测量值的相关性进行估计,并在此基础上对人群密度进行估计。f(x)当两个(或多个)蓝牙(WI-FI)用户的位置比较接近时,它们的测量区域会有重叠,导致会同一个(或几个)蓝牙(WI-FI)用户被上述两个(或多个)蓝牙(WI-FI)用户测量到,从而导致对人群密度的估计产生偏差。以上被两个(或多个)蓝牙(WI-FI)用户测量到的蓝牙(WI-FI)用户可以用它们的MAC地址识别出来。对于这一类的偏差,我们对以上两个(或多个)蓝牙(WI-FI)用户测量到的相同蓝牙(WI-FI)用户,不同蓝牙(WI-FI)用户进行分别统计,并进一步考虑到测量区域的重叠,利用数理统计的方法以及检测概率函数f(x)对人群密度进行估计以消除以上偏差的影响

步骤七:晶格内人口密度预测。利用一个晶格内历史时刻估计的人口密度信息,该晶格内人口随时间变化的模型可以建立起来。利用该模型,可以利用一个晶格内的过去时刻收集到的人口密度信息估计(预测)出未来时刻的人口密度。具体方法有ARIMA模型预测,以及考虑人口密度变化的多时间尺度特性(比如一个晶格内当前时刻的人口密度和前一天同时刻的人口密度,前一周同时刻的人口密度显现出较强相关性)建立的多尺度ARIMA模型,或者通过神经网络模型的预测方法等

步骤八:当前采样样本位于的晶格内人口密度估计:从测量模型利用最大似然估计的方法估计出当前采样样本(即当前测量手机)周边的人口密度(参照步骤六(1)中所述方法)。并利用测量手机所在位置的人口密度和测量手机所在晶格的人口密度相对关系的经验估计,进一步估计出测量手机所在晶格的人口密度。从测量模型模块中可以得到当前测量蓝牙(Wi-Fi)用户周围的人口密度及个数的估计。另外测量蓝牙(WI-FI)用户的位置信息也可以从该用户自身汇报的位置信息以及GPS,加速度计、陀螺仪等传感器数据比较准确地估计出来。进一步利用该位置的人口密度和该位置所在晶格内的人口密度的关系,可以更进一步估计出当前采样样本位于的晶格内人口密度。利用该估计可以对晶格内人口密度预测用卡尔曼滤波的方法进行修正及更新。某个特定位置的人口密度和该位置所在晶格内的人口密度的关系可以用经验估计进行初始化。初始化以后可以用估计以及测量数据进行修正与更新以使其越来越准确。

步骤九:晶格内人口密度预测;当一个新的估计从“当前采样样本位于的晶格内人口密度估计”模块中产生以后。利用“不同晶格内人口密度时空相关性估计与动态模型建模”模块中建立的不同晶格内人口密度的关系,并利用“其它设备(如道路传感器,视频监控,公交卡,等)的测量信息”模块从其他渠道获取的信息辅助,可以得到一个晶格内人口密度变化对相邻晶格人口密度的影响,并利用Kriging算法对相邻晶格的人口密度估计进行更新。以此类推,对所有晶格内人口密度估计进行更新。

步骤十:采用Krigging(克里格估计或克里金估计)的方法建立起不同晶格内人口密度Yi,i∈Γ的时空相关性模型与动态模型建模;动态模型描述了当一个晶格内的人口密度变化时,与其在相应的图模型中直接连接的晶格(以下简称相邻晶格)内的人口密度应该怎样变化。动态模型由一组差分方程式组成,每一个差分方程描述一个晶格的人口密度变化和与其相邻晶格内的人口密度的关系动态模型的初始形式可以由经验(或相应的测量数据)建立。例如,通过经验(或道路及公共交通数据)可以估计出在早高峰时如果北京市门头沟区的的人口密度减少,那么各自有百分之多少的人口移动到相邻的海淀区,昌平区等等。以此建立相应的差分方程。当差分方程初始化以后,可以用贝叶斯估计以及Kriging算法的方法利用采集到的用户数据及估计的晶格人口密度对动态模型进行修正以使其越来越准确。

步骤十一:所有晶格内人口密度估计:获取步骤八和步骤九的数据,并利用步骤十建立起来的不同晶格内人口密度相关性模型,利用一个晶格内的人口密度的估计以及其相对于前一时刻同一晶格内的人口密度的变化估计出所有晶格内人口密度的变化,并进一步估计出所有晶格内的人口密度Yi,i∈Γ;

步骤十二:人群在城市不同区域的流动性估计:利用步骤十一获取数据,以及各个晶格内的人口密度估计及其随时间及空间的变化,估计用户出行方式;

本实施例中,所述步骤二和步骤三之间还具有一个采样误差校准的步骤,也即,采用了一个更复杂的分层采样处理方法,其中样本值的时空相关性被考虑其中。

本实施例中,步骤十一还包括获取道路传感器、监控视频、公交卡信息的步骤。可以得到人群在城市各个区域的实时分布,人群在城市不同区域的流动的实时估计,以及人群流动方式(例如步行,坐地铁,公家,驾车等)的实时估计

本实施例中,步骤十二还包括获取道路传感器、监控视频、公交卡的信息以及用户出行估计信息的步骤。除了直接利用蓝牙(Wi-Fi)测量人口密度并估计人口的流动性以外,在某些环境下可以从政府部门和公路交通部门获取额外的测量信息。这些额外的测量信息可以用贝叶斯估计的方法融合到本系统中以使本系统的人口密度估计及人口流动性估计更为准确。举例来说,如果有道路传感器信息,则可以通过车流量,单车平均载客量,以及人口通过道路交通(相对于其它交通方式如自行车,地铁)出行的概率等信息估计出从一个晶格到其相邻晶格的人口移动速度。该数据可以与通过本系统蓝牙(Wi-Fi)测量估计出的数据用贝叶斯估计的方法进行融合从而提高本系统人口密度和人口移动下估计的精度。其它渠道获取到的测量信息也可以通过类似原理融合到本系统中以提高本系统的估计精度。

以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号