首页> 中国专利> 一种用手机信令数据提取周末往返于两地的双城生活人群的方法

一种用手机信令数据提取周末往返于两地的双城生活人群的方法

摘要

一种用手机信令数据提取周末往返于两地的双城生活人群的方法,包括:获取用户当日居住地数据集,包括用户编号、日期、居住地、城市4个字段;识别工作日居住地,合并用户编号、当日居住地、工作日城市相同的记录,并增加一个频数字段;若频数除以工作日天数大于等于60%,则该记录就是工作日居住地;识别周末居住地,根据周末备选居住地中的用户编号、周末城市,从周末当日居住地数据中提取数据;合并用户编号、居住地相同的记录,并增加一个频数字段;频数最大的记录就是该用户的周末居住地;识别双城生活人群,工作日居住地表和周末居住地表通过用户编号连接,提取在两张表中都有相同用户编号的记录,这部分用户就是双城生活人群。

著录项

  • 公开/公告号CN114861088A

    专利类型发明专利

  • 公开/公告日2022-08-05

    原文格式PDF

  • 申请/专利号CN202210540069.8

  • 发明设计人 丁亮;盛富斌;章俊屾;

    申请日2022-05-17

  • 分类号G06F16/9537(2019.01);H04W8/18(2009.01);

  • 代理机构杭州天正专利事务所有限公司 33201;

  • 代理人楼明阳

  • 地址 310014 浙江省杭州市拱墅区潮王路18号

  • 入库时间 2023-06-19 16:17:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-23

    实质审查的生效 IPC(主分类):G06F16/9537 专利申请号:2022105400698 申请日:20220517

    实质审查的生效

  • 2022-08-05

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及数据处理技术领域,涉及一种用手机信令数据提取周末往返于两地的双城生活人群的方法。

背景技术

双城生活是指工作日在某城市居住、工作,周末在另一城市居住、游憩,且有规律性的行为。随着城市之间高铁、高速互联互通,跨城出行成本下降,区域一体化、同城化日益普遍。有越来越多的人周末经常返回周边老家探亲、访友;或在大城市打拼,在周边小城市安家,周末往返于两地。识别这类人群对区域设施共建共享、公共服务配置具有重要意义。

在手机信令数据逐渐成为一种成熟的数据产品的背景下,手机信令数据记录了手机用户的活动轨迹,通过对长时间时空轨迹规律的挖掘,可以识别出用户的居住地、工作地、游憩地、出行目的地等信息。跨城通勤、探亲返乡、城际出行等,已有公开的算法。双城生活与跨城通勤的区别在于只在周末往返两地、有两个居住地,而不是每天都往返、居住地和工作地分属两个城市。双城生活与探亲返乡的区别在于返乡频率更高,基本每周末都往返,而不只是在小长假、春节往返。双城生活与城际出行的区别在于出行目的地是另一个城市的居住地,是固定的,且只在周末往返,而不是有多个目的地城市、出行时间不固定。双城生活尚未见公开的算法。

双城生活的研究应用于区域领域的研究分析,包括都市圈、同城化、区域一体化等。统计周末往返于两地的双城生活人群规模、比例,可视化显示居住地分布。为制定区域发展政策提供决策支持。然而目前还没有使用手机信令提取双城生活人群的方法。

发明内容

本发明要克服现有技术的上述缺点,提供一种用手机信令数据提取周末往返于两地的双城生活人群的方法。

为了识别周末往返于两地的双城生活人群,本发明要解决以下环节:

(1)使用手机信令数据处理好的中间结果(当日居住地),根据工作日、周末的当日居住地变化规律,工作日城市和周末城市的关系,识别工作日和周末的居住地。

(2)从周末当日居住地中筛选出周末规律性居住的城市,并识别出在该城市的居住地,排除出差、旅游等非规律性目的地的当日居住地。

(3)根据工作日居住地、周末居住地所在城市识别双城生活人群,并构建其工作日居住地—周末居住地数据集。

一种用手机信令数据提取周末往返于两地的双城生活人群的方法,包括如下步骤:

步骤1:获取用户当日居住地数据集。当日居住地是指当天0点至5点停留时间最长的位置,每个手机用户每天有一个唯一居住地信息,用户当日居住地数据集包括用户编号、日期、居住地、城市4个字段。

步骤11:提取工作日当日居住地数据集。工作日就是法定工作日。根据日期从用户当日居住地数据集中提取工作日当日居住地数据集,包括用户编号、日期、居住地、工作日城市4个字段。

步骤12:提取周末当日居住地数据集。周末就是除五一、十一、春节长假外的普通周末,考虑到有些双城生活人群可能会在工作日一早返回常住城市,周末最后一天居住在另一个城市,数据上就呈现为第二天(周末过后第一个工作日)也居住在这个城市,因此将周末过后第一个工作日也计入周末。周末当日居住地数据集包括用户编号、日期、居住地、周末城市4个字段。

步骤2:识别工作日居住地。

合并用户编号、当日居住地、工作日城市相同的记录,并增加一个频数字段(计算同样记录出现的次数)。若频数除以工作日天数大于等于60%,则该记录就是工作日居住地。包括用户编号、工作日居住地、工作日城市。每个用户的工作日居住地具有唯一性。

步骤3:识别周末居住地。

步骤31:筛选周末当日居住地。从工作日居住地数据中提取用户编号、工作日城市,通过用户编号和周末当日居住地数据集连接,将工作日城市信息接入周末当日居住地数据集中。删除周末城市和工作日城市相同的记录。

步骤32:周末编码。为每个用户编码周末编号,同一个周末编号相同。

步骤33:识别周末备选居住地。先合并用户编号、周末城市、周末编号相同的记录,再对该结果合并用户编号、周末城市相同的记录,并增加一个频数字段(计算同样记录出现的次数)。若频数除以周末数大于等于50%,则保留该记录,反之则删除记录。

步骤34:识别周末居住地。根据周末备选居住地中的用户编号、周末城市,从周末当日居住地数据中提取数据,包括用户编号、日期、居住地、周末城市。合并用户编号、居住地相同的记录,并增加一个频数字段(计算同样记录出现的次数)。频数最大的记录就是该用户的周末居住地。得到每个用户的周末居住地。

步骤4:识别双城生活人群。工作日居住地表和周末居住地表通过用户编号连接,提取在两张表中都有相同用户编号的记录,这部分用户就是双城生活人群,保留的记录就是双城生活人群的工作日居住地—周末居住地数据集。

本发明的优点是:

(1)识别出周末规律性至其他城市居住的人群及其居住地。弥补现有跨城通勤算法只能识别每天往返两个城市的人群,探亲返乡只能识别每年1次的往返两个城市的人群、城际出行识别的人群不具有规律性的不足。为都市圈、同城化、区域一体化等研究城市之间居民流动规律提供数据支撑。

(2)使用现有手机信令数据产品,不需要从原始数据开始识别,通过数据分类、分组计数、表连接等简单算法就可以实现,深度挖掘现有数据的价值。

附图说明

图1是本发明方法的流程图。

具体实施方式

下面结合附图进一步说明本发明的技术方案。以某一个用户2021年10月的当日居住地为例,对本发明技术方案做进一步介绍。

一种用手机信令数据提取周末往返于两地的双城生活人群的方法,包括如下步骤:

(一)获取用户当日居住地数据集。

用户当日居住地数据集包括用户编号、日期、居住地、城市4个字段。

(1)提取工作日当日居住地数据集。

工作日就是法定工作日。根据日期从用户当日居住地数据集中提取工作日当日居住地数据集,包括用户编号、日期、居住地、工作日城市4个字段。样例数据处理结果见下表:

(2)提取周末当日居住地数据集。

周末就是除五一、十一、春节长假外的普通周末,考虑到有些双城生活人群可能会在工作日一早返回常住城市,周末最后一天居住在另一个城市,数据上就呈现为第二天(周末过后第一个工作日)也居住在这个城市,因此将周末过后第一个工作日也计入周末。周末当日居住地数据集包括用户编号、日期、居住地、周末城市4个字段。样例数据处理结果见下表:

(二)识别工作日居住地。

合并用户编号、当日居住地、工作日城市相同的记录,并增加一个频数字段(计算同样记录出现的次数)。样例数据处理结果见下表:

若频数除以工作日天数大于等于60%,则该记录就是工作日居住地。如果没有符合要求的记录,则计算停止。1号用户工作日有70.6%的当日居住地是A,A就是该用户的工作日居住地,所在城市是X。工作日居住地的数据包括用户编号、工作日居住地、工作日城市。每个用户的工作日居住地具有唯一性。

(三)识别周末居住地。

(1)筛选周末当日居住地。

从工作日居住地数据中提取用户编号、工作日城市,通过用户编号和周末当日居住地数据集连接,将工作日城市信息接入周末当日居住地数据集中。如果工作日居住地数据和周末当日居住地数据集没有相同的用户编号,则计算停止。只要有一个用户编号相同则继续计算。样例数据处理结果见下表:

删除周末城市和工作日城市相同的记录。如果所有的周末城市和工作日城市都相同,则计算停止。只要有一条记录保留则继续计算。样例数据处理结果见下表:

(2)为每个用户编码周末编号,同一个周末编号相同。样例数据处理结果见下表:

(3)识别周末备选居住地。

先合并用户编号、周末城市、周末编号相同的记录。样例数据处理见下表:

再对该结果合并用户编号、周末城市相同的记录,并增加一个频数字段(计算同样记录出现的次数)。样例数据处理结果见下表:

若频数除以周末数大于等于50%,则保留该记录,反之则删除记录。如果没有频数大于等于50%,则计算停止。只要有一条记录的频数大于等于50%则继续计算。2021年10月共有4个周末,1号用户在Y城市居住的频数为3,在Z城市居住的频数为1,Y城市居住的频数大于50%,保留这条记录。

(4)识别周末居住地。根据周末备选居住地中的用户编号、周末城市,从周末当日居住地数据中提取数据,包括用户编号、日期、居住地、周末城市。合并用户编号、居住地相同的记录,并增加一个频数字段(计算同样记录出现的次数)。样例数据处理结果见下表:

频数最大的记录就是该用户的周末居住地。得到每个用户的周末居住地。上表中居住地P的频数最大,识别为1号用户的居住地。

(四)识别双城生活人群。

工作日居住地表和周末居住地表通过用户编号连接,提取在两张表中都有相同用户编号的记录,这部分用户就是双城生活人群,保留的记录就是双城生活人群的工作日居住地—周末居住地数据集。样例数据处理结果见下表:

本发明的关键技术点在于对同一个周末赋值相同编号(步骤32),通过相同用户编号、周末城市、周末编号合并,相同用户编号、周末城市合并,2次合并计算出周末返回周边城市的频次,从周末当日居住地中排除出差、旅游等非规律性周末居住地,识别出周末规律性居住的城市(步骤33)。依据工作日规律性居住的城市和周末规律性居住的城市是否相同判断双城生活人群,并构建其工作日居住地—周末居住地数据集(步骤4)。

本说明书实施所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于所陈述的具体形式,本发明的保护范围也包括本领域技术人员根据本发明构思所能够想到的等同技术手段。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号