首页> 中国专利> 地铁站周边共享单车的需求预测方法

地铁站周边共享单车的需求预测方法

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明涉及共享单车需求的预测方法，尤其涉及一种地铁站周边共享单车的需求预测方法，包括以下步骤：对各个地铁单车站的共享单车数据集以及各个地铁站的流量数据集进行聚类分析，得到地铁单车站的类别特征；根据各个地铁单车站的共享单车数据集确定每个地铁单车站的站点模式特征；将类别特征和站点模式特征输入至三层融合的SAP‑SF模型，三层融合的SAP‑SF模型输出各时段内共享单车的需求预测结果。本发明提出的地铁站周边共享单车的需求预测方法，解决了现有共享单车的需求预测方法不够准确的问题。

著录项

公开/公告号CN112258029A

专利类型发明专利
公开/公告日2021-01-22

原文格式PDF
申请/专利权人北京交通大学;
展开▼

申请/专利号CN202011130799.8
发明设计人吕莹;支丹月;孙会君;崔云霄;董鲁祺;许广曈;
展开▼

申请日2020-10-21
分类号G06Q10/06(20120101);G06Q30/06(20120101);G06Q50/30(20120101);G06K9/62(20060101);G06N20/00(20190101);
代理机构11430 北京市诚辉律师事务所;
代理人范盈
地址 100044 北京市海淀区西直门外上园村3号
入库时间 2023-06-19 09:38:30

说明书

技术领域

本发明涉及计算机应用技术领域，尤其涉及地铁站周边共享单车的需求预测方法。

背景技术

无桩共享单车由于其便利性、成本低、污染小等优点，在全世界范围内得到了飞速的发展，在交通出行中与公共交通相结合发挥第一公里和最后一公里的重要作用。近年来，共享单车的规模逐渐扩大，现有的预测方法无法满足乘客对地铁站内共享单车数量的需求。现阶段，关于共享单车的预测多使用机器学习方法，一般考虑工作日非工作日、天气、建筑环境、社会经济以及站点间相关性等影响因素，以上影响因素不能体现地铁站客流量对地铁站内共享单车数量的影响。

发明内容

本发明提出地铁站周边共享单车的需求预测方法，以解决现有的无桩共享单车的预测方法不够准确的问题。

本发明解决上述问题的技术方案是：地铁站周边共享单车的需求预测方法，其特殊之处在于，包括以下步骤：

S1：数据的预处理

对各个地铁单车站的共享单车数据集以及各个地铁站的流量数据集进行聚类分析，得到地铁单车站的类别特征，其中，地铁单车站为以地铁站为中心以设定长度为半径所划定的范围；

根据各个地铁单车站的共享单车数据集确定每个地铁单车站的站点模式特征；

S2：单车数量的预测

将S1步骤得到的类别特征和站点模式特征输入至三层融合的SAP-SF模型，三层融合的SAP-SF模型输出各时段内共享单车的需求预测结果。

优选的是：所述步骤S2还包括：将POI特征、天气特征和气象特征输入至三层融合的SAP-SF模型。

优选的是：所述S1步骤之前还包括：

获取整个城市范围内的共享单车的订单数据集；

筛选得到地铁单车站内的共享单车数据集，共享单车数据集包括起点数据集和终点数据集，起点数据集包括起点落在所述地铁单车站的共享单车的数据，终点数据集包括终点落在所述地铁单车站的共享单车的数据，其中所述地铁单车站为以地铁站为中心以500米为半径所划定的范围。

优选的是：所述S1步骤中对各个地铁单车站的共享单车数据集以及各个地铁站的流量数据集进行聚类分析，得到地铁单车站的类别特征的步骤包括：

计算所述共享单车数据集的聚类指标和地铁流量数据集的聚类指标，所述共享单车数据集包括起点数据集和终点数据集，地铁流量数据集包括进站数据集和出站数据集；

对所述共享单车数据集的聚类指标和地铁流量数据的聚类指标依次进行两次聚类分析，得到地铁单车站的类别特征。

优选的是：所述计算共享单车数据集的聚类指标和地铁流量数据集的聚类指标的步骤具体包括：将所述起点数据集、终点数据集、进站数据集和出站数据集重采样为小时级数据，分别计算起点数据集、终点数据集、进站数据集和出站数据集的聚类指标，聚类指标包括极大值个数、偏度、峰度、高峰系数、均衡系数；

对所述共享单车数据集的聚类指标和地铁流量数据的聚类指标依次进行两次聚类分析，得到地铁单车站的类别特征的具体步骤包括：根据进站数据集和出站数据集的聚类指标计算轮廓系数，得到k类地铁站；根据k类地铁站相对应的起点数据集和终点数据集的聚类指标再次计算轮廓系数，得到N类地铁单车站。

优选的是：所述S1步骤中根据各个地铁单车站的共享单车数据集确定每个地铁单车站的站点模式特征的步骤采用的确定方法为张量分解。

优选的是：采用所述张量分解确定每个地铁单车站的站点模式特征的具体步骤包括：

将各个地铁单车站的共享单车数据构造成一个三阶张量X(X∈R

采用Turker分解方法对X进行分解，Turker分解的公式是

Turker分解方法的参数(P，Q，U)根据参考文献和KL散度确定，其中P为日模式，Q为时间模式，U为站点模式；

KL散度公式是

经过Turker分解可以得到地铁单车站维度的因子矩阵C(C∈R

优选的是：所述S2步骤具体包括：

采用机器学习模型作为基学习器来构建三层融合的SAP-SF模型，所述三层融合的SAP-SF模型包括第一层子模型、第二层子模型和第三层子模型，各层之间依次顺序连接，前一层的输出为后一层的输入；

利用训练集数据，对三层融合的SAP-SF模型进行训练，所述训练集数据包括类别特征、站点模式特征、POI特征、天气特征和气象特征；

将预测集数据输入训练完成的SAP-SF模型，输出各时段内共享单车的预测值。

优选的是：第一层子模型接收类别特征、站点模式特征、POI特征、天气特征和气象特征的输入，相应的第一层的输出的是

优选的是：所述的S2步骤还包括机器学习模型选定，所述的机器学习模型包括随机森林、梯度提升决策树、Bagging回归、K近邻、决策树、AdaBoost回归、岭回归中的一种或几种；

将所述类别特征、站点模式特征、POI特征、天气特征和气象特征加入数据集中，将数据集划分为训练集和预测集，将数据集输入机器学习模型中，比较各个机器学习模型的预测精度，从中选出W个预测精度高且原理不同的机器学习模型，这W个机器学习模型选定为三层融合模型的子模型。

相比于现有技术，本发明的有益效果在于：

1)可以同时得到全网各地铁站各时段的共享单车需求。

2)融合了多种机器学习的预测方法，可以有效提高预测精度。

3)原理简单，易于理解和操作，应用性较强。

4)方法可以应用到各城市的地铁系统，应用性强。

附图说明

图1为本发明预测方法的流程示意图。

具体实施方式

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。

实施例1：如图1所示，地铁站周边共享单车的需求预测方法，包括以下步骤：

S1：数据的预处理

根据各个地铁单车站的共享单车数据集确定每个地铁单车站的站点模式特征；

S2：单车数量的预测

将S1步骤得到的类别特征和站点模式特征输入至三层融合的SAP-SF模型，三层融合的SAP-SF模型输出各时段内共享单车的需求预测结果。

作为本发明一个优选实施例，步骤S2还包括将POI特征、天气特征和气象特征输入至三层融合的SAP-SF模型中。用共享单车订单的起点区域和终点区域的 POI数据来代表该区域的土地利用情况，共有12种POI类型(商务住宅、科教文化服务、金融保险服务、交通设施服务、购物服务、公司企业、风景名胜、餐饮服务、医疗保健服务、政府机构及社会团体、住宿服务、生活服务)。天气数据为插值处理后的气象站各小时数据，包括温度、气压、湿度、风速、风力、能见度和降水等特征。空气质量指数(AQI)划分为6个等级。

作为本发明一个优选实施例，数据的预处理步骤之前还包括：

获取整个城市范围内的共享单车的订单数据集；共享单车是指无桩的分时租赁自行车，这种共享单车没有固定的站点进行停靠。

筛选得到地铁单车站内的共享单车数据集，共享单车数据集包括起点数据集和终点数据集，起点数据集包括起点落在所述地铁单车站的共享单车的数据，终点数据集包括终点落在地铁单车站的共享单车的数据，其中地铁单车站为以地铁站为中心以500米为半径所划定的范围。

作为本发明一个优选实施例，S1步骤中对各个地铁单车站的共享单车数据集以及各个地铁站的流量数据集进行聚类分析，得到地铁单车站的类别特征的步骤包括：

计算共享单车数据集的聚类指标和流量数据集的聚类指标，流量数据集是将同时期的地铁刷卡数据分为进站数据集和出站数据集，每条记录代表该站点从5:00-23:00的客流量情况，客流量数值为日均客流量，共享单车的终点数据是进站数据，共享单车起点数据集是出站数据；

对共享单车数据集的聚类指标和地铁流量数据的聚类指标依次进行两次聚类分析，得到地铁单车站的类别特征。

作为本发明一个优选实施例，计算共享单车数据集的聚类指标和地铁流量数据集的聚类指标的步骤具体包括：将起点数据集、终点数据集、进站数据集和出站数据集重采样为小时级数据，分别计算起点数据集、终点数据集、进站数据集和出站数据集的聚类指标，聚类指标包括极大值个数M，偏度S，峰度K，高峰系数P，均衡系数U。P＝Max{Q

对共享单车数据集的聚类指标和地铁流量数据的聚类指标依次进行两次聚类分析，得到地铁单车站的类别特征的具体步骤包括：首先根据地铁站的10个指标计算轮廓系数得到最佳的k值，得到k类地铁站，然后二次聚类确定各类地铁站下的地铁单车站类别。根据各类地铁站相对应的地铁单车站的12个指标再次计算轮廓系数确定N

作为本发明一个优选实施例，S1步骤中根据各个地铁单车站的共享单车数据集确定每个地铁单车站的站点模式特征的步骤采用的确定方法为张量分解；

作为本发明一个优选实施例，采用张量分解确定每个地铁单车站的站点模式特征的具体步骤包括：

将各个地铁单车站的共享单车数据构造成一个三阶张量X(X∈R

采用Turker分解方法对X进行分解，Turker分解的公式是

Turker分解方法的参数(P，Q，U)根据参考文献和KL散度确定，其中P为日模式，Q为时间模式，U为站点模式；

KL散度公式是

经过Turker分解可以得到地铁单车站维度的因子矩阵C(C∈R

作为本发明一个优选实施例，S2步骤具体包括：

构建三层融合的SAP-SF模型，三层融合的SAP-SF模型包括第一层子模型、第二层子模型和第三层子模型，各层之间依次顺序连接，前一层的输出为后一层的输入；

利用训练集数据，对三层融合的SAP-SF模型进行训练，训练集数据包括类别特征、站点模式特征、POI特征、天气特征和气象特征；

将预测集数据输入训练完成的SAP-SF模型，输出各时段内共享单车的预测值。

作为本发明一个优选实施例：第一层子模型接收类别特征、站点模式特征、 POI特征、天气特征和气象特征的输入，相应的第一层的输出的是

作为本发明一个优选实施例，S2步骤还包括机器学习模型选定，机器学习模型包括随机森林、梯度提升决策树、Bagging回归、K近邻、决策树、AdaBoost 回归、岭回归中的一种或几种；

将类别特征、站点模式特征、POI特征、天气特征和气象特征加入数据集中，将数据集划分为训练集和预测集，将数据集输入机器学习模型中，比较各个机器学习模型的预测精度，从中选出W个预测精度高且原理不同的机器学习模型，这W个机器学习模型选定为三层融合模型的子模型

实施例2：本发明提供了一种地铁站范围内共享单车数量的预测方法。

主要使用北京市2017年5月10日-5月23日的共享单车数据以及2017年5月的地铁站刷卡数据。

步骤1，筛选地铁站周边的共享单车数据：

获取到北京市280个地铁站经纬度坐标，以各站经纬度为圆心，以500米为半径划定280个圆形，将这280个圆形区域定义为地铁单车站，这些地铁单车站的名字与地铁站的名字是一致的。将共享单车数据的起点坐标点匹配在地图上，通过空间连接可以得到落在280个圆形内的数据，即为共享单车起点数据集，同理可得共享单车终点数据集。

表1 筛选后的共享单车终点数据集

此时已完成步骤1。

步骤2，计算地铁流量数据和共享单车数据的聚类指标；

表2 地铁站的聚类指标

表3 地铁单车站的聚类指标

步骤3，K-means提取共享单车类别特征；

地铁流量数据10个指标的聚类簇数取轮廓系数最大值对应的k是3，即把地铁站分为3大类，再分别计算这三类地铁站的共享单车数据的12个指标的轮廓系数，同理取轮廓系数最大值对应的N

步骤4，张量分解提取站点模式特征；

根据北京市数据构造的三阶张量是X(X∈R

表4 U对应的KL散度值

表5 地铁站的模式特征

步骤5，提取POI、天气和气象特征；

将POI和天气特征归一化，气象特征分组后独热编码，提取结果如表6所示。

表6 POI、天气和气象特征举例

步骤6，构建三层融合的SAP-SF模型；

共享单车数据集的前12天数据做训练集，最后一天做预测集。选择7种基本的机器学习模型进行预测。根据预测精度和原理从中选中三种机器学习模型(随机森林，梯度提升决策树，Bagging回归)(见表7)。这三种模型的预测精度高而且预测原理各不相同，所以选定这三种模型作为SAP-SF模型的基学习器。

表7 机器学习模型的预测精度对比

步骤7，预测地铁站周边共享单车的数量；

SAP-SF模型的输出

表8 SAP-SF模型的预测结果

以上所述仅为本发明的实施例，并非以此限制本发明的保护范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的系统领域，均同理包括在本发明的保护范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 地铁站周边共享单车的需求预测方法 [P] . 中国专利： CN112258029A . 2021-01-22
2. 一种地铁站周边共享单车需求分析方法 [P] . 中国专利： CN113919860A . 2022-01-11
3. Demand prediction program, demand predicting device, demand forecasting method, demand prediction notification program, demand prediction notifying device and demand prediction notification method [P] . JP6950911B1 . 2021-10-13

机译：需求预测程序，需求预测装置，需求预测方法，需求预测通知计划，需求预测通知装置和需求预测通知方法
4. Life demand forecasting method, being the life demand forecasting method [P] . 日本专利： JP5411794B2 . 2014-02-12

机译：寿命需求预测方法，即寿命需求预测方法
5. WEATHER FORECAST SYSTEM, ELECTRIC POWER DEMAND FORECAST SYSTEM, METHOD OF WEATHER FORECAST AND METHOD OF ELECTRIC POWER DEMAND FORECAST [P] . 韩国专利： KR100827053B1 . 2008-05-02

机译：天气预测系统，电力需求预测系统，天气预测方法和电力需求预测方法