首页> 中国专利> 一种预测资源供应链需求量的方法、装置及存储介质

一种预测资源供应链需求量的方法、装置及存储介质

摘要

本申请实施例公开一种预测资源供应链需求量的方法、装置及存储介质,方法包括:对数据源进行预处理和特征提取,得到训练数据,基于不同数据分布的资源的供应数据、以及不同数据质量的资源的供应数据;对分层模型进行训练和预测,得到预测结果;预测结果包括待供应资源的多个预测值的分布;将预测结果输出至分位数回归模型;在预测阶段利用分位数回归模型对预测结果进行回归分析,得到在不同分位数组合下不同数据分布的资源的概率分布以及在不同分位数组合下不同数据质量的资源的概率分布。本方案能够全面预估未来的商品供货需求,极大降低商品缺货和浪费现象。

著录项

说明书

技术领域

本申请实施例涉及数据处理技术领域,尤其涉及一种预测资源供应链需求量的方法、装置及存储介质。

背景技术

现有机制中,零售业的需求可能受到季节,节假日,天气,促销等多重因素的影响,人工预估供应链的需求存在较大偏差,所以为保证商品的供应,目前主要是采用大数据与人工智能技术优化传统零售业的供应链,对供货连的商品需求量进行量化与预测,将传统零售业的供应链改造为智慧供应链,一定程度上能够预估商品需求以减少缺货或者浪费现象。

在对现有技术的研究和实践过程中,本申请实施例的发明人发现,现有的供应链预测是基于单一的机器学习模型,在预测供应链需求时存在较大偏差,且无法快速得到不同数据分布和数据质量的精确预测。

发明内容

本申请实施例提供了一种预测资源供应链需求量的方法、装置及存储介质,能够全面预估未来的商品供货需求,极大降低商品缺货和浪费现象。

第一方面中,本申请实施例提供一种预测资源供应链需求量的方法,

预测资源供应链需求量的方法,其特征在于,所述方法包括:

获取待处理的数据源并对所述数据源进行预处理和特征提取,得到训练数据,所述训练数据包括资源的第一特征向量和资源的第二特征向量,所述第一特征向量包括不同数据分布的资源的供应数据,所述第二特征向量包括不同数据质量的资源的供应数据;

基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到多个预测值的分布;

将所述多个预测值的分布输出至分位数回归模型;

在预测阶段,利用所述分位数回归模型对所述多个预测值的分布进行回归分析,得到在不同分位数组合下不同数据分布的资源的概率分布、以及在不同分位数组合下不同数据质量的资源的概率分布。

一种可能的设计中,所述基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果,包括:

将所述训练数据中数据量大小低于预设数据量的数据输入时间序列模型进行训练和预测;将所述训练数据中数据量高于预设数量且特征存在周期性变化的数据输入时间序列模型或者机器学习模型进行训练和预测;将所述训练数据中数据量高于预设数据量、不存在周期性变化且特征明显的数据输入机器学习模型进行训练和预测;以及将所述训练数据中数据量高于预设数据量、不存在周期性变化且特征不明显的数据输入深度学习模型进行训练和预测。

一种可能的设计中,所述资源为商品,所述在预测阶段,利用所述分位数回归模型对所述预测结果进行回归分析,包括:

确定供货变量,基于所述供货变量建立不同分位数的分位数回归模型;

选择取值为α的分位数作为下一步补货的实际输入,所述分位数用于指示所述供货变量的预测值;

根据置信度区间选取多个分位数阈值组合,将所述分位数阈值组合作为所述预测结果的上下界;

利用不同的分位数阈值组合对所述预测结果进行拟合,得到在不同分位数组合下不同数据分布的商品的概率分布、以及不同数据质量的商品的概率分布;其中,概率分布是指所述分位数回归模型的输出的预测值的取值范围。

一种可能的设计中,所述在预测阶段,利用所述分位数回归模型对所述预测结果进行回归分析,还包括:

计算性能度量指标,所述性能度量指标用于指示预测的误差比例,所述性能度量指标用以下公式表示:

其中,Y是真实值,y是预测值,s是所有SKU总数。wMAPE

一种可能的设计中,所述基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果之后,所述将所述预测结果输出至分位数回归模型之前,所述方法还包括:

对各子模型的预测值进行融合,得到目标预测结果;

所述对各子模型的预测值进行融合,得到目标预测结果包括以下方式的至少一种:

分别计算各个子模型的预测值的准确率,然后将准确率高于预设准确率的子模型的预测值进行模型融合,得到所述目标预测结果;

或者,分别计算各个子模型的预测值的准确率,根据准确率从高至低的顺序分别设置各个子模型的权重系数,子模型的权重系数的大小与准确率对应,基于各个子模型的权重系数对各子模型进行模型融合,得到所述目标预测结果;

或者,对各个子模型的预测值取平均,得到一个平均值,将所述平均值作为所述目标预测结果。

一种可能的设计中,所述基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果,包括:

采用损失函数预测商品各维度的评价指标,以在不同分位数阈值下得到不同的预测结果,得到一个所述预测结果;其中,所述损失函数采用以下表示方式:

其中,τ是分位数,y是资源的实际销量,

第二方面中,本申请实施例提供一种用于执行预测供应链需求量的装置,具有实现对应于上述第一方面提供的预测资源供应链需求量的方法的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块,所述模块可以是软件和/或硬件。

一种可能的设计中,所述用于预测供应链需求量的装置包括:

获取模块,用于获取待处理的数据源;

处理模块,用于对所述数据源进行预处理和特征提取,得到训练数据,所述训练数据包括资源的第一特征向量和资源的第二特征向量;基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果;所述第一特征向量包括不同数据分布的资源的供应数据,所述第二特征向量包括不同数据质量的资源的供应数据;所述预测结果包括待供应资源的多个预测值的分布;

输入输出模块,用于将所述预测结果输出至分位数回归模型;

所述处理模块还用于在预测阶段,利用所述分位数回归模型对所述预测结果进行回归分析,得到在不同分位数组合下不同数据分布的资源的概率分布、以及在不同分位数组合下不同数据质量的资源的概率分布。

一种可能的设计中,所述输入输出模块具体用于:

将所述训练数据中数据量大小低于预设数据量的数据输入时间序列模型进行训练和预测;将所述训练数据中数据量高于预设数量且特征存在周期性变化的数据输入时间序列模型或者机器学习模型进行训练和预测;将所述训练数据中数据量高于预设数据量、不存在周期性变化且特征明显的数据输入机器学习模型进行训练和预测;以及将所述训练数据中数据量高于预设数据量、不存在周期性变化且特征不明显的数据输入深度学习模型进行训练和预测。

一种可能的设计中,所述资源为商品,所述处理模块具体用于:

确定供货变量,基于所述供货变量建立不同分位数的分位数回归模型;

选择取值为α的分位数作为下一步补货的实际输入,所述分位数用于指示所述供货变量的预测值;

根据置信度区间选取多个分位数阈值组合,将所述分位数阈值组合作为所述预测结果的上下界;

利用不同的分位数阈值组合对所述预测结果进行拟合,得到在不同分位数组合下不同数据分布的商品的概率分布、以及不同数据质量的商品的概率分布;其中,概率分布是指所述分位数回归模型的输出的预测值的取值范围。

一种可能的设计中,所述处理模块还用于:

计算性能度量指标,所述性能度量指标用于指示预测的误差比例,所述性能度量指标用以下公式表示:

其中,Y是真实值,y是预测值,s是所有SKU总数。wMAPE

一种可能的设计中,所述处理模块在基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果之后,将所述预测结果输出至分位数回归模型之前,还用于:

对各子模型的预测值进行融合,得到目标预测结果;

所述处理模块通过执行以下操作的至少一种得到目标预测结果:

分别计算各个子模型的预测值的准确率,然后将准确率高于预设准确率的子模型的预测值进行模型融合,得到所述目标预测结果;

或者,分别计算各个子模型的预测值的准确率,根据准确率从高至低的顺序分别设置各个子模型的权重系数,子模型的权重系数的大小与准确率对应,基于各个子模型的权重系数对各子模型进行模型融合,得到所述目标预测结果;

或者,对各个子模型的预测值取平均,得到一个平均值,将所述平均值作为所述目标预测结果。

一种可能的设计中,所述处理模块还用于:

采用损失函数预测商品各维度的评价指标,以在不同分位数阈值下得到不同的预测结果,得到一个所述预测结果;其中,所述损失函数采用以下表示方式:

其中,τ是分位数,y是资源的实际销量,

本申请实施例又一方面提供了一种计算机装置,其包括至少一个连接的处理器、存储器和收发器,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述存储器中的计算机程序来执行上述第一方面所述的方法。

本申请实施例又一方面提供了一种计算机可读存储介质,其包括指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。

相较于现有技术,本申请实施例提供的方案中,基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到多个预测值的分布;将所述多个预测值的分布输出至分位数回归模型;在预测阶段,利用所述分位数回归模型对所述多个预测值的分布进行回归分析,得到在不同分位数组合下不同数据分布的资源的概率分布、以及在不同分位数组合下不同数据质量的资源的概率分布。由此可见,本申请实施例是根据数据质量和特征复杂程度,针对不同的数据类型和质量分别使用相应的子模型进行训练和预测,所以能够从多个维度全面的预估未来的商品供货需求,即有效挖掘真实的供应链需求,能够提高预测供应链需求的精准度,以合理供应商品、减少商品缺货和商品浪费率。

附图说明

图1为本申请实施例中预测资源供应链需求量的方法的一种流程示意图;

图2a为本申请实施例中分层训练的一种流程示意图;

图2b为本申请实施例中神经网络的一种结构示意图;

图3a为本申请实施例中对预测结果取平均的一种结果示意图;

图3b为本申请实施例中利用分位数回归模型对预测结果进行回归分析的一种流程示意图;

图4为本申请实施例中用于预测资源供应链需求量的装置的结构示意图;

图5为本申请实施例中服务器的结构示意图。

具体实施方式

本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请实施例中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请实施例中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请实施例方案的目的。

本申请实施例供了一种预测资源供应链需求量的方法、装置及存储介质,可用于服务器侧,服务器可用于预测资源供应链需求量,例如预测零售业中商品的供货需求。

为解决上述技术问题,本申请实施例主要提供以下技术方案:

结合多个子模型去训练和预测不同数据分布、不同数据质量的商品,采用损失函数得到多个预测结果的分布,在不同分位数阈值下得到不同的预测结果,给出一个预测结果的分布,从多个维度全面的预估未来的商品供货需求,即能够提供商品供货更多的预估状态。以及对各子模型输出的预测结果进行拟合得到一个新预测结果,利用分位数回归模型对预测结果进行回归分析。该新预测结果能够更准确的体现出供货链中真实的商品预估状态,因此能够进一步的明确商品需求,降低商品缺货和浪费现象。

参照图1,以下介绍本申请实施例所提供的一种预测资源供应链需求量的方法,本申请实施例包括:

101、获取待处理的数据源并对所述数据源进行预处理和特征提取,得到训练数据。

其中,所述训练数据包括资源的第一特征向量和资源的第二特征向量,所述第一特征向量包括不同数据分布的资源的供应数据,所述第二特征向量包括不同数据质量的资源的供应数据。

一些实施方式中,预处理包括数据提取、异常值处理和数据标准化。特征提取包括从预处理后的数据源中提取特征向量,以提取时间窗口特征、商品/商店特征、滑动窗口特征和供应环境特征。

其中,数据提取:从数据库提取历史数据来训练模型和参数优化,每日增量实时数据用于线上预测,所有数据均为天级别SKU粒度的数据。

异常值处理:负值和缺失值的处理。负值处理:由于有退货和商品盘点存在盘盈与盘亏的情况产生,因此商品的销量可能为负值,在此将所有负值赋为0。空值处理:由于数据质量原因,存在一些缺失,在此将缺失值补全为临近天的均值。

数据标准化:将商品销量数据进行log函数转换,将数据进行标准化有助于深度学习模型中梯度下降步骤的收敛速度和精度。

时间窗口特征:滞后特征(也可称为lag特征)和滑动窗口统计特征。

资源供应者/资源特征:资源供应者/资源的分类、资源供应者的地区属性、资源供应者的开业时长、以及资源属性和分类。假如资源为商品,那么所述资源供应者/资源特征可为商店/商品特征,仅仅为1个示例,不对此作限定。

滑动窗口特征:计算前n个值的均值、中位数、方差、标准差、斜率和衰减斜率等。

供应环境特征:天气、地区人口密度、竞品信息、城市地理栅格人口数据、区域商业地产数据和POI相关数据。

在特征提取阶段还可以对所述数据源进行二值化处理,以得到稀疏矩阵,以及对所述数据源进行特征交叉,以产生新的特征。

102、基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果。

其中,所述预测结果包括待供应资源的多个预测值的分布。一个预测值表示在预设时长内供应资源的一个预估状态。

一些实施方式中,为提高模型的训练效果和预测效果,还可以按照数据类型去根据数据量大小、特征周期性以及特征的复杂程度来选择对应的子模型用于训练和预测。子模型有时间序列模型、机器学习模型、深度学习模型。具体来说,将所述训练数据中数据量大小低于预设数据量的数据输入时间序列模型进行训练和预测;将所述训练数据中数据量高于预设数量且特征存在周期性变化的数据输入时间序列模型或者机器学习模型进行训练和预测;将所述训练数据中数据量高于预设数据量、不存在周期性变化且特征明显的数据输入机器学习模型进行训练和预测;将所述训练数据中数据量高于预设数据量、不存在周期性变化且特征不明显的数据输入深度学习模型进行训练和预测。

具体分层训练的流程图如图2a所示。图2a中,机器学习模型由随机森林模型(RandomForest)、轻量级决策树模型(英文全称:Light Gradient Boosting,英文简称:LightGBM)和梯度提升决策树模型(英文全称:X Gradient Boosting Decision Tree,英文简称:XGboost)三种树模型线性加权融合而成。机器学习模型适合处理数据量大、不存在周期性变化且特征明显的数据,能够提高收敛速度和精度。

深度学习模型包括(英文全称:Gated Recurrent Unit,英文简称:GRU)模型,利用GRU模型提取时序特征和非线性特征的能力去从所述第一特征向量和所述第二特征向量中提取到能够反映真实资源的时许特征和非线性特征。其中,时域特征包括所述第一特征向量和所述第二特征向量的均值、均方根、偏度、峭度、波形因子、波峰因子、脉冲因子、峭度因子等。非线性特征是使用局部结构对全局结构进行编码或非线性变换得到的数据空间的特征。深度学习模型适合处理数据量大、存在周期性变化且特征不明显的数据,具备强大的非线性特征提取能力。

时间序列模型是由Prophet、Arima和Holt-Winters线性加权融合而成,Arima和Holt-Winters均为自回归模型,时间序列模型适合处理数据量小且周期性强的数据,Prophet在周期性强的数据的基础上加入天气节假日等外部特征,能够进一步提升模型的预测性能。

因为每种模型各自偏向于处理哪类数据,或者在处理其他数据不擅长,本申请实施例对神经网络的结构进行改进,即在隐藏层用3个并联的模型去处理输入(input),本申请实施例改进后的神经网络的一种结构示意图如图2b所示,该神经网络包括输入层(input)、隐藏层和输出层(output),隐藏层包括时间序列模型、机器学习模型和深度学习模型,向如图2b所示的神经网络输入训练文本,在输入层对训练文本进行处理,得到input。input包括a1、a2、a3和a4,a1输入时间序列模型,a2输入时间序列模型和机器学习模型,a3a号输入机器学习模型,a4输入深度学习模型;output包括a1’、a2’、a3’和a4’。相较于现有机制中仅能分开用单个模型去对输入的原始数据进行训练和预测而言,本申请实施例基于对采集的原始input进行改进(即将原始input处理为第一特征向量和第二特征向量)的基础上,使得不同的input能够映射到不同的神经网络,进而实现对不同的input进行分层处理,使得分层模型最终的输出(output)会完全不同。可见,通过改造结构来改进数据处理方式,分别针对各自擅长数据进行处理,这样就提高整个神经网络的效果。因此,通过分层训练的方式,能够针对不同数据选择最适合的模型用于训练,进而进行有针对性的预测,提高预测的准确率。

本申请实施例中,在基于所述第一特征向量和所述第二特征向量对各子模型进行训练时,可基于分布式计算各子模型的参数,并选择最佳的一组模型参数。为提高各子模型自动调参的效率,可采贝叶斯优化的(英文全称:tree of parzen estimators,英文简称:TPE)算法,通过有限次的迭代即可完成收敛,且迭代次数少。

本申请实施例采用损失函数能够在不同分位数阈值下得到不同的预测值,给出多个预测值的分布,而不仅仅是一个预测值。所以,能够提供商品供货更多的预估状态,以便用户采取不同场景下的应对策略。相较于现有机制中单一的预测值而言,单一的预测值仅能代表1个预估状态,一旦该预估状态未实质上发生,或者发生的结果未达到预期,仍然会造成部分缺货或者浪费的现象。本申请实施例由于有多个预估结果的分布,所以能够从多个维度全面的预估未来的商品供货需求,极大降低商品缺货和浪费现象。

一些实施方式中,经过基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果之后,将该预测结果输出至分位数回归模型之前,为进一步明确供应量需求和提高预测结果的准确率,还可以对各子模型的预测值进行融合(也可称为拟合,不对此作区分),以在各种不同的机器学习任务中使结果获得提升。为便于表述将这一过程简称为模型拟合(也可称为模型融合),本申请实施例中的模型拟合综合考虑不同子模型输出的预测值,并将各个子模型的多个预测值融合到一起。具体来说,可采用下述方案:

(1)多数表决融合

分别计算各个子模型的预测值的准确率,然后将准确率top3的子模型的预测值进行模型融合,得到准确率更高的预测结果。采用该方案后,不需要重新训练模型,只需要取不同子模型的预测值,然后采取某种措施得出一个最终的预测结果即可。

例如,现在有10条记录,每条记录能被正确分类的概率为70%,或者某个模型对这10条记录进行分类能获得70%的准确率。现在拟合三个相当的模型,采用多数表决的情况下,对每条记录,三个模型都判断正确的概率为0.7*0.7*0.7~=0.34,两个模型判断正确的概率为0.7*0.7*0.3*3~=0.44,那么通过三个准确率0.7的模型来融合的话,理论上最终每条记录能被正确分类的概率提升到0.78。

(2)加权决策融合

分别计算各个子模型的预测值的准确率,然后根据准确率从高至低的顺序分别设置各个子模型的权重系数,子模型的权重系数的大小与准确率对应,准确率越高,子模型的权重系数越大。然后基于各个子模型的权重系数对这些子模型进行模型融合,得到准确率更高且更合理的预测结果。

(3)对预测结果取平均

对各个子模型的预测值取平均,得到一个平均值。如图3a所示,图3a中的实心圆圈和空心圆圈均代表预测值。实线曲线为现有机制中采用单个模型输出的预测值,单个模型因为过拟合产生了实线曲线的决策边界。虚线曲线为本申请实施例采用对多个子模型的预测值取平均后的预测结果。与现有机制相比,本申请实施例取平均后,在对各预测值进行分类时,决策边界会慢慢的往虚线曲线靠拢。一方面能够提高预测结果的准确率,另一方面可以减少过拟合现象。

103、将所述预测结果输出至分位数回归模型。

104、在预测阶段,利用所述分位数回归模型对所述预测结果进行回归分析,得到在不同分位数组合下不同数据分布的资源的概率分布、以及在不同分位数组合下不同数据质量的资源的概率分布。

一些实施方式中,选取取值为α的分位数(即预测值)作为下一步补货的实际输入。根据置信度区间选取多个分位数阈值组合,将分位数阈值组合作为预测结果的上下界,用不同的分位数阈值组合对预测结果进行拟合,即可得到在不同分位数组合下不同数据分布的商品的概率分布、以及不同数据质量的商品的概率分布。其中,概率范围是指分位数回归模型的输出值的取值范围,概率范围可用残差图数据表示。图3b为本申请实施例中利用所述分位数回归模型对所述预测结果进行回归分析的一种流程示意图。

一些实施方式中,将模型拟合的目标调整为当前的样本残差,例如采用损失函数的负梯度作为当前决策树的样本残差近似值去拟合另一个决策树。损失函数的负梯度的一种表示方式如下:

其中,τ是分位数,y是资源的实际销量,

可见,各子模型通过使用损失函数(Quantile Loss)预测资源各维度的评价指标,即上述负梯度用于估量各子模型的预测值α与实际值y的不一致程度。

与现有机制相比,本申请实施例中,基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果;将所述预测结果输出至分位数回归模型;在预测阶段,利用所述分位数回归模型对所述预测结果进行回归分析,得到在不同分位数组合下不同数据分布的资源的概率分布、以及在不同分位数组合下不同数据质量的资源的概率分布。由此可见,本申请实施例是根据数据质量和特征复杂程度,针对不同的数据类型和质量分别使用相应的子模型进行训练和预测,所以能够从多个维度全面的预估未来的商品供货需求,即有效挖掘真实的供应链需求,能够提高预测供应链需求的精准度,以合理供应商品、减少商品缺货和商品浪费率。

具体来说,在基于第一特征向量和第二特征向量进行训练和预测时,采用损失函数得到多个预测值的分布,在不同分位数阈值下得到不同的预测结果,给出一个预测值的分布,而不仅仅是一个预测值。所以能够提供商品供货更多的预估状态,以便用户采取不同场景下的应对策略。相较于现有机制中单一的预测值而言,单一的预测值仅能代表1个预估状态,一旦该预估状态未实质上发生,或者发生的结果未达到预期,仍然会造成部分缺货或者浪费的现象。本申请实施例由于有多个预估结果的分布,所以能够从多个维度全面的预估未来的商品供货需求,以及降低商品缺货和浪费现象。

此外,对各子模型输出的预测结果进行拟合得到一个新预测结果,该新预测结果能够更准确的体现出供货链中真实的商品预估状态,因此能够进一步的明确商品需求,降低商品缺货和浪费现象。

可选的,在本申请实施例的一些实施例中,为直观呈现预测的误差比例,还可以设置性能度量指标。性能指标可采用下式所示的加权误差绝对值(weighted mean absolutepercentage error,wMAPE)模型计算得到:

其中,Y是真实值,y是预测值,s是所有SKU总数。wMAPE

图1至图3中任一项所对应的实施例中所提及的任一技术特征也同样适用于本申请实施例中的图4和图5所对应的实施例,后续类似之处不再赘述。

以上对本申请实施例中一种预测供应链需求量的方法进行说明,以下对执行上述预测供应链需求量的装置进行介绍。

上面对本申请实施例中的一种预测供应链需求量的方法进行了描述,下面对本申请实施例中的装置40进行描述。

参阅图4,如图4所示的一种用于预测供应链需求量的装置40的结构示意图,其可应用于预测资源供应链需求量.本申请实施例中的装置40能够实现对应于上述图1所对应的实施例中所执行的预测供应链需求量的方法的步骤。装置40实现的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块,所述模块可以是软件和/或硬件。所述装置40可包括处理模块401、输入输出模块402和获取模块403,所述处理模块401、所述输入输出模块402和所述获取模块403的功能实现可参考图1所对应的实施例中所执行的操作,此处不作赘述。例如,所述处理模块401可用于控制所述输入输出模块402的输出操作,以及控制所述获取模块403的获取操作。

一些实施方式中,所述获取模块403可用于获取待处理的数据源;

所述处理模块401可用于对所述数据源进行预处理和特征提取,得到训练数据,所述训练数据包括资源的第一特征向量和资源的第二特征向量;基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果;所述第一特征向量包括不同数据分布的资源的供应数据,所述第二特征向量包括不同数据质量的资源的供应数据;所述预测结果包括待供应资源的多个预测值的分布;

所述输入输出模块402可用于将所述预测结果输出至分位数回归模型;

所述处理模块401还用于在预测阶段,利用所述分位数回归模型对所述预测结果进行回归分析,得到在不同分位数组合下不同数据分布的资源的概率分布、以及在不同分位数组合下不同数据质量的资源的概率分布。

与现有机制相比,本申请实施例中,所述处理模块401基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到多个预测值的分布;所述输入输出模块402将所述多个预测值的分布输出至分位数回归模型;在预测阶段,所述处理模块401利用所述分位数回归模型对所述多个预测值的分布进行回归分析,得到在不同分位数组合下不同数据分布的资源的概率分布、以及在不同分位数组合下不同数据质量的资源的概率分布。由此可见,本申请实施例是根据数据质量和特征复杂程度,针对不同的数据类型和质量分别使用相应的子模型进行训练和预测,所以能够从多个维度全面的预估未来的商品供货需求,即有效挖掘真实的供应链需求,能够提高预测供应链需求的精准度,以合理供应商品、减少商品缺货和商品浪费率。

一些实施方式中,所述输入输出模块402具体用于:

将所述训练数据中数据量大小低于预设数据量的数据输入时间序列模型进行训练和预测;将所述训练数据中数据量高于预设数量且特征存在周期性变化的数据输入时间序列模型或者机器学习模型进行训练和预测;将所述训练数据中数据量高于预设数据量、不存在周期性变化且特征明显的数据输入机器学习模型进行训练和预测;以及将所述训练数据中数据量高于预设数据量、不存在周期性变化且特征不明显的数据输入深度学习模型进行训练和预测。

一些实施方式中,所述资源为商品,所述处理模块401具体用于:

确定供货变量,基于所述供货变量建立不同分位数的分位数回归模型;

选择取值为α的分位数作为下一步补货的实际输入,所述分位数用于指示所述供货变量的预测值;

根据置信度区间选取多个分位数阈值组合,将所述分位数阈值组合作为所述预测结果的上下界;

利用不同的分位数阈值组合对所述预测结果进行拟合,得到在不同分位数组合下不同数据分布的商品的概率分布、以及不同数据质量的商品的概率分布;其中,概率分布是指所述分位数回归模型的输出的预测值的取值范围。

一些实施方式中,所述处理模块401还用于:

计算性能度量指标,所述性能度量指标用于指示预测的误差比例,所述性能度量指标用以下公式表示:

其中,Y是真实值,y是预测值,s是所有SKU总数。wMAPE

一些实施方式中,所述处理模块401在基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果之后,将所述预测结果输出至分位数回归模型之前,还用于:

对各子模型的预测值进行融合,得到目标预测结果;

所述处理模块通过执行以下操作的至少一种得到目标预测结果:

分别计算各个子模型的预测值的准确率,然后将准确率高于预设准确率的子模型的预测值进行模型融合,得到所述目标预测结果;

或者,分别计算各个子模型的预测值的准确率,根据准确率从高至低的顺序分别设置各个子模型的权重系数,子模型的权重系数的大小与准确率对应,基于各个子模型的权重系数对各子模型进行模型融合,得到所述目标预测结果;

或者,对各个子模型的预测值取平均,得到一个平均值,将所述平均值作为所述目标预测结果。

一些实施方式中,所述处理模块401还用于:

采用损失函数预测商品各维度的评价指标,以在不同分位数阈值下得到不同的预测结果,得到一个所述预测结果;其中,所述损失函数采用以下表示方式:

其中,τ是分位数,y是资源的实际销量,

上面从模块化功能实体的角度对本申请实施例中的网络认证服务器和终端设备进行了描述,下面从硬件处理的角度分别对本申请实施例中的网络认证服务器和终端设备进行描述。需要说明的是,在本申请实施例图4所示的实施例中的输入输出模块对应的实体设备可以为输入输出单元或者输入输出设备或者输入输出接口,处理模块对应的实体设备可以为处理器,获取模块所对应的实体设备可以是处理器或者输入输出单元。图4所示的装置可以具有如图5所示的结构,当图4所示的装置具有如图5所示的结构时,图5中的处理器和收发器能够实现前述对应该装置的装置实施例提供的处理模块和收发模块相同或相似的功能,图5中的中央存储器存储处理器执行上述预测供应链需求量的方法时需要调用的计算机程序。

例如,所述处理器通过调用存储器中的指令,执行以下操作:

获取待处理的数据源;

对所述数据源进行预处理和特征提取,得到训练数据,所述训练数据包括资源的第一特征向量和资源的第二特征向量;基于所述第一特征向量和所述第二特征向量对分层模型进行训练和预测,得到预测结果;所述第一特征向量包括不同数据分布的资源的供应数据,所述第二特征向量包括不同数据质量的资源的供应数据;所述预测结果包括待供应资源的多个预测值的分布;

通过所述输入输出单元将所述预测结果输出至分位数回归模型;

在预测阶段,利用所述分位数回归模型对所述预测结果进行回归分析,得到在不同分位数组合下不同数据分布的资源的概率分布、以及在不同分位数组合下不同数据质量的资源的概率分布。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请实施例所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本申请实施例各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

以上对本申请实施例所提供的技术方案进行了详细介绍,本申请实施例中应用了具体个例对本申请实施例的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请实施例的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请实施例的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号