首页> 中国专利> 一种销量预测模型的训练方法、销量预测方法及相关装置

一种销量预测模型的训练方法、销量预测方法及相关装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本申请公开了一种销量预测模型的训练方法、销量预测方法及相关装置，其中，销量预测模型的训练方法包括：获取表征门店历史销售信息的多个样本数据；利用所述多个样本数据在多个维度上的特征差异构造新的样本数据；将所述样本数据与所述新的样本数据融合为训练样本，并利用所述训练样本对预先构建的神经网络进行训练，得到销量预测模型。解决了现有通过时间序列进行销量预测时适配性差、准确率较低的技术问题。

著录项

公开/公告号CN113888235B

专利类型发明专利
公开/公告日2022-07-08

原文格式PDF
申请/专利权人创优数字科技（广东）有限公司;
展开▼

申请/专利号CN202111234448.6
发明设计人乔世吉;杨粤;张威;容宝祺;李知之;
展开▼

申请日2021-10-22
分类号G06Q30/02(2012.01);G06N3/08(2006.01);
代理机构北京集佳知识产权代理有限公司 11227;
代理人李增苗
地址 516000 广东省广州市海珠区新港东路2429号首层自编011房(仅限办公)
入库时间 2022-08-23 14:00:12

法律信息

法律状态公告日

法律状态信息

法律状态
2022-07-08

授权

发明专利权授予

说明书

技术领域

本申请涉及信息技术领域，尤其涉及一种销量预测模型的训练方法、销量预测方法及相关装置。

背景技术

随着信息技术的发展，产生了大量数据。将这些数据结合时间戳进行统计，就构成了时间序列。使用时间序列的预测方法可以分析时间序列中数据内在的特性和规律，进而通过这些特性和规律对未来行为进行预测，例如天气预测、销量预测等。

现有通过时间序列进行销量预测时，都是基于历史数据训练好的模型进行的。但是，现有销量预测方法在有的场景下不适配，导致预测准确率较低。因此，提供一种适配性较高、准确率较高的销量预测方法是本领域技术人员亟待解决的技术问题。

发明内容

本申请提供了一种销量预测模型的训练方法、销量预测方法及相关装置，解决了现有通过时间序列进行销量预测时适配性差、准确率较低的技术问题。

有鉴于此，本申请第一方面提供了一种销量预测模型的训练方法，包括：

获取表征门店历史销售信息的多个样本数据；

利用所述多个样本数据在多个维度上的特征差异构造新的样本数据；

将所述样本数据与所述新的样本数据融合为训练样本，并利用所述训练样本对预先构建的神经网络进行训练，得到销量预测模型。

可选地，所述多个维度包括：时间维度、销量维度和商品类别维度；

所述利用所述多个样本数据在多个维度上的特征差异构造新的样本数据，包括：

通过预设的组合方式，将各所述样本数据在所述时间维度上的第一数据特征、所述销量维度上的第二数据特征、所述商品类别维度上的第三数据特征进行组合，得到新的样本数据。

可选地，通过预设的组合方式，将各所述样本数据在所述时间维度上的第一数据特征、所述销量维度上的第二数据特征、所述商品类别维度上的第三数据特征进行组合，得到新的样本数据，包括：

获取各所述样本数据在所述时间维度上的第一数据特征、所述销量维度上的第二数据特征和所述商品类别维度上的第三数据特征；

计算多个所述第一数据特征相互之间的第一差值，并确定由多个所述第一差值相加组成的第一特征和；

计算多个所述第二数据特征相互之间的第二差值，并确定由多个所述第二差值相加组成的第二特征和；

计算多个所述第三数据特征的平均值；

将所述第一特征和、所述第二特征和以及所述平均值进行组合，得到新的样本数据。

可选地，多个所述样本数据对应的时间周期均相同，所述第一数据特征的获取过程包括：

获取各所述样本数据对应的时间段；

统计各所述时间段内的节假日天数，并将该节假日天数作为对应样本数据的第一数据特征。

可选地，获取表征门店历史销售信息的多个样本数据，包括：

获取门店历史销售信息对应的时间序列；

利用预设时间周期的滑动窗，对所述时间序列进行滑动分段得到多个历史分段数据；

对各所述历史分段数据内的销售数据进行统计，得到各所述历史分段数据对应的样本数据。

本申请第二方面提供了一种销量预测方法，包括：

获取待预测时间段和待预测门店；

统计所述待预测时间段内的节假日天数；

将所述待预测门店对应的门店信息和历史销量输入至销量预测模型，得到所述待预测门店在所述待预测时间段内的预测销量，其中，所述销量预测模型是通过任一种第一方面所述的销量预测模型的训练方法训练得到的。

本申请第三方面提供了一种销量预测模型的训练装置，包括：

获取单元，用于获取表征门店历史销售信息的多个样本数据；

构造单元，用于利用所述多个样本数据在多个维度上的特征差异构造新的样本数据；

训练单元，用于将所述样本数据与所述新的样本数据融合为训练样本，并利用所述训练样本对预先构建的神经网络进行训练，得到销量预测模型。

本申请第四方面提供了一种销量预测装置，包括：

获取单元，用于获取待预测时间段和待预测门店；

统计单元，用于统计所述待预测时间段内的节假日天数；

预测单元，用于将所述待预测门店对应的门店信息和历史销量输入至销量预测模型，得到所述待预测门店在所述待预测时间段内的预测销量，其中，所述销量预测模型是通过任一种第一方面所述的销量预测模型的训练方法训练得到的。

本申请第五方面提供了一种销量预测模型的训练设备，所述销量预测模型的训练设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行如任一种第一方面所述的销量预测模型的训练方法，或者执行如第二方面所述的销量预测方法。

本申请第六方面提供了一种存储介质，所述存储介质用于存储程序代码，所述程序代码用于执行如任一种第一方面所述的销量预测模型的训练方法，或者执行如第二方面所述的销量预测方法。

从以上技术方案可以看出，本申请具有以下优点：

发明人在研究现有技术后发现，现有销量预测方法适配性差、准确率低的原因在于：用于训练销量预测模型的历史数据梯度变化较小、波动性小，无法学习到波动性较大的数据，导致基于历史数据训练得到的销量预测模型无法针对波动性大的输入数据进行销量预测。

有鉴于此，本申请中销量预测模型的训练方法，首先获取表征门店历史销售信息的多个样本数据，接着利用多个样本数据在多个维度上的特征差异构造新的样本数据，最后将样本数据与新的样本数据融合为训练样本，并利用训练样本对预先构建的神经网络进行训练，得到销量预测模型。即本申请中利用历史的样本数据构造新的样本数据，并将历史的样本数据和新的样本数据融合为训练样本，由于训练样本包含了不同维度下的特征，增强了数据的平衡性，对调整模型的内部参数更具有普适性，通过上述训练样本得到的销量预测模型普适性强、能承受波动性大的输入数据、预测更准确，从而解决了通过时间序列进行销量预测时适配性差、准确率较低的技术问题。

附图说明

为了更清楚地说明本申请实施例中的技术方法，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本申请实施例中一种销量预测模型的训练方法的实施例一的流程示意图；

图2为本申请实施例中一种销量预测模型的训练方法的实施例二的流程示意图；

图3为本申请实施例中一种销量预测模型的训练方法的应用例的示意图；

图4为本申请实施例中一种销量预测方法的实施例的流程示意图；

图5为本申请实施例中一种销量预测模型的训练装置的实施例的结构示意图；

图6为本申请实施例中一种销量预测装置的实施例的结构示意图。

具体实施方式

本申请设计了一种销量预测模型的训练方法、销量预测方法及相关装置，解决了现有通过时间序列进行销量预测时适配性差、准确率较低的技术问题。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解，请参阅图1，图1为本申请实施例中一种销量预测模型的训练方法的实施例一的流程示意图。

本实施例中一种销量预测模型的训练方法具体包括：

步骤101、获取表征门店历史销售信息的多个样本数据。

具体地，本申请中的样本数据可以对应同一门店，例如均对应门店A。也可以对应非同一门店(即多个门店)，例如对应门店A、B、C、D。对应多个门店时，训练得到的销量预测模型对这多个门店均可进行销量预测，样本数据对应门店A、B、C、D，通过门店A、B、C和D的训练样本得到的销量预测模型可以对门店A、B、C和D中的任意一个门店进行销量预测。

由于各门店对应的训练样本中包括样本数据，同时新的样本数据也是基于样本数据生成的，因此首先获取表征门店历史销售信息的多个样本数据。可以理解的是，对于样本数据的获取方式本实施例中不做具体限定。

需要说明的是，本实施例中的历史销售信息可以是：历史销量、历史销售品类、历史销售总价等；也可以是历史销量对应的时间信息、门店位置、门店营业时长等，具体地本领域技术人员可以根据预测需要进行设置，在本实施例中不做具体限定。

步骤102、利用多个样本数据在多个维度上的特征差异构造新的样本数据。

具体地，利用样本数据构造新的样本数据时，在一种实施方式中，可以是将样本数据在多个维度上的特征差异，按照同一种组合方式批量构造多个新的样本数据。例如特征差异包括：E、F、G和H，其中E和F对应构造一个新的样本数据P，G和H对应构造一个新的样本数据Q，此时对应的组合方式为M，即将E和F按照组合M构造新的样本数据P，将G和H按照组合M构造新的样本数据Q。

可以理解的是，在另一种实施方式中，可以是将样本数据在多个维度上的特征差异按照不同的组合方式分别构造多个新的样本数据。例如特征差异包括：E、F、G和H，其中E和F对应构造一个新的样本数据P，对应的组合方式为M；G和H对应构造一个新的样本数据Q，对应的组合方式为N，即将E和F按照组合M构造新的样本数据P，将G和H按照组合N构造新的样本数据Q。

具体地，上述的组合方式可以包括各种类型的线性运算、非线性运算，等等。例如组合方式M可以是样本数据在各个相同数据维度上的简单加减，组合方式N则可以是先对样本数据归一化，再在指定的数据维度上求取归一化后的样本数据的总量和。又例如组合方式M可以是对样本数据在指定的数据维度上的加权平均，等等。本实施例对具体组合方式的内容不作限定。

步骤103、将样本数据与新的样本数据融合为训练样本，并利用训练样本对预先构建的神经网络进行训练，得到销量预测模型。

在得到训练样本后，通过训练样本对预先构建的神经网络进行训练，便可得到训练好的销量预测模型，通过该模型便可进行门店的销量预测。

现有方法中用于训练模型的训练样本是已有、现成的历史数据，但是这部分历史数据中大都是一些梯度变化小、波动性小的数据，而波动较大、梯度变化大的数据极少，整体的数据分布较为稳定，数据内容较为单一，通过这样的数据训练得到的模型在应用时，面对波动性较大的输入数据容易出现预测精度低、稳定性差的缺陷。因此，本申请中通过已有的样本数据，用这些样本数据相互之间的特征差异构造新的样本数据，使得新的样本数据的数据形式更为多样化，数据内容更为丰富，再将已有的样本数据和新的样本数据融合作为训练样本，使得训练样本中样本数据和新的样本数据的占比得以调整，例如新样本占比50％、旧样本占比50％；或旧样本60％、新样本40％，可调整占比的训练样本的数据波动性是可变化的，其数据梯度变化是可控的，可调整占比使得训练样本提升了自身数据的多样性，从不同维度丰富了数据内容，利用该训练样本训练销量预测模型能够更全面的完善模型，提高模型的鲁棒性以及精准度。

需要说明的是，当本实施例中的样本数据来源于多个门店的历史销售信息时，经步骤102处理后得到的新的样本数据则相应的对应多个门店，进而由样本数据和新的样本数据组合得到的训练样本也对应多个门店，故通过训练样本训练得到的销量预测模型可以对多个门店的销售信息进行预测，即同一个销量预测模型可以对多个不同的门店进行销量预测，从而克服现有的销量预测模型只能针对一个门店进行匹配式销量预测的缺陷。

进一步的，现有方法在对销量预测模型进行训练时，只针对一家门店训练，输入的训练样本是这一家门店的样本数据，所以预测时也就只能针对该门店进行销量预测。而通过上述描述可以知道，本申请可以从不同门店的样本数据中提取相同类别的数据特征(例如销售同一个商品品类的销量、时间、地理位置等)，用这些数据特征去训练模型、对模型进行调调参，对应得到的销量预测模型就可以针对任一门店进行销量预测。因此，本申请中训练得到的销量预测模型普适性更广，同时可以解决现有训练销量预测模型时，必须针对各门店单独训练一个适配性模型，针对多个门店时需要训练多个模型，从而造成计算资源浪费的问题。

可以理解的是，上述的神经网络可以是常用的神经网络结构，也可以是对常用的神经网络进行改进后得到的，本实施例对此不作限定。例如，神经网络结构可以选择卷积神经网络CNN(Convolutional Neural Networks)、区域卷积神经网络R-CNN(Region withCNN Feature)、多层全连接神经网络MLP(Muti-Layer Perception)、时间递归神经网络LSTM(Long short-term Memory Network)等中的任意一个，或对选择的神经网络进行改进后得到，本实施例对此不作限定。

在一种优选的实施方式中，步骤103中预先构建的神经网络可以是多层全连接神经网络MLP，该神经网络支持高效率的并行训练，并且具有更快的训练速度、更低的内存消耗、更高的准确率、支持分布式系统可以快速处理海量数据等优点。

可以理解的是，训练预置的神经网络时，可以利用前向传播和反向传播的方式进行，对于训练过程中的模型参数的调整算法可以为梯度下降算法等，本实施例中对此均不作限定。

为了便于理解，本实施例中以预置的神经网络为多层全连接神经网络MLP时，训练得到销量预测模型的过程进行详细说明。

具体训练时，将多层全连接神经网络MLP作为预置的神经网络，设置好训练条件后，将训练样本输入至多层全连接神经网络MLP、训练样本对应的实际销量(历史销量和新销量)作为多层全连接神经网络MLP的目标输出，对比训练时多层全连接神经网络MLP的实际输出和目标输出之间的相似度(或二者相同的概率亦或二者之间的差值)，直至多层全连接神经网络MLP的实际输出和上述的目标输出高度相似(即相似度值很高或置信度大亦或损失值收敛至很小)，停止多层全连接神经网络MLP的训练，此时的多层全连接神经网络MLP可以视为训练完成，对应的可将训练完成的多层全连接神经网络MLP作为销量预测模型。

进一步地，本申请中预置的神经网络可以选取轻量化的梯度提升机算法LightGBM(Light Gradient Boosting Machine)，以解决将海量销售数据作为样本数据训练模型时消耗量大的问题。该算法结构的基本思想是决策树算法，具体地该结构抛弃了大多数GBDT工具使用的按层生长(level-wise)的决策树生长策略，使用了带有深度限制的按叶子生长(leaf-wise)算法，即采用了Leaf-wise的增长策略，该策略每次从当前所有叶子中，找到分裂增益最大的一个叶子，然后分裂，如此循环。因此同Level-wise相比，Leaf-wise的优点是：减少了计算量，在分裂次数相同的情况下，Leaf-wise可以降低更多的误差，得到更好的精度。同时该结构在训练过程中采用单边梯度算法过滤掉梯度小的样本，也减少了大量的计算。

本实施例中销量预测模型的训练方法，首先获取表征门店历史销售信息的多个样本数据，接着利用多个样本数据在多个维度上的特征差异构造新的样本数据，最后将样本数据与新的样本数据融合为训练样本，并利用训练样本对预先构建的神经网络进行训练，得到销量预测模型。即本申请中利用历史的样本数据构造新的样本数据，并将历史的样本数据和新的样本数据融合为训练样本，由于训练样本包含了不同维度下的特征，增强了数据的平衡性，对调整模型的内部参数更具有普适性，通过上述训练样本得到的销量预测模型普适性强、能承受波动性大的输入数据、预测更准确，从而解决了通过时间序列进行销量预测时适配性差、准确率较低的技术问题。

以上为本申请实施例提供的一种销量预测模型的训练方法的实施例一，以下为本申请实施例提供的一种销量预测模型的训练方法的实施例二。

请参阅图2，图2为本申请实施例中一种销量预测模型的训练方法的实施例二的流程示意图。

如图2所示，本实施例中的一种销量预测模型的训练方法具体包括：

步骤201、获取门店历史销售信息对应的时间序列。

本实施例中的历史销售信息可以是：历史销量、历史销售品类、历史销售总价、历史销量对应的时间信息、门店位置、门店营业时长等。将上述各种数据类型的历史销售信息结合时间戳便构成该数据类型对应的时间序列。例如当历史销售信息为历史销量时，历史销量结合对应的时间戳便可构成历史销量对应的时间序列。时间序列的长度可以根据实际需要进行灵活设置，本实施例中对此不做具体限定。

对于历史销量对应的时间序列的获取，在一种实施方式中，为了计算的高效和快速，本申请中的时间序列是根据销量即时生成的，即得到一个销量就将该销量添加至时间序列中，得到新的时间序列，这样在获取的时候可以直接获取时间序列。在另一种实施方式中，为了便于进行数据的管理，时间序列是基于步骤201的执行实时生成的，即所有的历史销量和时间戳都各自存储在对应的数据存储库中，在获取时间序列时，获取对应的时间戳和历史销量并生成时间序列。

进一步地，为了提高销量预测模型的准确性，本实施例中首先对用于训练的历史销量进行预处理，剔除该部分数据异常带来的扰动。可以理解的是，此处的预处理可以是剔除异常值(例如在某个工作日时，历史销量的异常高值、或者在某个节假日时，历史销量的异常低值)、补齐缺失值等处理，本实施例中对此不做具体限定。

可以理解的是，当历史销售信息为其他数据是可以参考前述历史销量的描述，本实施例中对此不做赘述。

步骤202、利用预设时间周期的滑动窗，对时间序列进行滑动分段得到多个历史分段数据。

可以理解的是，本实施例中的预设时间周期可以是以周为一个周期，也可以是者以月为一个周期，还可以是以年为一个周期，具体地本领域技术人员可以根据需要进行选择，在此不再赘述。

一般来说，时间序列的总时间长度大于预设时间周期对应的时间长度，这样才可以在时间序列上进行滑动窗分段后，得到预设时间周期对应的多个历史分段数据。本实施例中以历史销售信息包括历史销量时为例进行举例说明。例如，当滑动窗的长度(即预设时间周期对应的时间长度)为7天，这样得到的每一个历史分段数据为7天内的历史销量(即一周的历史销量)。当滑动窗的长度为30天时，这样得到的每一个历史分段数据为30天内的历史销量(即一个月的历史销量)。

需要说明的是，对于相邻的滑动窗之间的窗口间隔，本领域技术人员可以根据需要进行设置，例如，3天、4天、8天等，本实施例中对此不做具体限定。可以理解的是，上述的窗口间隔即隔几个历史销量(即窗口间隔)进行滑动窗的分段。例如当窗口间隔为3天，滑动窗的长度为7天时，对于时间序列A而言，每隔三天获取一个7天的历史销量。上述的举例仅仅是一种示意性的举例说明，本领域技术人员可以根据上述的说明，进行其他类似或近似的设置，在此不做一一赘述和限定。

步骤203、对各历史分段数据内的销售数据进行统计，得到各历史分段数据对应的样本数据。

如前所述，历史销售信息对应的时间序列中包含有销售数据，故对时间序列进行分段后得到的历史分段数据中亦包含有销售数据，故可以对各历史分段数据内的销售数据进行统计，得到该历史分段数据对应的样本数据。

可以理解的是，样本数据可以为历史分段数据内最大值、最小值、平均值、总和、中值等，具体地本领域技术人员可以根据需要设定，在本实施例中不做具体限定。同时，具体的统计方式可以根据样本数据的数值进行适应性设置。例如当样本数据为历史分段数据内销售数据的总和时，上述的统计手段可以为求和；当样本数据为历史分段数据内销售数据的平均值时，对应的统计手段可以为求取平均值。

为了便于理解，本实施例中以历史销售信息为历史销量，样本数据为平均值的情形进行详细说明。

对于历史销量时间序列Y其在进行时间窗(长度为7天)分段后，得到多个历史分段数据：A、B、C。由于样本数据为平均值，故在对历史分段数据A、B、C进行统计时，分别对各历史分段数据内的销售数据求取平均值，便可得到样本数据，即计算A历史分段数据内(7天内)销售数据的平均值，得到对应的样本数据A’，计算B历史分段数据内(7天内)销售数据的平均值，得到对应的样本数据B’，计算C历史分段数据内(7天内)销售数据的平均值，得到对应的样本数据C’。

步骤204、通过预设的组合方式，将各样本数据在时间维度上的第一数据特征、销量维度上的第二数据特征、商品类别维度上的第三数据特征进行组合，得到新的样本数据。

本实施例中，根据样本数据在时间维度、销量维度、商品类别维度上的特征差异构造新的样本数据。可以理解的是，上述的维度并不唯一，还可以包括：门店位置、门店营业时长等，而对于具体地实现可以参照本实施例中的前述描述进行，本实施例中不再一一赘述。

可以理解的是，本实施例中的组合方式为线性运算组合，线性运算组合包括：相加运算和/或相减运算的组合，即对样本数据在不同维度上的特征数据只进行相加运算或相减运算，还可以既进行了相加运算又进行了相减运算。

具体地，在一种实施方式中，通过预设的组合方式，将各样本数据在时间维度上的第一数据特征、销量维度上的第二数据特征、商品类别维度上的第三数据特征进行组合，得到新的样本数据，包括：

获取各样本数据在时间维度上的第一数据特征、销量维度上的第二数据特征和商品类别维度上的第三数据特征；

计算多个第一数据特征相互之间的第一差值，并确定由多个第一差值相加组成的第一特征和；

计算多个第二数据特征相互之间的第二差值，并确定由多个第二差值相加组成的第二特征和；

计算多个第三数据特征的平均值；

将第一特征和、第二特征和以及平均值进行组合，得到新的样本数据。

可以理解的是，多个样本数据对应的时间周期均相同，第一数据特征的获取过程包括：

获取各样本数据对应的时间段；

统计各时间段内的节假日天数，并将该节假日天数作为对应样本数据的第一数据特征。

例如样本数据包括A、B、C等，样本数据对应的时间周期均为7天，样本数据A对应的时间段为9月27号到10月3号，其中节假日天数为3天；样本数据B对应的时间段为10月2号到10月8号，其中节假日天数为6天；样本数据C对应的时间段为9月29号到10月5号，其中节假日天数为5天。即样本数据A对应的第一数据特征为3天；样本数据B对应的第一数据特征为6天，样本数据C对应的第一数据特征为5天。

可以理解的是，样本数据是对历史分段数据进行统计后得到的，故样本数据的具体数值随统计方式的不同而不同。而第二数据特征源自于样本数据，故第二数据特征也随样本数据的不同而不同，也即第二数据特征与样本数据的数值同步。即样本数据为历史分段数据内销售数据的最大值时，第二数据特征也为最大值，当样本数据为历史分段数据内销售数据的平均值时，第二数据特征也为平均值。例如样本数据包括A、B、C等，样本数据A对应历史分段数据内销售数据的最大值，为50，样本数据B对应历史分段数据内销售数据的最大值，为60；样本数据C对应历史分段数据内销售数据的最大值，为90。即样本数据A对应的第二数据特征为50；样本数据B对应的第二数据特征为60，样本数据C对应的第二数据特征为90。此时对应的第二特征和即为第二数据特征相互之间差值的求和，即(60-50)+(90-60)+(90-50)＝10+30+40＝80。

同理，上述商品类别维度上的第三数据特征与样本数据的数值同步，即样本数据为前述历史销售品类的最大值时，第三数据特征也为最大值，当样本数据为历史销售品类的平均值时，第三数据特征也为平均值。例如样本数据包括A、B、C等，样本数据A对应的历史销售品类最大值，为15，样本数据B对应的历史销售品类最大值，为10；样本数据C对应的历史销售品类最大值，为5。即样本数据A对应的第三数据特征为15；样本数据B对应的第三数据特征为10，样本数据C对应的第三数据特征为5。而利用第三数据特征构造新的样本数据时，求取的是第三数据特征的平均值，故可直接对上述三个第三数据特征进行求取平均值的计算，此时求得的平均值为10。

在另一种实施方式中，通过预设的组合方式，将各样本数据在时间维度上的第一数据特征、销量维度上的第二数据特征、商品类别维度上的第三数据特征进行组合，得到新的样本数据，包括：

针对各第一数据特征配置预设的权重，计算所有第一数据特征与对应的权重的加权和，得到时间特征；

针对各第二数据特征配置预设的权重，计算所有第二数据特征与对应的权重的加权和，得到销量特征；

针对各第三数据特征配置预设的权重，计算所有第三数据特征与对应的权重的加权和，得到商品类别特征；

将时间特征、销量特征和商品类别特征组合，作为新的样本数据。

因此，，在上述实施方式中，通过第一数据特征、第二数据特征、第三数据特征组合新的样本数据可以是基于加权求和进行的。即对每个第一数据特征(或第二数据特征或第三数据特征)赋予不同的权重，然后对所有的数据特征(第一数据特征、第二数据特征、第三数据特征)求加权和，即得到新的样本数据。

具体地，对于权重的确定可以是基于各数据特征在该类数据特征中的占比确定的，为了便于理解，本实施例中以样本数据在时间维度上的第一数据特征为节假日天数进行举例说明，例如样本数据A的节假日为5天，所有样本数据的总节假日为20天，权重就是0.25，样本数据B的节假日为4天，权重是0.2。而进一步地，加权求和的计算，即计算各个第一数据特征与对应的权重的乘积之和，以确定新样本中的该第一数据特征的具体值，若确定待构建新样本的已有样本数据仅为A和B，则样本数据A的节假日为5天，权重为0.25，样本数据B的节假日4天，权重为0.2，计算得到的加权求和为0.25*5+0.2*4＝2.05，取整为2，即新样本中的第一数据特征为2个节假日天数。

进一步地，上述的第一数据特征为节假日天数，在其他的实施方式中，代表时间维度的第一数据特征也可以为工作日天数，具体获取过程可以参见上述节假日天数的过程，在此不再赘述。

步骤205、将样本数据与新的样本数据融合为训练样本，并利用训练样本对预先构建的神经网络进行训练，得到销量预测模型。

基于时间维度上的特征数据进行新的样本数据构造后，可以扩大训练样本在时间维度上的梯度波动性和差异性。尤其现有的训练样本中重大节假日(例如五一、端午、中秋、国庆等)对应的数据较少，在整个训练样本的样本中占比较小，因此在训练销量预测模型时，模型无法学习到节假日销量突增的情况，进而在预测重大节假节日时不能较好的预测到销量增加。故本实施例中针对重大节假日进行新的样本数据的构造，即新的样本数据一般是针对包括重大节假日的预设时间周期构造的，这样新的样本数据中包含丰富的节假日数据特征，含有节假日才会出现的涨幅波动极大的销售量数据特征。且由于重大节假日中一定存在节假日，因此，本实施例中的第一数据特征可以为节假日天数。

具体地，本实施例中新的样本数据是通过已有的样本数据构造的，故构造后的新的样本数据和已有的样本数据对应同一时间周期。具体地对于同一门店而言，通过该门店的样本数据构造对应的新的样本数据。通过新的样本数据和样本数据提高了该门店对应的训练样本的数据多样性。同时在得到新的样本数据后，此时再将新的样本数据与单纯的历史数据的样本数据组合在一起，构成训练样本去训练网络，可以提升网络抵抗数据波动的稳定性，遇到任何的未来时间段都可以更精准的预测销量。

同时，本申请从不同门店的销售数据中提取相同类别的数据特征(例如销售同一个商品品类的销量、时间、地理位置等)，用这些数据特征去训练模型、调参，那训练完成后的模型针对多家门店均可进行销量预测。

以上为本申请实施例提供的一种销量预测模型的训练方法的实施例二，以下为本申请实施例提供的一种销量预测模型的训练方法的应用例，本应用例中对新的样本数据的确定进行详细说明。

本应用例中，预设时间周期为7天，门店为门店A，对应的样本数据介绍如下：

样本数据一：一个含有5个工作日和2个节假日的样本；

样本数据二：一个含有5个工作日和2个节假日的样本；

样本数据三：一个含有4个工作日和3个节假日的样本；

样本数据四：一个含有4个工作日和3个节假日的样本；

具体地，本实施例中通过不同的组合方式得到的新的样本数据，具体为：

新的样本数据一(2个工作日+5个节假日)＝样本数据一-样本数据二+样本数据三-样本数据二+样本数据三-样本数据二+样本数据三；

新的样本数据二(3个工作日+4个节假日)＝样本数据一-样本数据二+样本数据三-样本数据二+样本数据三；

新的样本数据三(4个工作日+3个节假日)＝样本数据一-样本数据二+样本数据三；

新的样本数据四(5个工作日+2个节假日)＝样本数据一-样本数据三+样本数据四；

新的样本数据五(6个工作日+1个节假日)＝样本数据一–样本数据三+样本数据二–样本数据四+样本数据一；

……

利用上述方法可以构造出新的样本数据，具体地，请参阅图3，以五一假期为例：在日期为4.27-5.3的预设时间周期内，新的样本数据对应的节假日天数为3天，工作日天数为4天，可以进行3个节假日+4个工作日的组合方法(即上述的新的样本数据三)。在日期为4.30-5.6的预设时间周期内，新的样本数据对应的节假日天数为5天，工作日天数为2天，可以进行5个节假日+2个工作日的组合方法(即上述的新的样本数据一)。

由上述可知，本申请相比现有技术存在如下优点：

1、完全吸收了现有方法的优点，对现有模型的框架以及训练预测流程完全没有破坏，在现有模型预测较好的非节假日期间能保持稳定且准确率较高的预测水平；

2、在进入节假日时，根据待预测的时间间隔自动判断新样本的组合构造方式，自适应确定样本数据的组合；

3、使用样本数据进行样本组合，构造了大量与节假日接近的样本，使用真实数据构造保证样本的有效性，同时丰富了训练样本的多样性；

4、可迁移性高，由于新的样本数据构造的全部步骤都在模型训练之前，因此，经过构造后的新的样本数据可以无缝对接后续的训练过程，修改模型类型、模型参数等调整不受影响，可以直接迁移到不同模型上。

以上为本申请实施例提供的一种销量预测模型的训练方法的应用例，以下为本申请实施例提供的一种销量预测方法的实施例。

请参阅图4，图4为本申请实施例中一种销量预测方法的实施例的流程示意图。

本实施例中销量预测方法具体包括：

步骤401、获取待预测时间段和待预测门店。

待预测门店可以是销量预测模型训练过程中的任意门店，例如门店A、门店B等。

步骤402、统计待预测时间段内的节假日天数。

可以理解的是，当确定待预测时间段后，便可以确定该待预测时间段对应的节假日天数。具体节假日天数的获取方式，可以是在电子日历中进行查询。例如待预测时间段为：2021年9月17日到2021年9月23日，通过查询确定该待预测时间段内，节假日有3天，工作日有4天。

步骤403、将统计的节假日天数、待预测门店对应的门店信息和历史销量输入至销量预测模型，得到待预测门店在待预测时间段内的预测销量，其中，销量预测模型是通过如前述实施例的销量预测模型的训练方法训练得到的。

在具体实现中，销量预测模型的训练方法，包括:

获取表征门店历史销售信息的多个样本数据；

利用多个样本数据在多个维度上的特征差异构造新的样本数据，多个维度可以包括时间维度、销量维度和商品类别维度；

将样本数据与新的样本数据融合为训练样本，并利用训练样本对预先构造的神经网络进行训练，得到销量预测模型。

根据前述实施例所阐述的销量预测模型的训练方法可知，销量预测模型是可以根据节假日天数、门店信息和历史销量训练得到的，即销量预测模型可以视为是节假日天数、门店信息以及历史销量和预测销量的映射关系模型，在得到节假日天数、门店信息和历史销量后，便可通过销量预测模型得到预测销量。故此处销量预测模型的输入参数包括：统计得到的节假日天数、门店信息和门店的历史销量。

可以理解的是，预测得到的预测销量中同样可以包括具体的销售周期(例如工作日天数、非工作日天数、节假日天数)、门店的销售数据(例如日销量或月销量)以及销售商品的类型(例如商品的品类)，即经预测得到的预测销量的数据类型和训练时样本数据的数据类型相同。

本实施例中的销量预测方法，采用了适配度更高的销量预测模型，因此，预测后得到的结果准确性也更高。进一步的，本实施例中销量预测模型的普适性更广，可以解决现有训练销量预测模型时，必须针对各门店单独训练一个适配性模型，针对多个门店时需要训练多个模型，从而造成计算资源浪费的问题。

以上为本申请实施例提供的一种销量预测方法的实施例，以下为本申请实施例提供的一种销量预测模型的训练装置的实施例。

请参阅图5，图5为本申请实施例中一种销量预测模型的训练装置的实施例的结构示意图。

本实施例中的销量预测模型的训练装置具体包括：

获取单元501，用于获取表征门店历史销售信息的多个样本数据；

构造单元502，用于利用多个样本数据在多个维度上的特征差异构造新的样本数据；

训练单元503，用于将样本数据与新的样本数据融合为训练样本，并利用训练样本对预先构建的神经网络进行训练，得到销量预测模型。

进一步地，多个维度包括：时间维度、销量维度和商品类别维度；

构造单元具体用于，通过预设的组合方式，将各样本数据在时间维度上的第一数据特征、销量维度上的第二数据特征、商品类别维度上的第三数据特征进行组合，得到新的样本数据。

进一步地，通过预设的组合方式，将各样本数据在时间维度上的第一数据特征、销量维度上的第二数据特征、商品类别维度上的第三数据特征进行组合，得到新的样本数据，包括：

获取各样本数据在时间维度上的第一数据特征、销量维度上的第二数据特征和商品类别维度上的第三数据特征；

计算多个第一数据特征相互之间的第一差值，并确定由多个第一差值相加组成的第一特征和；

计算多个第二数据特征相互之间的第二差值，并确定由多个第二差值相加组成的第二特征和；

计算多个第三数据特征的平均值；

将第一特征和、第二特征和以及平均值进行组合，得到新的样本数据。

具体地，多个样本数据对应的时间周期均相同，第一数据特征的获取过程包括：

获取各样本数据对应的时间段；

统计各时间段内的节假日天数，并将该节假日天数作为对应样本数据的第一数据特征。

具体地，获取单元501具体包括：

获取子单元，用于获取门店历史销售信息对应的时间序列；

分段子单元，用于利用预设时间周期的滑动窗，对时间序列进行滑动分段得到多个历史分段数据；

统计子单元，用于对各历史分段数据内的销售数据进行统计，得到各历史分段数据对应的样本数据。

本实施例中的销量预测模型的训练装置，首先获取表征门店历史销售信息的多个样本数据，接着利用多个样本数据在多个维度上的特征差异构造新的样本数据，最后将样本数据与新的样本数据融合为训练样本，并利用训练样本对预先构建的神经网络进行训练，得到销量预测模型。即本申请中利用历史的样本数据构造新的样本数据，并将历史的样本数据和新的样本数据融合为训练样本，由于训练样本包含了不同维度下的特征，增强了数据的平衡性，对调整模型的内部参数更具有普适性，通过上述训练样本得到的销量预测模型普适性强、能承受波动性大的输入数据、预测更准确，从而解决了通过时间序列进行销量预测时适配性差、准确率较低的技术问题。

以上为本申请实施例提供的一种销量预测模型的训练装置的实施例，以下为本申请实施例提供的一种销量预测装置的实施例。

请参阅图6，图6为本申请实施例中一种销量预测装置的实施例的结构示意图。

本实施例中的销量预测装置具体包括：

获取单元601，用于获取待预测时间段和待预测门店；

统计单元602，用于统计待预测时间段内的节假日天数；

预测单元603，用于将待预测门店对应的门店信息和历史销量输入至销量预测模型，得到待预测门店在待预测时间段内的预测销量，其中，销量预测模型是通过前述实施例的销量预测模型的训练方法训练得到的。

本实施例中的销量预测装置采用了适配度更高的销量预测模型，因此，预测后得到的效果结果准确性也更高。

本申请实施例还提供了一种销量预测模型的训练设备的实施例，本实施例中的销量预测模型的训练设备包括处理器以及存储器：存储器用于存储程序代码，并将程序代码传输给处理器；处理器用于根据程序代码中的指令执行上述实施例中的销量预测模型方法或者执行前述实施例中的销量预测方法。

本申请实施例还提供了一种存储介质的实施例，存储介质用于存储程序代码，程序代码用于执行上述实施例中的销量预测模型方法或者执行前述实施例中的销量预测方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或检测设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或检测设备固有的其它步骤或单元。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称：Read-OnlyMemory，英文缩写：ROM)、随机存取存储器(英文全称：RandomAccessMemory，英文缩写：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种销量预测模型的训练方法、销量预测方法及相关装置 [P] . 中国专利： CN113888235A . 2022-01-04
2. 物品销量预测模型训练方法、物品销量预测方法及装置 [P] . 中国专利： CN114757700A . 2022-07-15
3. PREDICTIVE MODEL TRAINING METHOD, PREDICTIVE MODEL TRAINING DEVICE, AND PLANT CONTROL SYSTEM [P] . WO2022004039A1 . 2022-01-06

机译：预测模型训练方法，预测模型训练装置和工厂控制系统
4. LSTM Method for predicting price of agricultural product and sales volume using Long Short-Term Memory [P] . 韩国专利： KR102137583B1 . 2020-07-24

机译：使用长短期记忆预测农产品价格和销量的LSTM方法
5. LSTM Method for predicting price of agricultural product and sales volume using Long Short-Term Memory [P] . 韩国专利： KR20200036219A . 2020-04-07

机译：使用长短期记忆预测农产品价格和销量的LSTM方法