首页> 中国专利> 一种线下零售店销售预测方法

一种线下零售店销售预测方法

摘要

本发明的一种线下零售店销售预测方法,获取目标门店列表,并对目标门店数据和目标门店一定区域内的门店信息和数据进行收集,对收集的数据进行处理后建立预测模型,根据预测模型预测门店销量。使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数,可以方便快速的对模型进行训练,且前期数据采集比较简单,不需要高近似度的同类型门店作为对比,预测更加方便,结果也较为准确。

著录项

  • 公开/公告号CN112669069A

    专利类型发明专利

  • 公开/公告日2021-04-16

    原文格式PDF

  • 申请/专利权人 上海小零网络科技有限公司;

    申请/专利号CN202011590738.X

  • 发明设计人 张玥;胡军;

    申请日2020-12-29

  • 分类号G06Q30/02(20120101);G06K9/62(20060101);

  • 代理机构31385 上海乐泓专利代理事务所(普通合伙);

  • 代理人苏杰

  • 地址 200000 上海市浦东新区南汇新城镇海基六路218弄15号103室

  • 入库时间 2023-06-19 10:38:35

说明书

技术领域

本发明属于门店管理技术领域,具体来说是一种线下零售店销售预测方法。

背景技术

目前来说,为了获取线下零售店的具体销量或销量范围,通常有两种方法,一种是通过人工采集数据,通常需要投入较多时间和金钱;一种是通过其他门店数据利用算法进行预测,通常需要比较大量的数据,且要求较高的店铺间相似度。

要收集如此多门店的数据需要很高的人工已经时间投入;店铺数据集质量和数量通常不足以支持根据店铺相似度使用算法预测。

发明内容

1.发明要解决的技术问题

本发明的目的在于解决现有的门店销量预测成本高且要求复杂的问题。

2.技术方案

为达到上述目的,本发明提供的技术方案为:

本发明的一种线下零售店销售预测方法,获取目标门店列表,并对目标门店数据和目标门店一定区域内的门店信息和数据进行收集,对收集的数据进行处理后建立预测模型,根据预测模型预测门店销量。

优选的,所述方法具体包括如下步骤:

S100、采集数据;

S200、数据整理;

S300、数据分析;

S400、数据二次整理;

S500、建立模型;

S600、模型训练;

S700、模型预测。

优选的,所述步骤S100中,采集数据具体为采集门店名称、门店地址、门店经纬度、门店周边1km范围内住宅、交通、商业、学校信息和门店周边2km范围内住宅、交通、商业、学校信息。

优选的,所述步骤S200中的数据整理具体为根据门店名称和经营类型对门店进行分类、计算门店到门店所在区中心和市中心的距离、计算门店周边2km内所有其它门店的数量。

优选的,所述步骤S300中的数据分析具体为根据步骤S100获取的信息计算门店人流量。

优选的,所述步骤S400中的数据二次整理具体为对数值型的数据进行归一化处理和对文本型的数据进行one-hot-encoding处理,处理后的数据统计为数据集。

优选的,所述步骤S500中建立模型具体包括如下步骤:

S510、筛选数据集,对二次整理后的数据集使用K-Means算法进行聚类;计算每个数据点离自己从属的聚类中心的相对距离,并设定阈值,筛选出可训练的数据集;

S520、数据集分类,对于筛选出来的数据集,根据是否有销量标签进行二次分类,有销量的数据作为训练集和验证集,无销量的数据作为预测集;

S530、模型训练,使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数;

S540、预测,根据模型参数和模型对其余数据进行预测得到预测销量。

优选的,所述数据二次整理还包括对统计好的数据计算缺失比例,对于缺失大于60%的数据进行丢弃;对缺失数值变量,根据数据集该变量的均值去进行填补;对缺失分类变量,根据数据集该变量的众数去进行填补。

优选的,所述数据整理还包括数据去重,将收集到的数据中距离在200米以内的门店中重复率高的进行去除。

3.有益效果

采用本发明提供的技术方案,与现有技术相比,具有如下有益效果:

本发明的一种线下零售店销售预测方法,获取目标门店列表,并对目标门店数据和目标门店一定区域内的门店信息和数据进行收集,对收集的数据进行处理后建立预测模型,根据预测模型预测门店销量。使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数,可以方便快速的对模型进行训练,且前期数据采集比较简单,不需要高近似度的同类型门店作为对比,预测更加方便,结果也较为准确。

附图说明

图1为本发明的一种线下零售店销售预测方法的流程图。

具体实施方式

为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述,附图中给出了本发明的若干实施例,但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。

需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件;本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同;本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明;本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

实施例1

参照附图1,本实施例的一种线下零售店销售预测方法,获取目标门店列表,并对目标门店数据和目标门店一定区域内的门店信息和数据进行收集,对收集的数据进行处理后建立预测模型,根据预测模型预测门店销量。使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数,可以方便快速的对模型进行训练,且前期数据采集比较简单,不需要高近似度的同类型门店作为对比,预测更加方便,结果也较为准确。

优选的,所述方法具体包括如下步骤:

S100、采集数据;

S200、数据整理;

S300、数据分析;

S400、数据二次整理;

S500、建立模型;

S600、模型训练;

S700、模型预测。

优选的,所述步骤S100中,采集数据具体为采集门店名称、门店地址、门店经纬度、门店周边1km范围内住宅、交通、商业、学校信息和门店周边2km范围内住宅、交通、商业、学校信息;具体为:

门店名称,门店地址,门店经纬度,进店人次,门店所在区中心经纬度,门店所在市中心经纬度,门店周边1km住宅区数量,门店周边2km住宅区数量,门店周边1km地铁站数量,门店周边2km地铁站数量,门店周边1km公交车站数量,门店周边2km公交车站数量,门店周边1km幼儿园和小学数量,门店周边2km幼儿园和小学数量,门店周边1km中学数量,门店周边2km中学数量,门店周边1km大学数量,门店周边2km大学数量,门店周边1km肯德基数量,门店周边2km肯德基数量,门店周边1km商业建筑数量,门店周边2km商业建筑数量。

优选的,所述步骤S200中的数据整理具体为根据门店名称和经营类型对门店进行分类、计算门店到门店所在区中心和市中心的距离、计算门店周边2km内所有其它门店的数量。

优选的,所述步骤S300中的数据分析具体为根据步骤S100获取的信息计算门店人流量。

门店周边住宅区数量的多少直接影响门店周边的人流量;

门店周边地铁站和公交车数量的多少,意味着门店周边交通的方便与否,对于大型综合超市,周边交通方便与否直接影响该门店覆盖范围;同时周边交通方便与否也会影响周边住户的多少;

幼儿园、小学和中学,通常是住宅区的配套机构,教育机构的完善,通常意味着社区的成熟,也会影响周边住户的多少;

大学周边的门店,往往客户类型特征比较鲜明,经营品类会比较集中,管理成本和损耗成本可能会比较低;

计算门店周边2km各种门店的数量,是确认门店周边是否已形成一个成熟的商圈;门店周边其他门店变多,一方面可能会降低门店营业额,但往往也意味着周边社区的成熟。

优选的,所述步骤S400中的数据二次整理具体为对数值型的数据进行归一化处理和对文本型的数据进行one-hot-encoding处理,处理后的数据统计为数据集。

优选的,所述步骤S500中建立模型具体包括如下步骤:

S510、筛选数据集,对二次整理后的数据集使用K-Means算法进行聚类;计算每个数据点离自己从属的聚类中心的相对距离,并设定阈值,筛选出可训练的数据集;

S520、数据集分类,对于筛选出来的数据集,根据是否有销量标签进行二次分类,有销量的数据作为训练集和验证集,无销量的数据作为预测集;

S530、模型训练,使用随机森林算法对数据训练和验证,并进行调参;算法会随机将有销量的数据分为训练集和验证集,预先设定好参数区间,模型会根据设定的参数区间进行梯度调参,并挑选出在训练集上表现最好的一组参数作为模型参数;

S540、预测,根据模型参数和模型对其余数据进行预测得到预测销量。

优选的,所述数据二次整理还包括对统计好的数据计算缺失比例,对于缺失大于60%的数据进行丢弃;对缺失数值变量,根据数据集该变量的均值去进行填补;对缺失分类变量,根据数据集该变量的众数去进行填补。

优选的,所述数据整理还包括数据去重,将收集到的数据中距离在200米以内的门店中重复率高的进行去除。

以上所述实施例仅表达了本发明的某种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,本发明专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号