首页> 中国专利> 社区团购生鲜配送路径优化算法

社区团购生鲜配送路径优化算法

摘要

本发明公开了社区团购生鲜配送路径优化算法,根据对生鲜仓库信息、团长信息、订单信息进行可视化的动态管理,利用利用强化学习寻找最优的配送路径方案,所述利用利用强化学习寻找最优的配送路径方案,首先进行模型假设,设定具体的报酬函数,最终完成模型算法的建设,本发明结构科学合理,使用安全方便,本发明集成数据管理与强化学习算法,实现社区团购生鲜配送路径的优化配置,大大便捷了配送路径,降低了不必要的损失,提高了分配效果。

著录项

  • 公开/公告号CN112785076A

    专利类型发明专利

  • 公开/公告日2021-05-11

    原文格式PDF

  • 申请/专利权人 亿景智联(北京)科技有限公司;

    申请/专利号CN202110133120.9

  • 发明设计人 吴丹;孙伟;田鹏飞;

    申请日2021-01-29

  • 分类号G06Q10/04(20120101);G06Q10/08(20120101);G06N3/08(20060101);

  • 代理机构32327 南京鼎傲知识产权代理事务所(普通合伙);

  • 代理人刘蔼民

  • 地址 100085 北京市海淀区上地信息产业基地创业路6号3层3015

  • 入库时间 2023-06-19 10:57:17

说明书

技术领域

本发明涉及人工智能技术领域,具体为社区团购生鲜配送路径优化算法。

背景技术

社区团购生鲜配送路径问题所涉及的主要有三个点,团长位置、仓库中心以及城市交通道路,团长位置考虑的因素有收货地点在小区内还是小区外,如果是小区外要考虑车辆能否停靠,便于卸货,如果是在小区内部,则需要考虑小区内部是否能够进入车辆,以及进入车辆的高度限制,时间限制,对于仓库中心要考虑的因素是是否距离城市交通主干道较近,便于车辆及时进城,由于生鲜配送要求的时间段是在上午7点到10点半之间,正好赶上城市上班的高峰时段,为了满足配送的时间窗制约,就要合理避开城市上班高峰期;

使用图论理论来对带有时间窗的生鲜配送路径问题进行描述,G=(V,E)是一个完全无向图,其中V={0,1,....,N}是节点的集合,1...,N代表着N个待访问的终端团长数,0代表着物流配送中心;E={(i,j):i,j∈V,i≠j}是连接所有节点的边的集合,所有配送车辆均从配送中心同时出发,车辆的最大装载量全部为Q,均为相同车型的车辆,为P个终端团长进行货物运输配送,每个团长点用1,...,P来表示,针对每个客户点x的货量为Q

发明内容

本发明提供社区团购生鲜配送路径优化算法,可以有效解决上述背景技术中提出的社区团购生鲜配送路径问题。

为实现上述目的,本发明提供如下技术方案:社区团购生鲜配送路径优化算法,根据对生鲜仓库信息、团长信息、订单信息进行可视化的动态管理,利用利用强化学习寻找最优的配送路径方案。

根据上述技术方案,所述利用利用强化学习寻找最优的配送路径方案,首先进行模型假设,设定具体的报酬函数,最终完成模型算法的建设。

根据上述技术方案,所述模型假设具体包括如下步骤:

S1、送货前,所有生鲜已经在仓库完成分拣作业;

S2、配送车辆单程计算,从配送中心载货出发,到达团长端进行货物卸车,无需当日返回配送中心;

S3、所有货物送到终端团长固定位置处都有时间约束,如果配送未在约束时间内将货物送达,就会产生赔偿费用。

根据上述技术方案,所述S1中所有配送车辆统一车型,最大载重相同,且不考虑在库内装车的时间;

物流中心位置是固定的,且只有一个;

每个终端团长的收货点位置是确定的,且只有一个收货点。

根据上述技术方案,所述S2中每一辆物流配送车辆都可以为多个客户进行服务;

每一个客户针对生鲜类每天都必须被服务,且只接受一个车辆进行服务;

所有车辆配送的货物均为同等大小,同等规格的货物;

所有团长的生鲜类要货需求都是已知的,且都小于车辆的最大装载量,且所有客户都需要司机进行自行卸车。

根据上述技术方案,所述S3中所有终端团长卸货处,都存在可连通的道路,都有停车位置,且不考虑司机停车点跟卸货点之间的距离;

车辆行驶的距离、行驶时间不能大于最大的持续时间;

没有明确每个团长要求的服务时间,配送车辆到达收货点之后,卸货时间只与货物的重量有关,每单位的货量的卸货时间为1。

根据上述技术方案,所述社区团购生鲜的配送还要满足客户要求的时间窗,所以具体报酬函数为三者之和的最小值,具体的设定如下:

固定成本:对于车辆的假设为统一车型统一载重,而且为同种性质的车辆,所以配送中车辆的固定成本仅仅与实际参与配送的车辆数量有关,需求的车辆多了,固定成本就会随之上升,因此固定成本要想减少,就必须减少当日出车数量,从而才能为企业节约成本,我们设置U为固定成本,W

W

运输过程中的可变成本:对于车辆运输的假设为不考虑车辆部件损耗,以及道路上的交通事故,那么车辆在运输过程中的可变成本主要为燃油消耗,再者由于假设车辆在道路行驶中的速度是一定的,那么车辆油耗就只与车辆在配送过程中所行驶的路程有关,车辆在配送过程中所行驶的路程越长,车辆的油耗就会越大,随之带来的燃油成本就会提高,从而可变成本就会加大,在这里,我们设置油耗的成本为F元/km,车辆速度设为运输过程中的可变成本为W

W

超过时间窗口的时间惩罚成本:针对社区团购生鲜配送客户收货的时间约束,如果当货物在[h

根据上述技术方案,路径规划模型的建设,利用RBF神经网络实现解决值函数的存储和泛化问题,提供给神经网络用来学习的信号是强化学习智能体与环境交互得来的信号,最终实现智能体与环境的本身的交互过程,具体算法流程如下:

S1、初始化RBF神经网络,设定初始的车辆数量;

S2、观察车辆的使用状态,计算报酬;

S3、观察当前智能体状态,得到车辆或者路径的可行方向集合,根据行为选择策略,选择行为;

S4、执行行为,调整车辆或者路径,将状态行为对带入神经网络,前向计算得到行为值函数;

S5、找到下一状态的行为值函数最大值,根据学习算法的迭代规则对当前的值函数进行迭代更新;

S6、更新RBF神经网络中智能体的状态;

S7、判断是否结束,否回到S2,重复执行;

S8.将神经网络参数存入文件,结束。

根据上述技术方案,通过可视化仿真环境来对资源调度规划实现评估,将最优化学习参数应用于实际的社区团购生鲜配送路径的优化中。

与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,本发明集成数据管理与强化学习算法,实现社区团购生鲜配送路径的优化配置,大大便捷了配送路径,降低了不必要的损失,提高了分配效果。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1是本发明的结构示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

实施例:如图1所示,本发明提供技术方案,社区团购生鲜配送路径优化算法,根据对生鲜仓库信息、团长信息、订单信息进行可视化的动态管理,利用利用强化学习寻找最优的配送路径方案。

根据上述技术方案,利用利用强化学习寻找最优的配送路径方案,首先进行模型假设,设定具体的报酬函数,最终完成模型算法的建设。

根据上述技术方案,模型假设具体包括如下步骤:

S1、送货前,所有生鲜已经在仓库完成分拣作业;

S2、配送车辆单程计算,从配送中心载货出发,到达团长端进行货物卸车,无需当日返回配送中心;

S3、所有货物送到终端团长固定位置处都有时间约束,如果配送未在约束时间内将货物送达,就会产生赔偿费用。

根据上述技术方案,S1中所有配送车辆统一车型,最大载重相同,且不考虑在库内装车的时间;

物流中心位置是固定的,且只有一个;

每个终端团长的收货点位置是确定的,且只有一个收货点。

根据上述技术方案,S2中每一辆物流配送车辆都可以为多个客户进行服务;

每一个客户针对生鲜类每天都必须被服务,且只接受一个车辆进行服务;

所有车辆配送的货物均为同等大小,同等规格的货物;

所有团长的生鲜类要货需求都是已知的,且都小于车辆的最大装载量,且所有客户都需要司机进行自行卸车。

根据上述技术方案,S3中所有终端团长卸货处,都存在可连通的道路,都有停车位置,且不考虑司机停车点跟卸货点之间的距离;

车辆行驶的距离、行驶时间不能大于最大的持续时间;

没有明确每个团长要求的服务时间,配送车辆到达收货点之后,卸货时间只与货物的重量有关,每单位的货量的卸货时间为1。

根据上述技术方案,社区团购生鲜的配送还要满足客户要求的时间窗,所以具体报酬函数为三者之和的最小值,具体的设定如下:

固定成本:对于车辆的假设为统一车型统一载重,而且为同种性质的车辆,所以配送中车辆的固定成本仅仅与实际参与配送的车辆数量有关,需求的车辆多了,固定成本就会随之上升,因此固定成本要想减少,就必须减少当日出车数量,从而才能为企业节约成本,我们设置U为固定成本,W

W

运输过程中的可变成本:对于车辆运输的假设为不考虑车辆部件损耗,以及道路上的交通事故,那么车辆在运输过程中的可变成本主要为燃油消耗,再者由于假设车辆在道路行驶中的速度是一定的,那么车辆油耗就只与车辆在配送过程中所行驶的路程有关,车辆在配送过程中所行驶的路程越长,车辆的油耗就会越大,随之带来的燃油成本就会提高,从而可变成本就会加大,在这里,我们设置油耗的成本为F元/km,车辆速度设为运输过程中的可变成本为W

W

超过时间窗口的时间惩罚成本:针对社区团购生鲜配送客户收货的时间约束,如果当货物在[h

根据上述技术方案,路径规划模型的建设,利用RBF神经网络实现解决值函数的存储和泛化问题,提供给神经网络用来学习的信号是强化学习智能体与环境交互得来的信号,最终实现智能体与环境的本身的交互过程,具体算法流程如下:

S1、初始化RBF神经网络,设定初始的车辆数量;

S2、观察车辆的使用状态,计算报酬;

S3、观察当前智能体状态,得到车辆或者路径的可行方向集合,根据行为选择策略,选择行为;

S4、执行行为,调整车辆或者路径,将状态行为对带入神经网络,前向计算得到行为值函数;

S5、找到下一状态的行为值函数最大值,根据学习算法的迭代规则对当前的值函数进行迭代更新;

S6、更新RBF神经网络中智能体的状态;

S7、判断是否结束,否回到S2,重复执行;

S8.将神经网络参数存入文件,结束。

根据上述技术方案,通过可视化仿真环境来对资源调度规划实现评估,将最优化学习参数应用于实际的社区团购生鲜配送路径的优化中。

与现有技术相比,本发明的有益效果:本发明结构科学合理,使用安全方便,本发明集成数据管理与强化学习算法,实现社区团购生鲜配送路径的优化配置,大大便捷了配送路径,降低了不必要的损失,提高了分配效果。

最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号