Real-world ride-hailing vehicle repositioning using deep reinforcement learning

Jiao Yan; Tang Xiaocheng; Qin Zhiwei (Tony); Li Shuaiji; Zhang Fan; Zhu Hongtu; Ye Jieping

首页> 外文期刊>Transportation research >Real-world ride-hailing vehicle repositioning using deep reinforcement learning

【24h】

Real-world ride-hailing vehicle repositioning using deep reinforcement learning

机译：利用深度加固学习，现实世界乘车车辆重新定位

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

We present a new practical framework based on deep reinforcement learning and decision-time planning for real-world vehicle repositioning on ride-hailing (a type of mobility-on-demand, MoD) platforms. Our approach learns the spatiotemporal state-value function using a batch training algorithm with deep value networks. The optimal repositioning action is generated ondemand through value-based policy search, which combines planning and bootstrapping with the value networks. For the large-fleet problems, we develop several algorithmic features that we incorporate into our framework and that we demonstrate to induce coordination among the algorithmically-guided vehicles. We benchmark our algorithm with baselines in a ride-hailing simulation environment to demonstrate its superiority in improving income efficiency measured by income-per-hour. We have also designed and run a real-world experiment program with regular drivers on a major ride-hailing platform. We have observed significantly positive results on key metrics comparing our method with experienced drivers who performed idle-time repositioning based on their own expertise.

机译：我们介绍了一种基于深度加强学习和决策规划的新的实用框架，以实现Ride-HaIling（一种按需类型，Mod）平台的现实车辆重新定位。我们的方法使用具有深度值网络的批量培训算法来学习时空状态值函数。通过基于价值的策略搜索生成OnDemand的最佳重新定位操作，该策略搜索将规划和引导与值网络相结合。对于大型舰队问题，我们开发了多种算法特征，我们将我们纳入我们的框架，并且我们证明在算法引导的车辆之间诱导协调。我们将我们的算法基准与基线在乘车的仿真环境中，以展示其优越性，以提高每小时收入测量的收入效率。我们还设计并运行了一个实际的实验计划，并在一个主要的乘车平台上进行了常规驱动程序。我们在与经验丰富的驱动程序进行比较的关键指标上观察到显着积极的结果，他们根据自己的专业知识进行空闲时间重新定位。

著录项

来源
《Transportation research》 |2021年第9期|103289.1-103289.25|共25页
作者
Jiao Yan; Tang Xiaocheng; Qin Zhiwei (Tony); Li Shuaiji; Zhang Fan; Zhu Hongtu; Ye Jieping;
展开▼
作者单位

DiDi Labs Mountain View CA 94043 USA;

DiDi Labs Mountain View CA 94043 USA;

DiDi Labs Mountain View CA 94043 USA;

DiDi Labs Mountain View CA 94043 USA;

Didi Chuxing Beijing Peoples R China;

Didi Chuxing Beijing Peoples R China;

Univ Michigan Ann Arbor MI 48109 USA;

展开▼
收录信息美国《科学引文索引》(SCI);美国《工程索引》(EI);
原文格式 PDF
正文语种 eng
中图分类
关键词
Ridesharing; Vehicle repositioning; Deep reinforcement learning;

机译：ridesharing;车辆重新定位;深增强学习;

相似文献

外文文献
中文文献
专利

1. Operating Electric Vehicle Fleet for Ride-Hailing Services With Reinforcement Learning [J] . Shi Jie, Gao Yuanqi, Wang Wei, IEEE Transactions on Intelligent Transportation Systems . 2020,第11期

机译：采用加固学习的乘车服务电动汽车车队
2. Advanced planning for autonomous vehicles using reinforcement learning and deep inverse reinforcement learning [J] . You Changxi, Lu Jianbo, Filev Dimitar, Robotics and Autonomous Systems . 2019,第期

机译：利用强化学习和深度逆钢筋学习的自治车辆先进规划
3. Visual Navigation in Real-World Indoor Environments Using End-to-End Deep Reinforcement Learning [J] . Kulhanek Jonas, Derner Erik, Babuska Robert IEEE Robotics and Automation Letters . 2021,第3期

机译：现实世界室内环境中的视觉导航使用端到端的深度加强学习
4. Scalable Deep Reinforcement Learning for Ride-Hailing [C] . Jiekun Feng, Mark Gluzman, J. G. Dai Annual American Control Conference . 2021

机译：可扩展的深度加强学习骑行
5. On Deep Reinforcement Learning for Games: Generalization of Deep Q-Learning with Multiple Policy Heads [D] . Boucher, Mathieu. 2020

机译：关于游戏的深度加固学习：多重政策头部深度Q学的泛化
6. Energy Management of Smart Home with Home Appliances Energy Storage System and Electric Vehicle: A Hierarchical Deep Reinforcement Learning Approach [O] . Sangyoon Lee, Dae-Hyun Choi 2020

机译：带有家用电器储能系统和电动汽车的智能家居的能源管理：分层深度强化学习方法
7. Equilibrium Inverse Reinforcement Learning for Ride-hailing Vehicle Network [O] . Takuma Oda 2021

机译：骑行车辆网络均衡逆钢筋学习

Real-world ride-hailing vehicle repositioning using deep reinforcement learning

摘要

著录项

相似文献

相关主题

期刊订阅