首页> 外文会议>インテリジェント·システム·シンポジウム >経験強化型エージェント学習によるサプライチェーン上の協調的方策獲得~ビール配送ゲームを例に
【24h】

経験強化型エージェント学習によるサプライチェーン上の協調的方策獲得~ビール配送ゲームを例に

机译:通过经验获得供应链的合作措施,增强代理学习 - 作为啤酒交付游戏的一个例子

获取原文

摘要

生産企業を取巻く市場や生産拠点のグローバル化に伴い,サプライチェーンを構成する企業間の協調的な意思決定の重要性がますます増加している.このような意思決定の問題として,上流工程から下流工程に至るまでの発注に伴う在庫量の調整が挙げられる.通常,在庫量において「過剰在庫の管理に要するコスト」と「欠品による販売機会損失に伴う損害」は,トレードオフの関係にある.サプライチェーンでは,各企業間の意思決定が相互に影響を及ぼしあう複雑な系を構成しているため,系を構成する各企業の部分最適な意思決定がサプライチェーン全体に対して最適であるとは限らない.このような問題に対して近年,エージェントモデルなどの知的情報処理技術による全体最適化について広く研究がなされている.全体最適化のためのエージェントの方策獲得法としては強化学習[3] が挙げられる.先行研究[4] ではサプライチェーンのタスクにおける主だった強化学習器としてQ-learning[5] が用いられており,遺伝的アルゴリズム(GA) 等の手法を用いたアプローチよりも良好な結果が得られることが報告されている[6].強化学習のアルゴリズムはQ-learning に代表される環境同定型学習と,Profit Sharing[7] に代表される経験強化型学習に大別できる[8].環境同定型学習の利点は静的な環境中で十分な試行錯誤を行えば,最適な学習結果が得られる点にある.しかし,これらの学習アルゴリズムは環境の正確な同定作業を通じて最適行動を獲得するため,多大な試行錯誤数を要してしまう.さらに,動的な環境に対する頑健性が低いという点において課題も残る.一方,経験強化型学習の特徴は最適性を犠牲にする代わりに,少ない試行錯誤数で準最適解を獲得できる点と動的環境に対する頑健性を併せ持つ点にある.一般に,企業を取り巻く環境は動的環境であることは言うまでもなく,サプライチェーンにおける各企業間でも同様に複雑かつ動的な系を構成しており,外部環境からも動的な影響を受けている.しかし,サプライチェーンを想定したタスクにおいて,これまでなされてきた強化学習による意思決定モデルの研究では,先述の通り環境同定型学習であるQ-learning が学習アルゴリズムとして採用されてきた.そこで,本研究では経験強化型学習によりサプライチェーンの構成要素が,協調的に方策を獲得するアプローチを提案する.実験では,サプライチェーンのロールプレイングゲームとして広く知られるビールゲームを通じて,環境同定型学習と経験強化型学習の性能を比較することにより,本提案の有効性を検証する.
机译:随着生产公司的全球化和生产基地的全球化,弥补供应链的公司之间的重要决策的重要性越来越多。作为这种决策的问题,我们将伴随顺序的库存从上游进程调整到下游过程。通常,在库存量,“管理过度库存管理所需的成本”和“与短缺销售机会相关的损害”在权衡关系中。由于供应链构成的复杂系统,使得决策每个公司之间相互影响,部分构成该系统的各公司的是整个供应链最佳没有限制。通过智能信息处理技术(例如代理模型)的整体优化,已经广泛研究了这样的问题。作为用于整体优化的药剂的方法,提到了增强学习[3]。在以前的研究[4],Q学习[5]被用作在供应链中的任务的主加强学习者,并且比使用遗传算法(GA)的方法更好的结果等已经报道,[6] 。增强学习算法大致分为通过学习Q-学习表示环境识别和学习经历由分红[7] [8]表示。环境识别学习的优点是通过在静态环境中执行足够的试验和错误,可以获得最佳学习结果。然而,这些学习算法需要大量的试验试验,以通过准确的环境识别工作获得最佳行为。此外,问题仍然存在于动态环境的鲁棒性低。另一方面,经验丰富的增强学习的特征在于必须获得具有少量试验项圈的准优选解决方案,而不是牺牲最佳状态和对动态环境的鲁棒性。一般情况下,不用说,围绕公司的环境是一个动态的环境,同时也构成了供应链的供应之间的复杂和动态的系统,也被动态地从外部环境的影响。但是,假设一个供应链,通过加强决策模型的研究任务得知已经完成,到目前为止,Q学习,这是环境识别型的学习,已被采纳为一个学习算法作为以前。因此,在这项研究中,我们提出了一种方法,供应链组分在经验丰富的学习协调。在实验中,这一提案的有效性是通过啤酒游戏广为人知的供应链中的角色扮演类游戏比较环境识别型的学习和经验的学习进行了性能验证。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号