あるクラスのジレンマ問題に対する期待方策強化学習法

机译：阶级困境问题的预期措施

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

本論文では、確率ゲームによって記述されるジレンマ問題に対して最適な方策を得る強化学習手法を提案する。我々は先に、全てのエージェントが他のエージェントにより良い方策を期待する学習手法を提案しており、これを期待方策強化学習法と呼hでいる。この期待すべき方策を求めるためには状態行動組空間の十分な探査が必要であるが、先の手法では探査に多大な時間を必要としていた。本論文ではこの探査部分を効率化した期待方策強化学習法を提案することで、より広いクラスの問題に対応できるようにしている。

机译：在本文中，我们提出了一种加强学习方法，其获得了概率游戏描述的困境问题的最佳策略。我们提出了一种学习方法，即所有代理商都希望对其他代理商的良好策略，以及预期的政策加强学习方法并致电H。为了找到预期的措施，需要足够的探索状态行为设定空间，但是在以前的方法中，我们需要大量的探索时间。在本文中，我们通过提出更有效的这一调查部分的预期政策加强学习方法提出了更广泛的课堂问题。

著录项

来源
《SICE Symposium on Systems and Information;システム·情報部門学術講演会》|2014年||共6页
会议地点
作者
高尾晃; 黒江康明; 飯間等;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 G20-53;
关键词
強化学習; マルチエージェント; ジレンマ問題;

机译：加强学习;多助剂;困境问题;

相似文献

外文文献
中文文献
专利

1. あるクラスのジレンマ問題に対するマルチエージェント強化学習法 [J] . 黒江康明, 飯間等計測自動制御学会論文集 . 2015,第5期

机译：一类难题的多智能体增强学习方法
2. あるクラスのジレンマ問題に対するマルチエージェント強化学習法 [J] . 黒江康明, 飯間等計測自動制御学会論文集 . 2015,第5期

机译：一类困境问题的多功能加固学习方法
3. NTTら業界団体を設立光通信技術を研究日本電信電話(株)(NTT、東京都千代田区)、米インテル、ソ二ー(株)(東京都港区)の3社は、新たな業界団体を設立する。光電融合技術を活用したフォトニクス関連技術の研究開発などを推進し、超大容量通信に対応できる光ネットヮーク技術の確立などを目指してハる。3-3プロセッシング領域狙う国内DRAM大手のェルピーダメモリを買収し、大きく飛躍を遂げた米マイクロンテクノロジー。2017年にはサンディスク共同創業者の1人である、Sanjay Mehrotra (サンジエイ·メイロトラ)氏を招聘。経営体制も刷新され、大きく生まれ変わった「新生マイクロン」を全面に押し出した。米サンフランシスコで開催されたプライベートイベント「MlicronInsight 2019」(現地10月24日開催)では、同社のあるべき将来像に対するメッセージが随所に散りばめられていた。 [J] . 半導体産業新聞 . 2019,第2372期

机译：成立了NTT和其他工业集团研究光通信技术的日本电报电话公司（NTT，东京千代田区），英特尔，索尼公司（东京都港区）是三个新的工业集团。建立。促进利用光电子融合技术的光子相关技术的研究和开发，并致力于建立可支持超高容量通信的光网络技术。 3-3处理领域美国Micron Technology在收购了国内主要DRAM公司Elpida Memory之后取得了巨大飞跃。 2017年，我们邀请了Sanjay联合创始人Sanjay Mehrotra。管理系统也进行了改进，我们推出了完全脱胎换骨的“新Micron”。在旧金山举行的私人活动“ Mlicron Insight 2019”（10月24日举行）上，有关公司未来愿景的信息四处散布。
4. あるクラスのジレンマ問題に対する期待方策強化学習法 [C] . 高尾晃, 黒江康明, 飯間等 SICE Symposium on Systems and Information . 2014

机译：阶级困境问题的预期措施
5. 共鳴ラマンを中心とする分子スペクトル法の高速液体クロマトグラフィーにおける高選択性検出への応用 [D] . 小泉均, KOIZUMI Hitoshi 1992

机译：以共振拉曼为中心的分子光谱技术在高效液相色谱法高选择性检测中的应用。
6. 2. 当院の医療安全管理体制にむけての中央部門(院内事故防止対策委員会)のあり方(シンポジウム,ワークショップ「病院におけるリスクマネージメント」,第67回東京女子医科大学学会総会(平成13年9月29日)) [O] . 加藤多津子 2001

机译：2.我院医疗安全管理体系中央部门（医院事故预防措施委员会）的理想方式（座谈会，“医院风险管理”研讨会，东京女子医科大学学会第67届年会（2001年）（9月29日）

あるクラスのジレンマ問題に対する期待方策強化学習法

摘要

著录项

相似文献

相关主题

期刊订阅