逆強化学習を用いた最適行動を促すインセンティブの推定

机译：利用逆力学习促使激励措施的估算

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

本研究では，上述のジレンマをスタグハントゲームを用いてモデル化し，ジレンマを引き起こす原因がインセンティブの影響であることを指摘した後，プレイヤーが最適解である「協力」を選択するインセンティブ設計法として2つのアプローチを取り上げる．ひとつは，Q学習を用いた手法，もう一つは逆強化学習を用いた手法である．

机译：在这项研究中，我们使用Stag-Hunt游戏模拟上述困境，并指出导致困境的原因是激励措施的影响，并作为选择“合作”的激励设计方法，即玩家是最佳解决方案占用两种方法。一个是使用Q学习的方法，另一个是使用逆钢筋学习的方法。

著录项

来源
《SICE Symposium on Intelligent Systems》|2012年||共6页
会议地点
作者
大喜多周; 荒井幸代;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 TP18-53;
关键词

相似文献

外文文献
中文文献
专利

1. 耐滑性のない安全靴シモン（東京都中央区，☎03-5695-1011)は，耐滑性と安定歩行を兼ね備えた安全靴，シモンライトシリーズ「SL28」を開発，販売を開始した。調整域の広い靴紐と，かかとを包み込み，足裏の負担を軽減する中敷きで，作業現場における軽やかなフットワークを可能にする。靴底には，複数パーツの「SX 3層底Fソールシステム（2016年グッドデザィン賞受賞）」を採用しているため，長期保存に強く加水分解しない。地面への接地面積も大きく安定感に優れ，耐滑効果が長く持続する。139-139第23期•東西ァス防水技能員養成所を卒業して目指すべき将来像が見えた学び舎 [J] . 平野　颯真防水ジャ—ナル . 2019,第6期

机译：Simon，防滑安全鞋（东京都中央区，☎03-5695-1011），已开发并开始销售具有防滑和稳定行走功能的安全鞋Simon Light系列“ SL28”。鞋带可调节的范围很广，鞋垫可以包裹脚后跟，减少脚底的压力，使工作场所的脚步轻松。鞋底使用多部分SX 3层鞋底F鞋底系统（2016年最佳设计奖得主），因此长时间水解不会强烈水解。与地面的地面接触面积大，稳定感极佳，并且防滑效果可长时间持续。 139-139第23学期•一栋教学楼，从东西方运动员技术培训学院毕业后，您可以看到将来的目标
2. 耐滑性のない安全靴シモン（東京都中央区，☎03-5695-1011)は，耐滑性と安定歩行を兼ね備えた安全靴，シモンライトシリーズ「SL28」を開発，販売を開始した。調整域の広い靴紐と，かかとを包み込み，足裏の負担を軽減する中敷きで，作業現場における軽やかなフットワークを可能にする。靴底には，複数パーツの「SX 3層底Fソールシステム（2016年グッドデザィン賞受賞）」を採用しているため，長期保存に強く加水分解しない。地面への接地面積も大きく安定感に優れ，耐滑効果が長く持続する。139-139第23期•東西ァス防水技能員養成所を卒業して目指すべき将来像が見えた学び舎 [J] . 平野　颯真防水ジャ—ナル . 2019,第6期

机译：没有光滑光滑的鞋子（Tokyo Chuo Ward，☎03-5695-1011）已经开发出并售出安全鞋，Simon Lat系列“SL28”结合光滑，稳定行走。调整区域的宽鞋带和高跟鞋被包裹并减少了鞋底的负担，使得可以在工作场所进行轻微的习惯。由于在多个部件中，鞋底采用“SX 3层底部F-SOL系统（2016指数奖励）”采用，因此它不会强烈水解它。地面到地面也具有高度稳定性，平滑效果长。第23章第23期•一个学习的建筑，未来雕像旨在瞄准Shozasu防水技术人员培训中心
3. NTTら業界団体を設立光通信技術を研究日本電信電話(株)(NTT、東京都千代田区)、米インテル、ソ二ー(株)(東京都港区)の3社は、新たな業界団体を設立する。光電融合技術を活用したフォトニクス関連技術の研究開発などを推進し、超大容量通信に対応できる光ネットヮーク技術の確立などを目指してハる。3-3プロセッシング領域狙う国内DRAM大手のェルピーダメモリを買収し、大きく飛躍を遂げた米マイクロンテクノロジー。2017年にはサンディスク共同創業者の1人である、Sanjay Mehrotra (サンジエイ·メイロトラ)氏を招聘。経営体制も刷新され、大きく生まれ変わった「新生マイクロン」を全面に押し出した。米サンフランシスコで開催されたプライベートイベント「MlicronInsight 2019」(現地10月24日開催)では、同社のあるべき将来像に対するメッセージが随所に散りばめられていた。 [J] . 半導体産業新聞 . 2019,第2372期

机译：成立了NTT和其他工业集团研究光通信技术的日本电报电话公司（NTT，东京千代田区），英特尔，索尼公司（东京都港区）是三个新的工业集团。建立。促进利用光电子融合技术的光子相关技术的研究和开发，并致力于建立可支持超高容量通信的光网络技术。 3-3处理领域美国Micron Technology在收购了国内主要DRAM公司Elpida Memory之后取得了巨大飞跃。 2017年，我们邀请了Sanjay联合创始人Sanjay Mehrotra。管理系统也进行了改进，我们推出了完全脱胎换骨的“新Micron”。在旧金山举行的私人活动“ Mlicron Insight 2019”（10月24日举行）上，有关公司未来愿景的信息四处散布。
4. 逆強化学習を用いた最適行動を促すインセンティブの推定 [C] . 大喜多周, 荒井幸代 SICE Symposium on Intelligent Systems . 2012

机译：利用逆力学习促使激励措施的估算
5. アセチルコリンの冠注で誘発されるブタの主および小冠動脈攣縮モデルの開発とこのモデル動物を用いたニプラジロール, イソソルビド?ジニトレート, ブナゾシンの冠攣縮予防効果に関する研究 [D] . Kawamura, Atsushi 1991

机译：冠状动脉注入乙酰胆碱诱导的猪主，小冠状动脉痉挛模型的建立以及尼泊地洛尔，硝酸异山梨酯和布那唑嗪对模型动物的预防作用研究
6. 基調講演1 : 会社力とマーケティング : 力強く利益を出し続けるために、マーケティングの重要性と活用（特集2 長岡大学地域研究センター2004年度シンポジウム : ビジネス成功の鍵を握るマーケティング力を語る : 経営のため、従業員のため、社会のためのマーケティングマインドの活用法） [O] . 長谷川和廣 2005

机译：主题演讲1：公司力量和市场营销：市场营销的重要性和利用继续强劲获利（专刊2长冈大学地区研究中心2004研讨会：讨论把握业务成功关键的市场营销力量：管理如何运用营销思想为员工和社会服务

逆強化学習を用いた最適行動を促すインセンティブの推定

摘要

著录项

相似文献

相关主题

期刊订阅