首页> 外文期刊>電子情報通信学会技術研究報告 >多本腕バンディット問題に対する綱引きモデルについて: 非局所的に相関した並列サーチのための生物からヒントを得た計算手法
【24h】

多本腕バンディット問題に対する綱引きモデルについて: 非局所的に相関した並列サーチのための生物からヒントを得た計算手法

机译:关于多臂匪徒问题的拔河模型:一种非局部相关并行搜索的生物启发式计算方法

获取原文
获取原文并翻译 | 示例
       

摘要

The "tug-of-war (TOW) model" proposed in this study is a unique method for parallel searches inspired by the photoavoidance behavior of the single-celled amoeba, the true slime mold Physarum. In the TOW model, many branches of the amoeba act as search agents to collect information on light stimulations while conserving the total sum of their resources. We show that the "nonlocal correlation" via resource conservation can be advantageous to manage the "exploration-exploitation dilemma" for solving the multi-armed bandit problem. We also show the effect of the information on light stimulations from other branches on the TOW model's performance.%単細胞アメーバ・真性粘菌Physarum の光刺激回避行動に着想を得た「綱引きモデル」という並列探索アルゴリズムを提案する。このモデルでは、アメーバの複数の分枝が、環境情報を収集する探索エージェントとして機能する。アメーバは、その総リソース量(総体積)を保存しつつ、複数の分枝を伸縮させることで光刺激を受容し、どの分枝を伸長させるかを決定する。このとき、保存則を介して生じる分枝間の「非局所的な相関」が、「多本腕バンディット問題」における“exploration-exploitation dilemma”と呼ばれるトレードオフ状況の効率的解決に寄与することを示す。また、他の分枝から伝わる光刺激情報がパフォーマンスに及ぼす影響についても報告する。
机译:这项研究提出的“拔河(TOW)模型”是一种并行搜索的独特方法,该搜索方法受单细胞变形虫真正的粘液霉菌Physarum的光回避行为启发。在TOW模型中,我们表明,通过资源节约进行的“非本地关联”可以有利于解决解决多武装匪徒的“开发-开发困境”我们还显示了信息对其他分支的光刺激对TOW模型性能的影响。%受单细胞变形虫和粘液霉菌Physarum的启发而提出的称为“拔河模型”的并行搜索算法的建议去做。在此模型中,变形虫的多个分支充当收集环境信息的搜索代理。变形虫保留其资源的总量(总体积),并扩展和收缩多个分支以接收光刺激并确定要扩展哪个分支。此时,通过守恒定律发生的分支之间的“非局部相关”有助于有效解决“多臂强盗问题”中被称为“探索-开发困境”的权衡情况。显示。此外,我们还报告了来自其他分支机构的光刺激信息对性能的影响。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2010年第83期|p.19-24|共6页
  • 作者单位

    独立行政法人理化学研究所 基幹研RIKEN-HYU 連携研究センター 揺律機能研究チーム 〒351-0198 埼玉県和光市広沢2-1 〒133-791 韓国ソウル特別市城東区杏堂洞17 漢陽大学校 融合技術センター5F;

    独立行政法人理化学研究所 基幹研RIKEN-HYU 連携研究センター 揺律機能研究チーム 〒351-0198 埼玉県和光市広沢2-1 〒133-791 韓国ソウル特別市城東区杏堂洞17 漢陽大学校 融合技術センター5F;

    独立行政法人理化学研究所 基幹研RIKEN-HYU 連携研究センター 揺律機能研究チーム 〒351-0198 埼玉県和光市広沢2-1 〒133-791 韓国ソウル特別市城東区杏堂洞17 漢陽大学校 融合技術センター5F;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    強化学習; 多本腕バンディット問題; 生物からヒントを得た計算; 並列探索;

    机译:强化学习;多武装匪徒问题;生物启发的计算;并行搜索;
  • 入库时间 2022-08-18 00:33:05

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号