非定常環境に適応する認知的満足化価値関数の提案

机译：适应不稳定环境的认知满意度价值函数的建议

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

人工知能分野でAlpha-Go[2] は囲碁において人間以上の成績を残して注目を集めたが、このモデルで用いられた技術は深層強化学習と呼ばれる強化学習の一種である。強化学習において探索空間が膨大だと最適な行動系列を現実的な時間で学習することが困難となる。そこで高橋らはハーバート・サイモンが提唱した限定合理性に着目し、基準を満たすことを目的とした戦略を満足化と呼び研究を行なっている[1]。特に、強化学習に適用可能な満足化のモデルを提案し、多腕バンディット問題においてUCB1-tuned よりも早く学習できることが示された[1]。本研究では、高橋らが提案した満足化価値関数RS をもとに非定常環境において有用なアルゴリズムを提案し、より実用的な満足化方策の実現を目指す。そして提案アルゴリズムの性能を評価するために非定常環境を想定した多腕バンディットシミュレーションを行い、提案したアルゴリズムの有用性を示す。

机译：在人工智能领域，Go中的Alpha-Go [2]比人类还多以上结果吸引了人们的注意，但已在该模型中使用所使用的技术是一种强化学习，称为深度强化学习。是。强化学习中搜索空间巨大时的最佳选择很难在现实的时间内学习行为顺序。因此，高桥等人提倡赫伯特·西蒙（Herbert Simon）发行限量版。着眼于理性，旨在满足标准的策略我们正在进行名为满意度的研究[1]。特别是强化学习提出可以应用于多武装匪徒的满意度模型可以比UCB1更快地学习问题显示[1]。在这项研究中，高桥等人提出的满意度。基于值函数RS在不稳定的环境中很有用提出“乐高主义”并实现更实际的满意度措施它旨在。并评估了所提出算法的性能假设环境不稳定的多武装土匪模拟所提算法的实用性如图所示。

著录项

来源
《情報処理学会;情報処理学会全国大会》|2019年|2.267-2.268|共2页
会议地点
作者
齋藤建志; 高橋達二;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. 低露点環境向けデシカント空調の制御に関する研究第1報: 数値計算による制御対象の定常·非定常特性の評価 [J] . 伊藤　卓, 大曲康仁, 山口誠一, 空気調和·衛生工学会論文集 . 2015,第224期

机译：低露点环境干燥剂空调控制研究第一报告：通过数值计算评价受控对象的稳态和非稳态特性
2. 原著論文編論文要旨水環境におけるふん便指標細菌である大腸菌は，環境中で再増殖することが知られており，指標細菌としての妥当性が懸念されている。そこで本研究では，下水処理水が流入する小河川において，下水処理水の流入•混合後の流下過程における大腸菌数の変化について調査した。大腸菌のフラックスは，上流地点と下水処理水の合計量よりも.その下流地点において増大する傾向を示した。また，下流地点の底質で高密度の大腸菌数が検出された。そこで，パルスフィールド-ゲル電気泳動法によって大腸菌の遺伝子型の類似性を評価したところ，上流の河川水，河床付着物，ならびに底質から単離した大腸菌において遺伝子型の一致する株が確認された。以上のことから，下水処理水の影響を強く受ける小河川では，大腸菌が河床の付着物や底質に生残•蓄積しており，再増殖する可能性も否定できないことが示唆された。河川における大腸菌数によるふん便汚染評価の解釈には，留意する必要がある。 [J] . 水環境学会誌 . 2018,第3期

机译：原始论文摘要大肠杆菌是水生环境中的粪便指示细菌，已知会在环境中重新生长，因此它作为指示细菌的有效性受到关注。因此，在这项研究中，我们调查了污水处理水流入的一条小河中污水处理水的流入和混合后，在排水过程中大肠杆菌数量的变化。大肠杆菌的通量显示出在下游点而不是上游点和污水处理水总量的增加趋势。另外，在底部沉积物中检测到高密度的大肠杆菌。因此，通过脉冲场凝胶电泳法对大肠杆菌的基因型相似性进行了评估，结果在上游河水，河床沉积物和从沉积物中分离出来的大肠杆菌中确认了具有相同基因型的菌株。它是由上可知，在受到污水处理严重影响的小河中，大肠杆菌在河床的沉积物和沉积物中存活并积累，不能否认有再生的可能性。根据河流中的大肠杆菌数量，在解释粪便污染评估时应格外小心。
3. ワークプレイスの多様化に対応した温熱環境制御手法に関する研究（その3）: パーソナル空調が非定常状態における温冷感へ及ぼす影響 [J] . 田中規敏, 和田一樹, 米田拓朗日本建築学会大会学術講演梗概集 . 2019,第2019期

机译：热环境控制方法康宁多样性的工作场所（第3部分）：个人空调对非稳态热冷却的影响
4. 非定常環境に適応する認知的満足化価値関数の提案 [C] . 齋藤建志, 高橋達二情報処理学会全国大会 . 2019

机译：建议采用非视野环境的认知满足价值函数
5. 非線形システムの形式的線形化による数値解法とその適用に関する研究 [D] . 小松一男 1995

机译：非线性系统形式线性化的数值方法研究及其应用
6. 日本のオフィスにおける就労者の環境知覚・満足・生産性と環境特性との関係性に関する研究 [O] . Gabor Nagy, ナジガボール 2017

机译：日本办事处员工的环境知觉，满意度，生产率和环境特征之间的关系研究

非定常環境に適応する認知的満足化価値関数の提案

摘要

著录项

相似文献

相关主题

期刊订阅