構造的プラント変動による最適性の原理の破れ

机译：由于结构植物波动而导致的最优性原则

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

原問題に最も近い，状態平均J値を用いる強化学習では，方策の評価値を変動プラント集合において全状態に対して唯一設定する．この間題は，定義された評価値を最小化する非線形計画問題で，解を求めることは容易ではない．そこで，平均プラントに対する最適方策や，二人零和ゲームで得られる方策など，少ない計算で求められる方策を初期方策とし，プラント集合に対して有効な方策となるように改善していくアルゴリズムを提案する．これらのアルゴリズムにより，最適とは限らないが，少ない計算量で実現可能な方策を得ることができる．本稿では，2．で標準的な強化学習問題について述べ，3．で変動を考慮した強化学習問題を定義し，このとき最適性の原理が破れることを示す．4．では，いくつかの緩和問題を定義し，その解法を示す．5．で簡単な問題を用いて最適性の原理が破れていることを確かめ，迷路問題にそれぞれの解法を適用するととで，提案手法の有効性を示す最後に6．を結論とする．

机译：在加强最接近原始问题的学习中，使用平均J值的加固学习仅针对波动设备集中的所有状态设置。通过最小化定义的评估值的非线性规划问题，该过程不易解决解决方案。因此，我们提出了一种算法来改善小型计算所需的措施，例如平均工厂的最佳措施，以及由两人竹比赛获得的初始策略所获得的措施。这些算法不一定是最佳的，而是可以获得可以以较少的计算复杂性实现的措施。在本文中，标准标准增强学习问题，3。考虑波动，定义增强学习问题，然后表明最优性的原理可以被破坏。四。然后，定义了一些放松问题并显示了解决方案。五。此外，由于使用简单的问题和将每个解决方案应用于迷宫问题的原则，因此6表示提出的方法的有效性。结论是为了得出结论。

著录项

来源
《SICE Symposium on Decentralized Autonomous Systems》|2012年||共6页
会议地点
作者
泉田啓; 谷百合夏;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 TP27-53;
关键词

相似文献

外文文献
中文文献
专利

1. 強化学習によるプラント自動最適化操業への試み～酢酸ビニルモノマー製造プラントモデルへの適用～ [J] . 松原崇充, 鹿子木宏明化学工学 . 2019,第4期

机译：通过加固学习应用对醋酸乙烯酯单体生产植物模型的自动优化操作保护 -
2. 岐路に立つプラント運転－その進路と可能性を考える(2)プラントデータ活用による運転改善：【実践事例：“ユーザは運転改善にこう取り組んだ”】エチレン装置の厳密モデルによるリアルタイム最適化とその効果 [J] . 栗原久光, 伊東育生計装 . 2005,第9期

机译：十字路口的工厂运营-关于其发展历程和可能性的思考（2）利用工厂数据进行运营改进：[实际示例：“用户致力于运营改进”]通过严格的乙烯设备模型进行实时优化及其效果
3. 岐路に立つプラント運転－その進路と可能性を考える(2)プラントデータ活用による運転改善：【実践事例：“ユーザは運転改善にこう取り組hだ”】エチレン装置の厳密モデルによるリアルタイム最適化とその効果 [J] . 栗原久光, 伊東育生計装 . 2005,第9期

机译：站在十字路口的植物操作 - 考虑到其过程和可能性（2）通过利用植物数据来改善操作：[练习案例：“用户正在接近推动改进”]实时优化与乙烯装置的精确模型的实时优化
4. 構造的プラント変動による最適性の原理の破れ [C] . 泉田啓, 谷百合夏 SICE Symposium on Decentralized Autonomous Systems . 2012

机译：由于结构植物波动而导致的最优性原则
5. アセチルコリンの冠注で誘発されるブタの主および小冠動脈攣縮モデルの開発とこのモデル動物を用いたニプラジロール, イソソルビド?ジニトレート, ブナゾシンの冠攣縮予防効果に関する研究 [D] . Kawamura, Atsushi 1991

机译：冠状动脉注入乙酰胆碱诱导的猪主，小冠状动脉痉挛模型的建立以及尼泊地洛尔，硝酸异山梨酯和布那唑嗪对模型动物的预防作用研究
6. 不安定性により誘導されるラット膝変形性関節症モデルにおける、インターロイキン‐4関節内投与による軟骨細胞からの一酸化窒素の産生減少および軟骨破壊の抑制 [O] . Yorimitsu, Masanori 2008

机译：在不稳定性诱发的大鼠膝骨关节炎模型中，白细胞介素4关节内给药可减少软骨细胞一氧化氮的产生并抑制软骨破坏

構造的プラント変動による最適性の原理の破れ

摘要

著录项

相似文献

相关主题

期刊订阅