Variance-Penalized Reinforcement Learning for Risk-Averse Asset Allocation

机译：方差惩罚强化学习，规避风险资产配置

获取原文

获取原文并翻译 | 示例

页面导航

摘要
著录项
相似文献
相关主题

摘要

The tasks of optimizing asset allocation considering transaction costs can be formulated into the framework of Markov Decision Pro-cesses(MDPs) and reinforcement learning. In this paper, a risk-averse reinforcement learning algorithm is proposed which improves asset allocation strategy of portfolio management systems. The proposed algorithm alternates policy evaluation phases which take into account the mean and variance of return under a given policy and policy improvement phases which follow the variance-penalized criterion. The algorithm is tested on trading systems for a single future corresponding to a Japanese stock index.

机译：考虑交易成本优化资产配置的任务可以制定为马尔可夫决策过程（MDP）和强化学习的框架。提出了一种规避风险的强化学习算法，以改进投资组合管理系统的资产配置策略。所提出的算法交替考虑政策评估阶段，该阶段考虑了给定政策下收益的均值和方差以及遵循方差惩罚标准的政策改进阶段。该算法在交易系统上针对与日本股票指数相对应的单个期货进行了测试。

著录项

来源
《Second International Conference on Intelligent Data Engineering and Automated Learning - IDEAL 2000: Data Mining, Financial Engineering, and Intelligent Agents , Dec 13-15, 2000, Hong kong, China》|2000年|p.244-249|共6页
会议地点 Hong Kong(CN);Hong Kong(CN)
作者
Makoto Sato; Shigenobu Kobayashi;
展开▼
作者单位

Tokyo Institute of Technology, 4259 Nagatsuta, Midori-ku, Yokohama, JAPAN;

展开▼
会议组织
原文格式 PDF
正文语种 eng
中图分类自动化技术、计算机技术;
关键词

相似文献

外文文献
中文文献
专利

1. Variance-penalized Markov decision processes: dynamic programming and reinforcement learning techniques [J] . Abhijit Gosavi International journal of general systems . 2014,第5a6期

机译：方差惩罚的马尔可夫决策过程：动态规划和强化学习技术
2. Strategic asset allocation and market timing: a reinforcement learning approach [J] . Thorsten Hens, Peter Woehrmann Computational economics . 2007,第3a4期

机译：战略资产配置和市场时机：强化学习方法
3. Adaptive stock trading with dynamic asset allocation using reinforcement learning [J] . O JM, Lee JW, Lee JW, Information Sciences: An International Journal . 2006,第15期

机译：利用强化学习进行动态资产分配的自适应股票交易
4. Variance-penalized reinforcement learning for risk-averse asset allocation [C] . Makoto Sato, Shigenobu Kobayashi Intelligent Data Engineering and Automated Learning . 2000

机译：风险厌恶资产分配的差异惩罚钢筋学习
5. Interrupting Reinforcement Learning Using Naltrexone Sustains Asset Market Bubbles. [D] . Sarraf, George. 2014

机译：使用纳曲酮中断强化学习可维持资产市场泡沫。
6. A Graph Convolutional Network-Based Deep Reinforcement Learning Approach for Resource Allocation in a Cognitive Radio Network [O] . Di Zhao, Hao Qin, Bin Song, 2020

机译：一种图形卷积网络的资源分配在认知无线电网络中的基于卷积网络的深度加强学习方法
7. REINFORCEMENT LEARNING FOR MODEL BUILDING AND VARIANCE-PENALIZED CONTROL [O] . M. D. Rossetti, R. R. Hill, B. Johansson, 2014

机译：模型构建和方差控制的加强学习

Variance-Penalized Reinforcement Learning for Risk-Averse Asset Allocation

摘要

著录项

相似文献

相关主题

期刊订阅