Optimal Policies for Quantum Markov Decision Processes

Ming-Sheng Ying; Yuan Feng; Sheng-Gang Ying

首页> 中文期刊> 《国际自动化与计算杂志》 >Optimal Policies for Quantum Markov Decision Processes

Optimal Policies for Quantum Markov Decision Processes

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

Markov decision process(MDP)offers a general framework for modelling sequential decision making where outcomes are random.In particular,it serves as a mathematical framework for reinforcement learning.This paper introduces an extension of MDP,namely quantum MDP(q MDP),that can serve as a mathematical model of decision making about quantum systems.We develop dynamic programming algorithms for policy evaluation and finding optimal policies for q MDPs in the case of finite-horizon.The results obtained in this paper provide some useful mathematical tools for reinforcement learning techniques applied to the quantum world.

著录项

来源
《国际自动化与计算杂志》 |2021年第3期|410-421|共12页
作者
Ming-Sheng Ying; Yuan Feng; Sheng-Gang Ying;
展开▼
作者单位

Centre for Quantum Software and Information;

University of Technology Sydney;

NSW 2007;

Australia;

State Key Laboratory of Computer Science;

Institute of Software;

Chinese Academy of Sciences;

Beijing 100190;

China;

Department of Computer Science and Technology;

Tsinghua University;

Beijing 100084;

China;

展开▼
原文格式 PDF
正文语种 chi
中图分类对策论（博弈论）;
关键词
Quantum Markov decision processes; quantum machine learning; reinforcement learning; dynamic programming; decision making;

相似文献

中文文献
外文文献
专利

1. Robust analysis of discounted Markov decision processes with uncertain transition probabilities [J] . LOU Zhen-kai ,HOU Fu-jun ,LOU Xu-ming . 高校应用数学学报B辑 . 2020,第4期
2. Variance Optimization for Continuous-Time Markov Decision Processes [J] . Yaqing Fu . 统计学期刊（英文） . 2019,第2期
3. 基于Markov Decision Processes的可靠性量分析实证研究 [J] . 刘跃军 ,苏静 . 安阳师范学院学报 . 2017,第5期
4. Modeling and Design of Real-Time Pricing Systems Based on Markov Decision Processes [J] . Koichi Kobayashi ,Ichiro Maruta ,Kazunori Sakurama . 应用数学（英文） . 2014,第10期
5. Adaptive Strategies for Accelerating the Convergence of Average Cost Markov Decision Processes Using a Moving Average Digital Filter [J] . Edilson F. Arruda ,Fabrício Ourique . 美国运筹学期刊（英文） . 2013,第6期
6. Study on Policy Decision Model of Entrepreneurial Innovation Stimulus and Innovative Industry Regulation: A Case Study of Chinese Solar Energy Industry [C] . Dai Sheng ,Qiao Qiong ,Zeng Yan . 2008年企业家创新与经济增长国际学术研讨会 . 2008
7. Domestic Influences of Foreign Policy Decision Making.The Case of Ghana’s Foreign Policy(1992--Present) [A] . NKEGBE EUGENIA OFORIWA . 2020

Optimal Policies for Quantum Markov Decision Processes

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅