掌桥科研
一站式科研服务平台
科技查新
收录引用
专题文献检索
外文数据库(机构版)
更多产品
首页
成为会员
我要充值
退出
我的积分:
中文会员
开通
中文文献批量获取
外文会员
开通
外文文献批量获取
我的订单
会员中心
我的包量
我的余额
登录/注册
文献导航
中文期刊
>
中文会议
>
中文学位
>
中国专利
>
外文期刊
>
外文会议
>
外文学位
>
外国专利
>
外文OA文献
>
外文科技报告
>
中文图书
>
外文图书
>
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
美国国防部AD报告
美国能源部DE报告
美国航空航天局NASA报告
美国商务部PB报告
外军国防科技报告
美国国防部
美国参联会主席指示
美国海军
美国空军
美国陆军
美国海军陆战队
美国国防技术信息中心(DTIC)
美军标
美国航空航天局(NASA)
战略与国际研究中心
美国国土安全数字图书馆
美国科学研究出版社
兰德公司
美国政府问责局
香港科技大学图书馆
美国海军研究生院图书馆
OALIB数据库
在线学术档案数据库
数字空间系统
剑桥大学机构知识库
欧洲核子研究中心机构库
美国密西根大学论文库
美国政府出版局(GPO)
加利福尼亚大学数字图书馆
美国国家学术出版社
美国国防大学出版社
美国能源部文献库
美国国防高级研究计划局
美国陆军协会
美国陆军研究实验室
英国空军
美国国家科学基金会
美国战略与国际研究中心-导弹威胁网
美国科学与国际安全研究所
法国国际关系战略研究院
法国国际关系研究所
国际宇航联合会
美国防务日报
国会研究处
美国海运司令部
北约
盟军快速反应部队
北约浅水行动卓越中心
北约盟军地面部队司令部
北约通信信息局
北约稳定政策卓越中心
美国国会研究服务处
美国国防预算办公室
美国陆军技术手册
一般OA
科技期刊论文
科技会议论文
图书
科技报告
科技专著
标准
其它
美国卫生研究院文献
分子生物学
神经科学
药学
外科
临床神经病学
肿瘤学
细胞生物学
遗传学
公共卫生&环境&职业病
应用微生物学
全科医学
免疫学
动物学
精神病学
兽医学
心血管
放射&核医学&医学影像学
儿科
医学进展
微生物学
护理学
生物学
牙科&口腔外科
毒理学
生理学
医院管理
妇产科学
病理学
生化技术
胃肠&肝脏病学
运动科学
心理学
营养学
血液学
泌尿科学&肾病学
生物医学工程
感染病
生物物理学
矫形
外周血管病
药物化学
皮肤病学
康复学
眼科学
行为科学
呼吸学
进化生物学
老年医学
耳鼻喉科学
发育生物学
寄生虫学
病毒学
医学实验室检查技术
生殖生物学
风湿病学
麻醉学
危重病护理
生物材料
移植
医学情报
其他学科
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
主题
主题
题名
作者
关键词
摘要
高级搜索 >
外文期刊
外文会议
外文学位
外国专利
外文图书
外文OA文献
中文期刊
中文会议
中文学位
中国专利
中文图书
外文科技报告
清除
历史搜索
清空历史
首页
>
外文会议
>
2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning
2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning
召开年:
召开地:
出版时间:
-
会议文集:
-
会议论文
热门论文
全部论文
全选(
0
)
清除
导出
1.
Copyright page
机译:
版权页
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
2.
Symposium on adaptive dynamic programming and reinforcement learning (IEEE ADPRL 2011)
机译:
自适应动态规划和强化学习研讨会(IEEE ADPRL 2011)
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
3.
Author index
机译:
作者索引
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
4.
Agent self-assessment: Determining policy quality without execution
机译:
代理自我评估:无需执行即可确定策略质量
作者:
Hans Alexander
;
Duell Siegmund
;
Udluft Steffen
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Markov decision processes;
autonomous agent;
policy quality;
reinforcement learning;
robustness;
self-assessment;
uncertainty propagation;
5.
Active exploration for robot parameter selection in episodic reinforcement learning
机译:
情境强化学习中机器人参数选择的积极探索
作者:
Kroemer Oliver
;
Peters Jan
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
6.
Grounding subgoals in information transitions
机译:
在信息转换中将子目标接地
作者:
van Dijk Sander G.
;
Polani Daniel
会议名称:
《》
|
2011年
7.
Higher order Q-Learning
机译:
高阶Q学习
作者:
Edwards Ashley
;
Pottenger William M.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Artificial intelligence;
Bayesian methods;
Higher Order Learning;
Intelligent agent;
Machine learning;
Q-learning;
Reinforcement learning;
Statistical relational learning;
8.
A reinforcement learning approach for sequential mastery testing
机译:
顺序掌握测试的强化学习方法
作者:
El-Alfy El-Sayed M.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Bayesian decision theory;
intelligent tutoring;
reinforcement learning;
sequential mastery testing;
sequential probability ratio test;
9.
Active learning for personalizing treatment
机译:
主动学习个性化治疗
作者:
Deng Kun
;
Pineau Joelle
;
Murphy Susan
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
10.
Enhancing the episodic natural actor-critic algorithm by a regularisation term to stabilize learning of control structures
机译:
通过正则化术语增强情景自然演员批评算法,以稳定控制结构的学习
作者:
Witsch Andreas
;
Reichle Roland
;
Geihs Kurt
;
Lange Sascha
;
Riedmiller Martin
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
11.
Approximate reinforcement learning: An overview
机译:
近似强化学习:概述
作者:
Busoniu Lucian
;
Ernst Damien
;
De Schutter Bart
;
Babuska Robert
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
function approximation;
policy iteration;
policy search;
reinforcement learning;
value iteration;
12.
Parametric value function approximation: A unified view
机译:
参数值函数逼近:统一视图
作者:
Geist Matthieu
;
Pietquin Olivier
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Reinforcement learning;
survey;
value function approximation;
13.
Safe reinforcement learning in high-risk tasks through policy improvement
机译:
通过改进政策,在高风险任务中进行安全强化学习
作者:
Garcia Polo Francisco Javier
;
Fernandez Rebollo Fernando
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
14.
Adaptive dynamic programming for optimal control of unknown nonlinear discrete-time systems
机译:
用于未知非线性离散时间系统最优控制的自适应动态规划
作者:
Liu Derong
;
Wang Ding
;
Zhao Dongbin
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Adaptive critic designs;
adaptive dynamic programming;
approximate dynamic programming;
globalized dual heuristic programming;
intelligent control;
neural dynamic programming;
neural networks;
optimal control;
15.
Online adaptive learning of optimal control solutions using integral reinforcement learning
机译:
使用积分强化学习的最优控制解决方案在线自适应学习
作者:
Vamvoudakis Kyriakos G.
;
Vrabie Draguna
;
Lewis Frank L.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
16.
Improved neural fitted Q iteration applied to a novel computer gaming and learning benchmark
机译:
改进的神经拟合Q迭代应用于新型计算机游戏和学习基准
作者:
Gabel Thomas
;
Lutz Christian
;
Riedmiller Martin
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
17.
Information space receding horizon control
机译:
信息空间后退水平控制
作者:
Chakravorty Suman
;
Erwin R. Scott
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
18.
Protecting against evaluation overfitting in empirical reinforcement learning
机译:
在经验强化学习中防止评估过拟合
作者:
Whiteson Shimon
;
Tanner Brian
;
Taylor Matthew E.
;
Stone Peter
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
19.
Active exploration by searching for experiments that falsify the computed control policy
机译:
通过寻找伪造计算控制策略的实验来进行主动探索
作者:
Fonteneau Raphael
;
Murphy Susan A.
;
Wehenkel Louis
;
Ernst Damien
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
20.
Bayesian active learning with basis functions
机译:
具有基本功能的贝叶斯主动学习
作者:
Ryzhov Ilya O.
;
Powell Warren B.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
21.
Path integral control and bounded rationality
机译:
路径积分控制与有限理性
作者:
Braun Daniel A.
;
Ortega Pedro A.
;
Theodorou Evangelos
;
Schaal Stefan
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
22.
Adaptive dynamic programming with balanced weights seeking strategy
机译:
具有平衡权重寻找策略的自适应动态规划
作者:
Fu Jian
;
He Haibo
;
Ni Zhen
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
23.
Optimistic planning for sparsely stochastic systems
机译:
稀疏随机系统的乐观规划
作者:
Busoniu Lucian
;
Munos Remi
;
De Schutter Bart
;
Babuska Robert
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Markov decision processes;
model-predictive control;
online planning;
optimistic planning;
stochastic systems;
24.
Dynamic lead time promising
机译:
动态提前期很有希望
作者:
Reindorp Matthew J.
;
Fu Michael C.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
25.
On learning with imperfect representations
机译:
关于不完美表示的学习
作者:
Kalyanakrishnan Shivaram
;
Stone Peter
会议名称:
《》
|
2011年
26.
Reinforcement learning in multidimensional continuous action spaces
机译:
多维连续动作空间中的强化学习
作者:
Pazis Jason
;
Lagoudakis Michail G.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
27.
Moving least-squares approximations for linearly-solvable MDP
机译:
线性可解MDP的移动最小二乘近似
作者:
Zhong Mingyuan
;
Todorov Emanuel
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
28.
An adaptive-learning framework for semi-cooperative multi-agent coordination
机译:
半合作多智能体协调的自适应学习框架
作者:
Boukhtouta Abdeslem
;
Berger Jean
;
Powell Warren B.
;
George Abraham
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Multi-agent;
approximate dynamic programming;
cooperative;
learning;
29.
Tree-based variable selection for dimensionality reduction of large-scale control systems
机译:
基于树的变量选择用于大规模控制系统的降维
作者:
Castelletti Andrea
;
Galelli Stefano
;
Restelli Marcello
;
Soncini-Sessa Rodolfo
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
30.
Directed exploration of policy space using support vector classifiers
机译:
使用支持向量分类器定向探索策略空间
作者:
Rexakis Ioannis
;
Lagoudakis Michail G.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
31.
Complex object manipulation with hierarchical optimal control
机译:
具有分层最优控制的复杂对象操纵
作者:
Simpkins Alex
;
Todorov Emanuel
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Optimal control;
adaptive control;
hierarchical control;
legged locomotion;
nonlinear systems;
object manipulation;
optimization;
32.
An approximate Dynamic Programming based controller for an underactuated 6DoF quadrotor
机译:
用于欠驱动6DoF四旋翼的基于动态规划的近似控制器
作者:
Stingu Emanuel
;
Lewis Frank L.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
actor;
critic;
feedback;
neural network;
optimal control;
reinforcement learning;
system model;
training;
33.
Fitted policy search
机译:
适合的政策搜索
作者:
Migliavacca Martino
;
Pecorino Alessio
;
Pirotta Matteo
;
Restelli Marcello
;
Bonarini Andrea
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
34.
Near optimal control of mobile robot formations
机译:
移动机器人编队的近乎最佳控制
作者:
Dierks Travis
;
Brenner Bryan
;
Jagannathan S.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
ADP;
Formation Control;
Multi-Agent System Control;
Nonlinear Optimal Control;
Optimal Control;
35.
Feedback controller parameterizations for Reinforcement Learning
机译:
强化学习的反馈控制器参数化
作者:
Roberts John W.
;
Manchester Ian R.
;
Tedrake Russ
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
36.
Higher-level application of Adaptive Dynamic Programming/Reinforcement Learning - a next phase for controls and system identification?
机译:
自适应动态编程/强化学习的高级应用-控制和系统识别的下一阶段?
作者:
Lendaris George G.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Adaptive Dynamic Programming;
adaptive critic;
autonomous control;
context;
reinforcement learning;
system identification;
37.
N-step optimal time-invariant trajectory tracking control for a class of nonlinear systems
机译:
一类非线性系统的N步最优时不变轨迹跟踪控制
作者:
Song Ruizhuo
;
Zhang Huaguang
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
38.
Global optimal strategies of a class of finite-horizon continuous-time nonaffine nonlinear zero-sum game using a new iteration algorithm
机译:
一类新的迭代算法的有限水平连续时间非仿射非线性零和博弈的全局最优策略
作者:
Zhang Xin
;
Zhang Huaguang
;
Cui Lili
;
Luo Yanhong
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
39.
Evolutionary value function approximation
机译:
进化值函数逼近
作者:
Davarynejad Mohsen
;
van Ast Jelmer
;
Vrancken Jos
;
van den Berg Jan
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
40.
High-order local dynamic programming
机译:
高阶局部动态编程
作者:
Tassa Yuval
;
Todorov Emanuel
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
41.
Reinforcement learning algorithms for solving classification problems
机译:
解决分类问题的强化学习算法
作者:
Wiering Marco A.
;
van Hasselt Hado
;
Pietersma Auke-Dirk
;
Schomaker Lambert
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
42.
Model-building semi-Markov adaptive critics
机译:
模型建立的半马尔可夫自适应批评家
作者:
Gosavi Abhijit
;
Murray Susan L.
;
Hu Jiaqiao
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
43.
Data-based adaptive critic design for discrete-time zero-sum games using output feedback
机译:
基于输出反馈的离散时间零和游戏的基于数据的自适应评论家设计
作者:
Cui Lili
;
Zhang Huaguang
;
Zhang Xin
;
Luo Yanhong
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
44.
Supervised adaptive dynamic programming based adaptive cruise control
机译:
基于监督的自适应动态规划的自适应巡航控制
作者:
Zhao Dongbin
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
adaptive cruise control;
adaptive dynamic programming;
supervised reinforcement learning;
45.
Adaptive sample collection using active learning for kernel-based approximate policy iteration
机译:
使用主动学习的自适应样本收集,用于基于内核的近似策略迭代
作者:
Liu Chunming
;
Xu Xin
;
Haiyun Hu
;
Dai Bin
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Least Squares Policy Iteration (LSPI);
approximate policy iteration;
kernel methods;
reinforcement learning;
sample collection;
46.
Online near optimal control of unknown nonaffine systems with application to HCCI engines
机译:
未知非仿射系统的在线近最优控制及其在HCCI发动机中的应用
作者:
Zargarzadeh H.
;
Jagannathan S.
;
Drallmeier J.
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
Homogeneous Charge Compression Ignition;
Neural Network Control;
Online Nonlinear Optimal Control;
System Identification;
47.
Structure search of probabilistic models and data correction for EDA-RL
机译:
EDA-RL的概率模型的结构搜索和数据校正
作者:
Handa Hisashi
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
48.
Application of reinforcement learning-based algorithms in CO
2
allowance and electricity markets
机译:
基于强化学习的算法在CO
2 inf>配额和电力市场中的应用
作者:
Nanduri Vishnuteja
会议名称:
《2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning》
|
2011年
关键词:
cap-and-trade programs;
climate change;
game-theoretic models;
reinforcement learning;
restructured electricity markets;
意见反馈
回到顶部
回到首页