掌桥科研
一站式科研服务平台
科技查新
收录引用
专题文献检索
外文数据库(机构版)
更多产品
首页
成为会员
我要充值
退出
我的积分:
中文会员
开通
中文文献批量获取
外文会员
开通
外文文献批量获取
我的订单
会员中心
我的包量
我的余额
登录/注册
文献导航
中文期刊
>
中文会议
>
中文学位
>
中国专利
>
外文期刊
>
外文会议
>
外文学位
>
外国专利
>
外文OA文献
>
外文科技报告
>
中文图书
>
外文图书
>
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
美国国防部AD报告
美国能源部DE报告
美国航空航天局NASA报告
美国商务部PB报告
外军国防科技报告
美国国防部
美国参联会主席指示
美国海军
美国空军
美国陆军
美国海军陆战队
美国国防技术信息中心(DTIC)
美军标
美国航空航天局(NASA)
战略与国际研究中心
美国国土安全数字图书馆
美国科学研究出版社
兰德公司
美国政府问责局
香港科技大学图书馆
美国海军研究生院图书馆
OALIB数据库
在线学术档案数据库
数字空间系统
剑桥大学机构知识库
欧洲核子研究中心机构库
美国密西根大学论文库
美国政府出版局(GPO)
加利福尼亚大学数字图书馆
美国国家学术出版社
美国国防大学出版社
美国能源部文献库
美国国防高级研究计划局
美国陆军协会
美国陆军研究实验室
英国空军
美国国家科学基金会
美国战略与国际研究中心-导弹威胁网
美国科学与国际安全研究所
法国国际关系战略研究院
法国国际关系研究所
国际宇航联合会
美国防务日报
国会研究处
美国海运司令部
北约
盟军快速反应部队
北约浅水行动卓越中心
北约盟军地面部队司令部
北约通信信息局
北约稳定政策卓越中心
美国国会研究服务处
美国国防预算办公室
美国陆军技术手册
一般OA
科技期刊论文
科技会议论文
图书
科技报告
科技专著
标准
其它
美国卫生研究院文献
分子生物学
神经科学
药学
外科
临床神经病学
肿瘤学
细胞生物学
遗传学
公共卫生&环境&职业病
应用微生物学
全科医学
免疫学
动物学
精神病学
兽医学
心血管
放射&核医学&医学影像学
儿科
医学进展
微生物学
护理学
生物学
牙科&口腔外科
毒理学
生理学
医院管理
妇产科学
病理学
生化技术
胃肠&肝脏病学
运动科学
心理学
营养学
血液学
泌尿科学&肾病学
生物医学工程
感染病
生物物理学
矫形
外周血管病
药物化学
皮肤病学
康复学
眼科学
行为科学
呼吸学
进化生物学
老年医学
耳鼻喉科学
发育生物学
寄生虫学
病毒学
医学实验室检查技术
生殖生物学
风湿病学
麻醉学
危重病护理
生物材料
移植
医学情报
其他学科
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
主题
主题
题名
作者
关键词
摘要
高级搜索 >
外文期刊
外文会议
外文学位
外国专利
外文图书
外文OA文献
中文期刊
中文会议
中文学位
中国专利
中文图书
外文科技报告
清除
历史搜索
清空历史
首页
>
外文会议
>
其他
>
European Workshop on Reinforcement Learning
European Workshop on Reinforcement Learning
召开年:
召开地:
出版时间:
-
会议文集:
-
会议论文
热门论文
全部论文
全选(
0
)
清除
导出
1.
Policy Learning - A Unified Perspective with Applications in Robotics
机译:
政策学习 - 在机器人中的应用程序统一视角
作者:
Jan Peters
;
Jens Kober
;
Duy Nguyen-Tuong
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
2.
United We Stand: Population Based Methods for Solving Unknown POMDPs
机译:
联合我们立场:求解未知POMDP的人口方法
作者:
Noel Welsh
;
Jeremy Wyatt
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
3.
Exploiting Additive Structure in Factored MDPs for Reinforcement Learning
机译:
用于加固学习的因子MDP中的利用添加剂结构
作者:
Thomas Degris
;
Olivier Sigaud
;
Pierre-Henri Wuillemin
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
4.
Tile Coding Based on Hyperplane Tiles
机译:
基于超平面瓷砖的瓷砖编码
作者:
Daniele Loiacono
;
Pier Luca Lanzi
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
5.
Reinforcement Learning with the Use of Costly Features
机译:
使用昂贵功能的加固学习
作者:
Robby Goetschalckx
;
Scott Sanner
;
Kurt Driessens
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
6.
A Near Optimal Policy for Channel Allocation in Cognitive Radio
机译:
认知无线电频道分配近的最佳政策
作者:
Sarah Filippi
;
Olivier Cappe
;
Fabrice Clerot
;
Eric Moulines
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
7.
Regularized Fitted Q-Iteration: Application to Planning
机译:
正规化的Q迭代:规划申请
作者:
Amir Massoud Farahmand
;
Mohammad Ghavamzadeh
;
Csaba Szepesvari
;
Shie Mannor
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
8.
Algorithms and Bounds for Rollout Sampling Approximate Policy Iteration
机译:
卷展栏采样近似政策迭代的算法和界限
作者:
Christos Dimitrakakis
;
Michail G. Lagoudakis
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
9.
Policy Iteration for Learning an Exercise Policy for American Options
机译:
学习美国选项的行使政策的政策迭代
作者:
Yuxi Li
;
Dale Schuurmans
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
10.
Evaluation of Batch-Mode Reinforcement Learning Methods for Solving DEC-MDPs with Changing Action Sets
机译:
用改变作用集求解DEC-MDP的批量模式增强学习方法评价
作者:
Thomas Gabel
;
Martin Riedmiller
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
11.
Basis Expansion in Natural Actor Critic Methods
机译:
自然演员批评方法中的基础扩展
作者:
Sertan Girgin
;
Philippe Preux
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
12.
Efficient Reinforcement Learning in Parameterized Models: Discrete Parameter Case
机译:
参数化模型中有效的强化学习:离散参数案例
作者:
Kirill Dyagilev
;
Shie Mannor
;
Nahum Shimkin
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
13.
Markov Decision Processes with Arbitrary Reward Processes
机译:
马尔可夫决策过程,具有任意奖励过程
作者:
Jia Yuan Yu
;
Shie Mannor
;
Nahum Shimkin
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
14.
Use of Reinforcement Learning in Two Real Applications
机译:
在两个真实应用中使用强化学习
作者:
Jose D. Martin-Guerrero
;
Emilio Soria-Olivas
;
Marcelino Martinez-Sober
;
Antonio J. Serrrano-Lopez
;
Rafael Magdalena-Benedito
;
Juan Gomez-Sanchis
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
15.
Probabilistic Inference for Fast Learning in Control
机译:
概率推断在控制中快速学习
作者:
Carl Edward Rasmussen
;
Marc Peter Deisenroth
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
16.
Optimistic Planning of Deterministic Systems
机译:
确定性系统的乐观规划
作者:
Jean-Francois Hren
;
Remi Munos
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
17.
Bayesian Reward Filtering
机译:
贝叶斯奖励过滤
作者:
Matthieu Geist
;
Olivier Pietquin
;
Gabriel Fricout
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
关键词:
Reinforcement Learning;
Function Approximation;
Bayesian Filtering;
18.
Lazy Planning under Uncertainty by Optimizing Decisions on an Ensemble of Incomplete Disturbance Trees
机译:
通过优化关于不完全干扰树的集合的决策,在不确定性下的懒惰规划
作者:
Boris Defourny
;
Damien Ernst
;
Louis Wehenkel
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
关键词:
Stochastic dynamic programming;
Ensemble methods;
19.
Variable Metric Reinforcement Learning Methods Applied to the Noisy Mountain Car Problem
机译:
应用于嘈杂的山上问题的可变度量强化学习方法
作者:
Verena Heidrich-Meisner
;
Christian Igel
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
20.
Applications of Reinforcement Learning to Structured Prediction
机译:
增强学习在结构预测中的应用
作者:
Francis Maes
;
Ludovic Denoyer
;
Patrick Gallinari
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
21.
New Error Bounds for Approximations from Projected Linear Equations
机译:
来自投影线性方程的近似的新误差界限
作者:
Huizhen Yu
;
Dimitri P. Bertsekas
会议名称:
《European Workshop on Reinforcement Learning》
|
2008年
22.
Reinforcement Learning with a Bilinear Q Function
机译:
用双线性Q功能加固学习
作者:
Charles Elkan
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
23.
Batch, Off-Policy and Model-Free Apprenticeship Learning
机译:
批量,违规和无模型学徒学习
作者:
Edouard Klein
;
Matthieu Geist
;
Olivier Pietquin
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
24.
Proposal and Evaluation of the Active Course Classification Support System with Exploitation-Oriented Learning
机译:
有效课程分类支持系统的提案与评估,具有剥削为导向的学习
作者:
Kazuteru Miyazaki
;
Masaaki Ida
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Reinforcement learning;
Exploitation-oriented learning;
Course classification;
Recommender system;
25.
Transfer Learning in Multi-Agent Reinforcement Learning Domains
机译:
在多智能体增强学习域中转移学习
作者:
Georgios Boutsioukis
;
Ioannis Partalas
;
Ioannis Vlahavas
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
26.
Compound Reinforcement Learning: Theory and an Application to Finance
机译:
复合加固学习:理论与申请资助
作者:
Tohgoroh Matsui
;
Takashi Goto
;
Kiyoshi Izumi
;
Yu Chen
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Reinforcement learning;
Compound return;
Value functions;
Finance;
27.
Options with Exceptions
机译:
包含例外的选项
作者:
Munu Sairamesh
;
Balaraman Ravindran
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Options framework;
Transfer Learning;
Maintenance of skills;
28.
Transfer Learning via Multiple Inter-task Mappings
机译:
通过多个任务间映射传输学习
作者:
Anestis Fachantidis
;
Ioannis Partalas
;
Matthew E. Taylor
;
Ioannis Vlahavas
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
29.
Introduction of Fixed Mode States into Online Profit Sharing and Its Application to Waist Trajectory Generation of Biped Robot
机译:
将固定模式引入在线利润分享及其在腰部轨迹生成的应用中的应用
作者:
Seiya Kuroda
;
Kazuteru Miyazaki
;
Hiroaki Kobayashi
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Reinforcement Learning;
Exploitation-oriented Learning;
Profit Sharing;
Improved PARP;
Biped robot;
30.
A Framework for Computing Bounds for the Return of a Policy
机译:
用于恢复策略的界限的框架
作者:
Cosmin Paduraru
;
Doina Precup
;
Joelle Pineau
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
31.
Optimized Look-ahead Tree Search Policies
机译:
优化的展望树搜索策略
作者:
Francis Maes
;
Louis Wehenkel
;
Damien Ernst
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Real-time Control;
Look-ahead Tree Search;
Estimation of Distribution Algorithms;
32.
Robust Bayesian Reinforcement Learning through Tight Lower Bounds
机译:
强大的贝叶斯强化通过紧张的下限学习
作者:
Christos Dimitrakakis
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
33.
Handling Ambiguous Effects in Action Learning
机译:
处理行动学习中的模棱两可效果
作者:
Boris Lesner
;
Bruno Zanuttini
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Stochastic action;
Maximum likelihood;
Factored MDP;
34.
An Extension of a Hierarchical Reinforcement Learning Algorithm for Multiagent Settings
机译:
用于多算法设置的分层加强学习算法的扩展
作者:
Ioannis Lambrou
;
Vassilis Vassiliades
;
Chris Christodoulou
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Hierarchical Reinforcement Learning;
Multiagent Reinforcement Learning;
Taxi Domain;
35.
MapReduce for Parallel Reinforcement Learning
机译:
MapReduce进行并行加强学习
作者:
Yuxi Li
;
Dale Schuurmans
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
36.
Active Learning of MDP Models
机译:
MDP模型的积极学习
作者:
Mauricio Araya-Lopez
;
Olivier Buffet
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
37.
Bayesian Multitask Inverse Reinforcement Learning
机译:
贝叶斯多任务逆钢筋学习
作者:
Christos Dimitrakakis
;
Constantin A. Rothkopf
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Bayesian inference;
Intrinsic motivations;
Inverse reinforcement learning;
Multitask learning;
Preference elicitation;
38.
Multi-Task Reinforcement Learning: Shaping and Feature Selection
机译:
多任务强化学习:塑造和特征选择
作者:
Matthijs Snel
;
Shimon Whiteson
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
39.
Unified Inter and Intra Options Learning Using Policy Gradient Methods
机译:
使用策略梯度方法统一间和内部选项学习
作者:
Kfir Y. Levy
;
Nahum Shimkin
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
40.
Transferring Evolved Reservoir Features in Reinforcement Learning Tasks
机译:
在加固学习任务中转移进化的水库功能
作者:
Kyriakos C. Chatzidimitriou
;
Ioannis Partalas
;
Pericles A. Mitkas
;
Ioannis Vlahavas
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
41.
Goal-Directed Online Learning of Predictive Models
机译:
目标导向预测模型的在线学习
作者:
Sylvie C. W. Ong
;
Yuri Grinberg
;
Joelle Pineau
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Predictive state representation;
Online learning;
Model-based reinforcement learning;
42.
Gradient Based Algorithms with Loss Functions and Kernels for Improved On-Policy Control
机译:
基于渐变基于损耗功能和内核的算法,用于改进的策略控制
作者:
Matthew Robards
;
Peter Sunehag
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
43.
Value Function Approximation through Sparse Bayesian Modeling
机译:
通过稀疏贝叶斯建模的价值函数近似
作者:
Nikolaos Tziortziotis
;
Konstantinos Blekas
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Value function approximation;
Sparse Bayesian modeling;
Relevance Vector Machine;
Incremental learning;
44.
Feature Reinforcement Learning in Practice
机译:
实践中的特色钢筋学习
作者:
Phuong Nguyen
;
Peter Sunehag
;
Marcus Hutter
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
45.
Regularized Least Squares Temporal Difference Learning with Nested l_2 and l_1 Penalization
机译:
使用嵌套L_2和L_1惩罚进行规则的最小二乘时间差异学习
作者:
Matthew W. Hoffman
;
Alessandro Lazaric
;
Mohammad Ghavamzadeh
;
Remi Munos
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
46.
Recursive Least-Squares Learning with Eligibility Traces
机译:
递归最小二乘与资格痕迹学习
作者:
Bruno Scherrer
;
Matthieu Geist
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
47.
Automatic Discovery of Ranking Formulas for Playing with Multi-armed Bandits
机译:
用多武装匪徒自动发现排名公式
作者:
Francis Maes
;
Louis Wehenkel
;
Damien Ernst
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
关键词:
Multi-armed Bandits;
Exploration vs. exploitation;
Automatic formula discovery;
48.
l_1-Penalized Projected Bellman Residual
机译:
L_1惩罚预计贝尔曼剩余
作者:
Matthieu Geist
;
Bruno Scherrer
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
49.
Automatic Construction of Temporally Extended Actions for MDPs Using Bisimulation Metrics
机译:
使用BISIMULATE指标自动构建MDP的时间延长动作
作者:
Pablo Samuel Castro
;
Doina Precup
会议名称:
《European Workshop on Reinforcement Learning》
|
2012年
意见反馈
回到顶部
回到首页