Math. Sci. Dept., IBM T. J. Watson Res. Center, Yorktown Heights, NY, USA;
机译:通过强化学习通知顺序临床决策:一项实证研究
机译:具有顺序动作选择的n-Person通用和多主体强化学习的探索策略
机译:根据经验评估强化学习在诱导有效和适应性教学策略中的应用
机译:顺序定向市场营销中各种强化学习策略的经验比较
机译:通过经验博弈论分析和强化学习,可以制定更强的出价策略。
机译:通过加强学习通知顺序临床决策:实证研究
机译:连续目标营销的各种强化学习策略的实证比较