...
机译:在强化学习期间和之后,学生的反应如何跟踪基于价值的决策
Decision makingLearningCognitionHuman learningPermutationEye movementsAttentionDopamine;
机译:N2pc和与反馈相关的负性可追踪基于价值的逆向学习过程中注意力的变化
机译:基于强化学习和双深度Q学习的混合动力电动履带车能源管理
机译:通过具有较少学习参数的强化学习算法对MIMO离散时间系统进行自适应容错跟踪控制
机译:以在线决策跟踪:学习通过强化学习的流媒体视频的政策
机译:基于价值的决策中的个体差异:学习和时间偏好。
机译:纠正:强化学习期间和之后学生的反应如何跟踪基于价值的决策
机译:瞳孔反应作为基于价值的决策指标
机译:预测强化学习将告诉你什么:多阶段博弈中的人类决策模型。