...
机译:在线决策的统计推理:在一个上下文的强盗设置中
North Carolina State Univ Dept Stat Raleigh NC 27695 USA;
North Carolina State Univ Dept Stat Raleigh NC 27695 USA;
North Carolina State Univ Dept Stat Raleigh NC 27695 USA;
Epsilon-greedy; Inverse propensity weighted estimator; Model misspecification; Online decision making; Statistical inference;
机译:多臂上下文强盗的变分推理
机译:大数据环境中统计推断的在线更新
机译:通过随机梯度下降的在线决策统计推断
机译:损坏的上下文匪徒:与上下文损坏的在线学习
机译:在线设置中的主动学习和推理的顺序决策
机译:大数据环境中统计推断的在线更新
机译:大数据环境下统计推断的在线更新