Data Communication Division Defence Technology Institute Pakkret Nonthaburi Thailand;
Roads; Junctions; Computational modeling; Markov processes; Law enforcement; Decision support systems; Reinforcement learning;
机译:不知情的深度加强学习链接预测预测模型,实现刑事网络
机译:使用深度强化学习技术的犯罪网络中的隐藏链接预测
机译:基于基于路径的路径跟踪跟踪后面的自动装配移动机器人
机译:犯罪逃生路径预测的加强学习
机译:通过多目标进行动态代理最短路径规划的协同分布式智能多功能智能多功能多智能智能多功能
机译:主观和模型估计奖励预测:与反馈相关的消极性(FRN)关联并在加固学习任务中奖励预测误差
机译:基于逃避的植物植入行为,采用多档强化学习
机译:实时强化学习的复杂性分析应用于确定性域中寻找最短路径