首页> 外文会议>情報処理学会全国大会;情報処理学会 >完全情報ゲームにおける行動価値関数を用いた不完全情報ゲームの盤面推定
【24h】

完全情報ゲームにおける行動価値関数を用いた不完全情報ゲームの盤面推定

机译:在完整信息游戏中使用行为值函数的自动信息游戏场所估计

获取原文

摘要

近年、ゲームをプレイするプログラム(エー ジェント)を開発する試みが数多くなされてい る。その中で、囲碁や将棋などの完全情報ゲー ムにおいては、深層強化学習などの手法を用い てプロのプレイヤーを超える性能を持つエー ジェントも現れている。一方で、麻雀やポー カーなどの不完全情報ゲームにおいては非公開 の情報が存在するため、プレイの際にゲームの 状態を推測しなければならず、完全情報ゲーム に対する手法をそのまま応用することができな い。そのため、現在においても人間に勝利する レベルに達していないゲームが多く存在する。
机译:近年来,有许多尝试开发一个计划(代理人)来玩游戏。 其中,在诸如Go和Shogi的完整信息门中,还可以使用诸如深度加强学习等技术的技术具有比专业玩家更具性能的代理。 另一方面,在Mahjong和Poucer等信息游戏中,存在一个未披露的信息,因此它必须猜出游戏期间的游戏状态,并且可以将该方法应用于完整信息游戏不能。 因此,有许多没有达到现在人类的游戏。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号