首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >オンライン適応自然勾配法による囲碁の盤面評価の学習
【24h】

オンライン適応自然勾配法による囲碁の盤面評価の学習

机译:オンライン適応自然勾配法による囲碁の盤面評価の学習

获取原文
获取原文并翻译 | 示例
       

摘要

囲碁は、黒石と白石の2種類の石のみを使うシンプルなルールをもつゲームであるが、19×19の広い盤面を用いるため先読みなどの探索が難しく、エキスパートの棋力に迫るコンピュータ囲碁エージェントが出現していないのが現状である。コンピュータ囲碁エージェントの作成には盤面評価を行う必要があるが、本研究ではエキスパート同士が対戦した棋譜を用いた囲碁の盤面評価関数の教師あり学習を提案する。この教師あり学習では、階層型ニューラルネットワークを用い、入力を対戦棋譜中のある一つの盤面、出力をその対戦の勝敗を表す二億(0, 1)として学習を行うことで、入力として与えられた盤面における期待勝率(盤面評価)を出力することが期待される。囲碁の盤面のような高次元入力データをもつデータを過学習せずに学習させるのは困難であるが、囲碁の特性を利用したパラメータ削減を行うことでパラメータ空間の自由度を制限した。また、大量のデータを高速に学習させるためにフィッシャー情報行列をブロック対角行列で近似し、その逆行列を逐次的に計算可能なオンライン適応自然勾配法を用いた。

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号