297 モンテカルロ木探索

複数回のゲーム木の展開によるランダムシミュレーション(プレイアウト)をもとに近似的に良い打ち手を決定する手法。

モンテカルロ木探索(モンテカルロきたんさく、英: Monte Carlo tree search、略称MCTS)とは、モンテカルロ法を使った木の探索の事。決定過程に対する、ヒューリスティクス(=途中で不要な探索をやめ、ある程度の高確率で良い手を導ける)な探索アルゴリズムである。

モンテカルロ木検索は、主に囲碁・チェス・将棋などのゲームの次の着手の決定などに使用される。また、リアルタイムPCゲームや、大富豪、ポーカーなどの相手の手の内が全て分かるわけではないゲームへも使用される。

平均報酬の活用と見積もりのバランスを取りながら探索を行う方法である。 モンテカルロ木探索では、一般的にゲーム木は膨大な大きさになるため(囲碁や将棋などの場合)、木を深さごとに展開しながら探索を行う。 モンテカルロ木探索は以下の3つの操作を任意の回数繰り返すことで行われる。

  • Tree policy
  • Default policy
  • Backup