G検定模擬問題（１） 問１０

以下の文章を読み、空欄（ア）に最もよく当てはまる選択肢を一つ選べ。
（ア）は、Google DeepMindが開発した（イ）やATARI社のビデオゲームをプレイするAIなどに利用されている技術であり、現在の状態から次の行動を決める方策、（ウ）を予測する価値関数をニューラルネットで表現して（エ）を学習する手法である。（ア）を実空間で応用する試みも始まっているが、多くが実証実験や研究開発段階にとどまっている。

①深層強化学習
②シグモイド学習
③ロバスト手法
④エンコード

解答