以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を一つ選べ。
(ア)は、Google DeepMindが開発した(イ)やATARI社のビデオゲームをプレイするAIなどに利用されている技術であり、現在の状態から次の行動を決める方策、(ウ)を予測する価値関数をニューラルネットで表現して(エ)を学習する手法である。(ア)を実空間で応用する試みも始まっているが、多くが実証実験や研究開発段階にとどまっている。
①深層強化学習
②シグモイド学習
③ロバスト手法
④エンコード
以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を一つ選べ。
(ア)は、Google DeepMindが開発した(イ)やATARI社のビデオゲームをプレイするAIなどに利用されている技術であり、現在の状態から次の行動を決める方策、(ウ)を予測する価値関数をニューラルネットで表現して(エ)を学習する手法である。(ア)を実空間で応用する試みも始まっているが、多くが実証実験や研究開発段階にとどまっている。
①深層強化学習
②シグモイド学習
③ロバスト手法
④エンコード