以下の文章を読み、空欄(イ)に最もよく当てはまる選択肢を1つ選べ。
強化学習では、たとえば囲碁の碁盤のような(ア)が存在し、その(ア)の中でエージェントが(イ)を選択する。そ の(イ)が(ウ)を変化させ、その変化の良し悪しに対しては(エ)が与えられる。これを繰り返して(エ)の最大化を目指すことで、エージェントは自身の(オ)を獲得していく。
① 報酬
② 環境
③ 行動
④ 状態
⑤ 水準
⑥ 方策
G検定模擬問題(2) 問89
以下の文章を読み、空欄(イ)に最もよく当てはまる選択肢を1つ選べ。
強化学習では、たとえば囲碁の碁盤のような(ア)が存在し、その(ア)の中でエージェントが(イ)を選択する。そ の(イ)が(ウ)を変化させ、その変化の良し悪しに対しては(エ)が与えられる。これを繰り返して(エ)の最大化を目指すことで、エージェントは自身の(オ)を獲得していく。
① 報酬
② 環境
③ 行動
④ 状態
⑤ 水準
⑥ 方策