Rainbowは,7種類の手法をのせた深層強化学習アルゴリズムである.Rainbowに使われている手法として,最も不適切な選択肢を1つ選べ.
① ノイジーネットワーク
② 内発的報酬(intrinsic reward)
③ デュエリングネットワーク
④ ダブルDQN
Rainbowは,7種類の手法をのせた深層強化学習アルゴリズムである.Rainbowに使われている手法として,最も不適切な選択肢を1つ選べ.
① ノイジーネットワーク
② 内発的報酬(intrinsic reward)
③ デュエリングネットワーク
④ ダブルDQN