G検定模擬問題（3）　問38

2024.06.192024.06.22

Rainbowは,7種類の手法をのせた深層強化学習アルゴリズムである.Rainbowに使われている手法として,最も不適切な選択肢を1つ選べ.

① ノイジーネットワーク
② 内発的報酬(intrinsic reward)
③ デュエリングネットワーク
④ ダブルDQN