G検定模擬問題(4) 問123 解答

最も不適切な選択肢は:
③ Knowledge Distillation

解説:
深層強化学習(Deep Reinforcement Learning, DRL)は、強化学習(Reinforcement Learning, RL)にディープラーニングを組み合わせた手法で、 ロボティクスやゲームAI、最適化問題など多くの分野で応用されています。

各選択肢の評価:
① A3C(Asynchronous Advantage Actor-Critic)
・適切:
A3Cは、アクター・クリティック(Actor-Critic)手法の一種であり、複数のエージェントが非同期に環境と対話しながら学習を進める 並列化手法です。深層強化学習の代表的な手法の1つです。
② Rainbow
・適切:
Rainbowは、DQN(Deep Q-Network)の強化手法を統合したアルゴリズムで、優先順位付き経験再生や分布型Q学習など、複数の改良手法を 組み合わせた強力な手法です。
③ Knowledge Distillation(知識蒸留)
・不適切:
Knowledge Distillationは、モデル圧縮技術の一つであり、教師モデルから生徒モデルへ知識を転移させる手法です。通常、深層強化学習とは 関係がありません。これは主に、深層学習モデルの軽量化やパフォーマンス向上のために用いられる技術です。
④ DQN(Deep Q-Network)
・適切:
DQNは、深層強化学習の代表的な手法であり、Q学習にディープニューラルネットワークを導入して大規模な状態空間に対応できるようにした アルゴリズムです。

問題