G検定模擬問題(4) 問34

オフライン強化学習に関する説明として,最も適切な選択肢を1つ選べ.

①エージェントは,環境と直接相互作用することなく,既存のデータから学習する.
②エージェントは,既存のデ―タを用いつつも、新たな相互作用を通じて方策を更新する.
③エージェントは,リアルタイ厶のフィードバックに基づいて学習を進める.
④エージェントは,環境との新しい相互作用を通じて学習を進める.

解答