308 sim2real

シミュレータで学習した方策を現実世界に転移して利用する設定。

シミュレータで学習した方策を現実世界に適用する手法は低いコストで大量のデータを生成できるのが利点。実世界では様々な変動性があるのでドメインランダマイゼーション(domain randomization)は複数のシミュレータから得た光源、テクスチャ、向きなどの情報をランダムに追加してネットワークが物体の本質を抽出できるように訓練する手法でOpenAIのルービックキューブを解く片手ロボットでも使われた。