residual reinforcement learning:従来のロボット制御で用いられてきたような基本的な制御モジュールの出力と、実際にロボットがタスクを行う環境における最適な方策との差分を強化学習によって学習することを目指す手法。
既存の制御手法と最適な方策の差分を強化学習によって学ぶ手法で、サンプル効率や安全性が高い。2019年にGoogleとプリンストン大学が発表したTossingBot(ロボットアームが様々な物体を掴んで指定された箱に投げ入れる)で運動方程式ベースの制御モジュールの出力を調整する残差強化学習が使われた。

