305 連続値制御

ロボットが行動として関節角や台車の速度といった連続値を扱うためには適切な離散化が必要で、このような連続値の行動を直接出力する制御。

行動制御では(ゲームでの離散的な行動選択とは違って)行動表現が連続値(ロボットアームの間接角など)になっている。