208 データリーケージ

リーケージとは、本来得られるはずのないデータをモデルの学習時に使用してしまうことを言う。リーケージが発生することを「リークする」とも言う。
「予測精度の高いモデルは、意図せず使えないモデルを作成している可能性がある」
時系列情報を利用してデータを適切に分割することで、リーケージが発生しないようにである。