153 k-分割交差検証

訓練データとテストデータの分割を複数回行い、それぞれで学習・評価を行うアプローチ。

k分割交差検証とは、全てのデータがテストデータとして利用されるよう、学習データとテストデータをk個に分割して性能評価する方法です。具体的に下記のような手順で実行されます。

  1. データセットをランダムにk個分割する
  2. k-1個を学習データ、1個をテストデータとして割り振る
  3. 割り振った学習データでモデルを構築し、テストデータで予測性能を推定する
  4. 1~3の手順をk回繰り返す
  5. それぞれのモデルから得られた予測性能をもとに平均性能を計算する