検定模擬問題(3) 問94 解答

解答:

② モデルの性能が不当に高く評価される.

理由: テストデータはモデルの汎化性能(新しいデータに対する予測能力)を評価するために使用されます。もしテストデータの一部が訓練データに紛れ込んでいると、モデルは既に見たことがあるデータに対して評価されることになります。これにより、モデルの性能が過剰に高く評価され、実際の新しいデータに対する予測能力(汎化性能)が正確に反映されなくなります。

その他の選択肢について:

  • ① 特に問題は生じない。:テストデータが訓練データに含まれることは、評価の信頼性に重大な問題を引き起こします。
  • ③ 学習時間が増大する。:テストデータの紛れ込みは学習時間に直接影響を与えるわけではありません。
  • ④ モデルの性能が不当に低く評価される。:実際には性能が不当に高く評価されることが問題となります。

問題