解答:
② モデルの性能が不当に高く評価される.
理由: テストデータはモデルの汎化性能(新しいデータに対する予測能力)を評価するために使用されます。もしテストデータの一部が訓練データに紛れ込んでいると、モデルは既に見たことがあるデータに対して評価されることになります。これにより、モデルの性能が過剰に高く評価され、実際の新しいデータに対する予測能力(汎化性能)が正確に反映されなくなります。
その他の選択肢について:
- ① 特に問題は生じない。:テストデータが訓練データに含まれることは、評価の信頼性に重大な問題を引き起こします。
- ③ 学習時間が増大する。:テストデータの紛れ込みは学習時間に直接影響を与えるわけではありません。
- ④ モデルの性能が不当に低く評価される。:実際には性能が不当に高く評価されることが問題となります。

