G検定模擬問題(4) 問142 解答

最も適切な選択肢は:
② データ拡張を行う。

解説:
データ拡張(Data Augmentation)とは:
・データが不足している状況では、データ拡張を行うことで、既存のデータをさまざまな変換を適用し、データのバリエーションを増やすことができます。
・データ拡張により、モデルがより多様な入力に対して汎化性能を向上させることができ、過学習を防ぐ効果も期待できます。
代表的なデータ拡張手法:
1.画像処理系の手法:
・反転(フリップ)、回転(Rotate)、クロップ(Crop)
・拡大縮小(Zoom)、明るさ調整(Brightness)、ノイズ追加
2.カラー変換:
・色相・彩度・明度(HSV変換)、ガウシアンブラー適用
3.空間変換:
・アフィン変換、視点変換(Perspective)
これらの手法により、データ不足を補い、モデルの学習精度を向上させることができます。

各選択肢の評価:
① ドロップアウトを適用する。
・誤り:
ドロップアウトは過学習を防ぐための手法であり、データ不足そのものを解決するものではありません。
② データ拡張を行う。
・正しい:
現在のデータが不足している場合、最も実用的な手法です。新たにデータを収集できない場合でも、既存データを拡張して多様なトレーニングデータを 生成できます。
③ ラベルを再確認する。
・誤り:
ラベルの確認はデータ品質の向上には寄与しますが、新しいデータを生成するわけではなく、データ不足の解決策にはなりません。
④ モデルの層を増やす。
・誤り:
データが少ない状態で層を増やすと、逆に過学習のリスクが高まり、性能が悪化する可能性があります。

問題