G検定模擬問題(4) 問138 解答

最も適切な選択肢は:
④ 次元の呪い(Curse of Dimensionality)

解説:
次元の呪い(Curse of Dimensionality)とは:
・特徴量の数(次元数)が増加することで、データの疎(スパース)な状態が生じ、モデルの学習に必要なデータ量が指数関数的に増加する現象を指します。
・高次元空間では、データがまばらに分布するため、分類や回帰タスクに必要なサンプル数が急増し、モデルの過学習や計算コストの増加を招きます。
・次元の増加により、距離計算が困難になったり、類似性の評価が不安定になることがあります。
影響:
・モデルの訓練に必要なデータ数が膨大になる。
・計算コストが増加し、処理速度が低下する。
・特徴量の重要度が薄まり、モデルの精度が低下する可能性がある。
対策:
・主成分分析(PCA)やt-SNEなどを用いた次元削減。
・不要な特徴量の削除。
・特徴選択アルゴリズムの活用。

各選択肢の評価:
① イライザ効果(ELIZA Effect)
・誤り:
イライザ効果は、人間がコンピュータやAIとの対話に対して、実際以上の知能を持っていると誤認する心理的現象であり、次元の呪いとは無関係です。
② 勾配爆発問題(Gradient Explosion Problem)
・誤り:
勾配爆発は、深層ニューラルネットワークにおいて、学習が進むにつれて勾配が急激に大きくなり、最適化が困難になる問題であり、特徴量の増加とは 関係ありません。
③ 勾配消失問題(Gradient Vanishing Problem)
・誤り:
勾配消失問題は、深層ニューラルネットワークにおいて、勾配が小さくなりすぎて学習が進まなくなる現象です。次元数の増加とは直接関係がありません。 ④ 次元の呪い(Curse of Dimensionality)
・正しい:
特徴量の増加に伴い、必要な訓練データ量が指数関数的に増加する現象を説明する正しい用語です。

問題