G検定模擬問題(4) 問59  解答

最も不適切な選択肢は:
④ 少ない特徴量を増やすために、特徴量同士の積や和などを取る手法である.

解説:
 次元削減や次元圧縮は、データの次元数を減らしつつ、そのデータが持つ重要な情報を保持することを目的とした手法です。この目的は、学習の効率化やデータの 可視化、過学習の防止などにあります。

各選択肢の解説:
① t‐SNEは、高次元データの可視化を目的とした次元圧縮手法として適している.
 ・正しい説明です。t-SNE(t-Distributed Stochastic Neighbor Embedding)は、特に高次元データを2次元または3次元に縮約し、データ構造を可視化するために 利用される手法です。
② 主成分分析(PCA)は、データの特徴量の関係性を分析することでデータ構造を掴む手法である.
 ・正しい説明です。PCA(Principal Component Analysis)は、データの分散を最大化するように特徴量を線形変換し、重要な情報を保持しつつ次元を削減する手法です。
③ 特徴量は次元が多くなりがちだが、次元削減をすることで学習にかかる時間を減らすことができる.
 ・正しい説明です。次元削減によりデータサイズが小さくなり、計算コストや学習時間が削減されます。
④ 少ない特徴量を増やすために、特徴量同士の積や和などを取る手法である.
 ・これは次元削減ではなく、むしろ特徴量生成(Feature Engineering)に関連する説明です。次元削減は、既存の特徴量を減らすことで情報を圧縮する目的があります。

問題