G検定模擬問題(4) 問77 解答

正しい選択肢は:
④2つのデータポイント間の距離を直線で測る距離尺度である.

解説:
ユークリッド距離(Euclidean Distance)は、幾何学的な直線距離を計算する最も一般的な距離尺度の1つです。
特徴:
・2つのデータポイント間の直線距離を計算します。
・計算式(2次元の場合):

・n-次元データでは、次のように一般化されます:

他の選択肢の説明:
① 変数間の相関を考慮して距離を計算する尺度である.
 ・誤りです。
 ユークリッド距離は、変数間の相関を考慮しません。相関を考慮した尺度にはマハラノビス距離が該当します。
② 異なる特徴間のスケーリングの影響を受けない尺度である.
 ・誤りです。
 ユークリッド距離は、スケーリング(値の範囲)の影響を受けます。異なるスケールの特徴を扱う場合は、事前に標準化や正規化が必要です。
③ データが正規分布に従う場合にのみ適用可能な尺度である.
 ・誤りです。
 ユークリッド距離はデータの分布に依存せず、正規分布に限らず使用可能です。

問題