正しい選択肢は:
④2つのデータポイント間の距離を直線で測る距離尺度である.
解説:
ユークリッド距離(Euclidean Distance)は、幾何学的な直線距離を計算する最も一般的な距離尺度の1つです。
特徴:
・2つのデータポイント間の直線距離を計算します。
・計算式(2次元の場合):

・n-次元データでは、次のように一般化されます:

他の選択肢の説明:
① 変数間の相関を考慮して距離を計算する尺度である.
・誤りです。
ユークリッド距離は、変数間の相関を考慮しません。相関を考慮した尺度にはマハラノビス距離が該当します。
② 異なる特徴間のスケーリングの影響を受けない尺度である.
・誤りです。
ユークリッド距離は、スケーリング(値の範囲)の影響を受けます。異なるスケールの特徴を扱う場合は、事前に標準化や正規化が必要です。
③ データが正規分布に従う場合にのみ適用可能な尺度である.
・誤りです。
ユークリッド距離はデータの分布に依存せず、正規分布に限らず使用可能です。

