検定模擬問題(3) 問147 解答

解答:

① ベクトル間の類似度を求めるものであり,-1〜1の値を取る.

理由: コサイン類似度は、2つのベクトル間の類似度を測るための指標であり、その値は-1から1の範囲を取ります。具体的には、2つのベクトルの内積をそれぞれのベクトルの大きさ(ノルム)の積で割った値として計算されます。コサイン類似度が1に近いほど、2つのベクトルは類似しており、0に近いほど類似していないとされます。-1になる場合は、2つのベクトルが完全に反対方向を向いていることを意味します。

その他の選択肢について:

  • ② ベクトル内の単語の発生頻度から分散を求める手法である。:これはコサイン類似度の説明ではなく、ベクトルの分散や他の統計量に関する説明です。
  • ③ 二つのベクトルに同じ単語が含まれていても,位置が異なると類似していないと見做される。:コサイン類似度はベクトルの方向を重視するため、位置の違いは考慮しません。同じ単語が含まれていれば、その寄与は同じです。
  • ④ 距離と同じ概念であり,0に近いほど類似性が高い。:コサイン類似度は距離ではなく、角度の類似性を表す指標です。0に近いほど類似性が高いのはユークリッド距離などの概念であり、コサイン類似度では1に近いほど類似性が高いとされます。

問題