検定模擬問題(3) 問136 解答

解答:

④ TF-IDF

理由: TF-IDF(Term Frequency-Inverse Document Frequency)は、文書内の単語の重要性を評価するための手法です。この手法では、単語の頻度(TF: Term Frequency)と逆文書頻度(IDF: Inverse Document Frequency)を組み合わせて重みを計算します。具体的には、単語の文書内での出現頻度(TF)と、その単語が存在する文書の割合の逆数の対数(IDF)の積で定義されます。

その他の選択肢について:

  • ① Doc2Vec:これは文書全体をベクトルに変換する手法です。
  • ② Word2Vec:これは単語をベクトルに変換する手法で、単語間の類似性を捉えるために使用されます。
  • ③ LDA:これはLatent Dirichlet Allocationの略で、トピックモデルの一つであり、文書をトピックに分けるための手法です。

問題