解答:
④ TF-IDF
理由: TF-IDF(Term Frequency-Inverse Document Frequency)は、文書内の単語の重要性を評価するための手法です。この手法では、単語の頻度(TF: Term Frequency)と逆文書頻度(IDF: Inverse Document Frequency)を組み合わせて重みを計算します。具体的には、単語の文書内での出現頻度(TF)と、その単語が存在する文書の割合の逆数の対数(IDF)の積で定義されます。
その他の選択肢について:
- ① Doc2Vec:これは文書全体をベクトルに変換する手法です。
- ② Word2Vec:これは単語をベクトルに変換する手法で、単語間の類似性を捉えるために使用されます。
- ③ LDA:これはLatent Dirichlet Allocationの略で、トピックモデルの一つであり、文書をトピックに分けるための手法です。

