G検定模擬問題(4) 問122

以下の文章を読み,空欄(A )( B)に最もよく当てはまる選択肢を1つ選べ.

Transformer において、Multi-Head Attentionと呼ばれる機構が取り入れられている.これは並列して複数の Attention 機構を配置し,出力された計算結果を(A )する操作を行う仕組みである.それぞれのAttention機構が(B ),質の高い出力 を得ることができる.

① (A)連結
  (B)異なる重みを学習することにより
② (A)合算
  (B )重みを共有することにより,計算量を消滅しながら
③(A)合算
  (B)異なる重みを学習することにより
④ (A)連結
  (B )重みを共有することにより.計算量を削減しながら

解答