G検定模擬問題(4) 問110 解答

最も適切な選択肢は:
① 多項式回帰を使用する.

解説:
問題のポイント:
・説明変数(特徴量)と目的変数(ターゲット)の間に非線形な関係が存在するとわかっています。
・線形回帰モデルは、説明変数と目的変数が線形関係にある場合に適していますが、非線形な関係を表現するには適していません。 ・非線形な関係をモデル化する方法として、多項式回帰が有効です。

各選択肢の評価:
① 多項式回帰を使用する.
・正しい:
多項式回帰は、説明変数に多項式の形を導入することで、非線形な関係をモデル化する手法です。たとえば、以下のように拡張します:

非線形なデータのフィッティングに適しています。
② 標準化を行う.
・誤り:
標準化(データを平均0、標準偏差1に変換)は、モデルの学習効率や収束性を改善しますが、非線形な関係を直接モデル化する方法ではありません。
③ データのスケーリングを行う.
・誤り:
スケーリング(データを一定の範囲に変換)は、モデルの学習効率を向上させる補助的な処理ですが、非線形な関係を表現する手法ではありません。
④ 線形回帰を使用する.
・誤り:
線形回帰は、説明変数と目的変数が線形関係にある場合に適しています。非線形な関係をモデル化するには不十分です。

問題