重回帰分析の際に頻出する問題の一つ。相関関係(正の相関・負の相関)が高い特徴量同士を特徴量に選んでしまうと予測の性能が下がることがある。
重回帰分析において、いくつかの説明変数間で線形関係(一次従属)が認められる場合、共線性があるといい、共線性が複数認められる場合は多重共線性があると言う。
【例】
“脚の速さ”を決める因子を見つけるために、多変量解析をするとしましょう。
先ほどご説明した通り、”身長”と”座高”はお互いに強く相関しますので、共線性の問題を認めます。
“身長”は”脚の速さ”を決める因子に含まれそうな気がしますが、”座高”は”脚の速さ”に直接は関連しない因子ですよね。ですが”身長”と相関する”座高”は”脚の速さ”と偽相関してしまいます。
「”脚の速さ”と”身長”も”座高”もどっちも関係しそうだぞ?でも”身長”と”座高”も無関係じゃなさそうだ。よく分からないからどちらも誤差を大きくして結果を出しておこう!」
要するに多重共線性の問題点は、”共線性を認める目的変数の標準誤差が異常に大きくなってしまうため、有意な関係が得られなくなってしまう”ことです。

