データの特徴量間の関連性、すなわち相関を分析することでデータの構造をつかむ手法。
「主成分分析」とは、統計学上のデータ解析手法のひとつ。たくさんの量的な説明変数を、より少ない指標や合成変数(複数の変数が合体したもの)に要約する手法である。この要約は「次元の縮約」という表現で呼ばれることもあり、要約した合成変数のことを「主成分」と呼ぶ。
わかりやすく言えば、たくさんの次元(指標)のデータから、全体をわかりやすく見通しの良い1~3程度の次元に要約していくこと。たとえば、身長と体重という2次元から、BMI(ボディマス指数)という肥満度を表す1次元の指標に要約するのが主成分分析、と言えばイメージしやすいです。

