主成分分析

基本的な考え方

(Press ? for help, n and p for next and previous slide)

村田 昇

講義の内容

  • 第1日 : 主成分分析の考え方
  • 第2日 : 分析の評価と視覚化

主成分分析の例

県毎の生活環境の違いの分析

県名 年少人口比 老年人口比 婚姻率 離婚率 高校数/面積 交通事故 犯罪件数 食料費 住居費 貯蓄率
北海道 11.7 26.0 4.86 2.12 1.34 274.2 8.98 22.5 5.9 19.4
青森県 12.1 27.0 4.33 1.78 2.63 386.7 6.12 24.6 5.4 16.2
岩手県 12.4 27.9 4.32 1.52 2.19 261.6 4.83 24.7 7.1 19.1
宮城県 13.0 22.9 5.30 1.70 3.18 447.7 8.85 23.7 5.0 9.5
秋田県 11.1 30.7 3.78 1.41 1.85 266.2 4.12 22.9 7.9 15.2
山形県 12.6 28.3 4.24 1.46 2.24 614.9 5.54 22.2 6.0 5.1
福島県 12.9 26.1 4.73 1.64 2.65 498.9 8.13 22.7 5.7 25.1
茨城県 13.2 23.8 4.92 1.79 3.09 500.6 13.00 21.9 6.8 20.0
栃木県 13.2 23.2 5.13 1.85 2.68 404.3 11.53 20.4 6.9 17.4
群馬県 13.4 24.9 4.64 1.77 3.56 925.2 10.49 23.9 4.4 1.6
埼玉県 13.0 22.0 5.10 1.86 7.81 493.6 13.91 23.0 7.0 21.6
千葉県 12.8 23.2 5.19 1.86 5.24 370.2 13.36 26.2 5.2 8.9
東京都 11.3 21.3 6.75 1.91 31.03 358.5 14.13 25.1 7.7 18.0
神奈川県 13.0 21.5 5.68 1.85 16.09 408.6 9.46 24.5 7.4 15.9
新潟県 12.5 27.2 4.35 1.37 2.35 357.2 8.71 23.5 5.7 13.0

ja-pairs1.png

Figure 1: 県別の生活環境(教育・労働などに関連する項目)

ja-pairs2.png

Figure 2: 県別の生活環境(教育・労働などに関連する項目)

ja-pairs3.png

Figure 3: 県別の生活環境(教育・労働などに関連する項目)

ja-biplot.png

Figure 4: 県別の生活環境の主成分分析

主成分分析の考え方

主成分分析

  • 多数の変量のもつ情報の分析・視覚化
    • 変量を効率的に縮約して少数の特徴量を構成する
    • 特徴量に関与する変量間の関係を明らかにする
  • PCA (Principal Component Analysis)
    • 構成する特徴量 : 主成分 (princial component)

分析の枠組み

  • \(x_{1},\dotsc,x_{p}\) : 変数
  • \(z_{1},\dotsc,z_{d}\) : 特徴量 ( \(d\leq p\) )
  • 変数と特徴量の関係 (線形結合)

    \begin{equation} z_k=a_{1k}x_{1}+\cdots+a_{pk}x_{p}\quad(k=1,\dotsc,d) \end{equation}
    • 特徴量は定数倍の任意性があるので以下を仮定

      \begin{equation} \|\boldsymbol{a}_k\|^2=\sum_{j=1}^pa_{jk}^2=1 \end{equation}

主成分分析の用語

  • 特徴量 \(z_k\)
    • 第 \(k\) 主成分得点 (principal component score)
    • 第 \(k\) 主成分
  • 係数ベクトル \(\boldsymbol{a}_k\)
    • 第 \(k\) 主成分負荷量 (principal component loading)
    • 第 \(k\) 主成分方向 (principal component direction)

分析の目的

  • 目的

    主成分得点 \(z_{1},\dots,z_{d}\) が変数 \(x_{1},\dotsc,x_{p}\) の情報を効率よく反映するように主成分負荷量 \(\boldsymbol{a}_{1},\dotsc,\boldsymbol{a}_{d}\) を観測データから決定する

  • 分析の方針 (以下は同値)
    • データの情報を最も保持する変量の 線形結合を構成
    • データの情報を最も反映する 座標軸を探索
  • 教師なし学習 の代表的手法の1つ
    • 特徴抽出 : 情報処理に重要な特性を変数に凝集
    • 次元縮約 : 入力をできるだけ少ない変数で表現

第1主成分の計算

記号の準備

  • 変数 : \(x_{1},\dotsc,x_{p}\) (\(p\)次元)
  • 観測データ : \(n\) 個の \((x_{1},\dotsc,x_{p})\) の組

    \begin{equation} \{(x_{i1},\dots,x_{ip})\}_{i=1}^n \end{equation}
  • ベクトル表現
    • \(\boldsymbol{x}_{i}=(x_{i1},\dots,x_{ip})^{\mathsf{T}}\) : \(i\) 番目の観測データ (\(p\) 次元空間内の1点)
    • \(\boldsymbol{a}=(a_{1},\dots,a_{p})^{\mathsf{T}}\) : 長さ1の \(p\) 次元ベクトル

係数ベクトルによる射影

  • データ \(\boldsymbol{x}_{i}\) の \(\boldsymbol{a}\) 方向成分の長さ

    \begin{equation} \boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_{i} \quad\text{(スカラー)} \end{equation}
  • 方向ベクトル \(\boldsymbol{a}\) をもつ直線上への点 \(\boldsymbol{x}_{i}\) の直交射影

    \begin{equation} (\boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_{i})\,\boldsymbol{a} \quad\text{(スカラー \(\times\) ベクトル)} \end{equation}

幾何学的描像

pca-figure.png

Figure 5: 観測データの直交射影 (\(p=2,n=2\) の場合)

ベクトル \(\boldsymbol{a}\) の選択の指針

  • 射影による特徴量の構成

    ベクトル \(\boldsymbol{a}\) を うまく 選んで 観測データ \(\boldsymbol{x}_{1},\cdots,\boldsymbol{x}_{n}\) の情報を最も保持する1変量データ \(z_{1},\cdots,z_{n}\)を構成

    \begin{equation} z_{1}=\boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_{1}, z_{2}=\boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_2, \dotsc, z_{n}=\boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_n \end{equation}
  • 特徴量のばらつきの最大化

    観測データの ばらつき を最も反映するベクトル \(\boldsymbol{a}\) を選択

    \begin{equation} \arg\max_{\boldsymbol{a}} \sum_{i=1}^n(\boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_{i} -\boldsymbol{a}^{\mathsf{T}}\bar{\boldsymbol{x}})^2, \quad \bar{\boldsymbol{x}} = \frac{1}{n}\sum_{i=1}^n\boldsymbol{x}_{i}, \end{equation}

ベクトル \(\boldsymbol{a}\) の最適化

  • 最適化問題

    制約条件 \(\|\boldsymbol{a}\|=1\) の下で 以下の関数を最大化せよ

    \begin{equation} f(\boldsymbol{a}) = \sum_{i=1}^n(\boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_{i} -\boldsymbol{a}^{\mathsf{T}}\bar{\boldsymbol{x}})^2 \end{equation}
  • この最大化問題は必ず解をもつ
    • \(f(\boldsymbol{a})\) は連続関数
    • 集合 \(\{\boldsymbol{a}\in\mathbb{R}^p:\|\boldsymbol{a}\|=1\}\) はコンパクト(有界閉集合)

演習

問題

  • 以下の問に答えなさい
    • 評価関数 \(f(\boldsymbol{a})\) を以下の中心化したデータ行列で表しなさい

      \begin{equation} X = \begin{pmatrix} \boldsymbol{x}_{1}^{\mathsf{T}}-\bar{\boldsymbol{x}}^{\mathsf{T}} \\ \vdots \\ \boldsymbol{x}_{n}^{\mathsf{T}}-\bar{\boldsymbol{x}}^{\mathsf{T}} \end{pmatrix} = \begin{pmatrix} x_{11}-\bar{x}_{1} & \cdots & x_{1p}-\bar{x}_{p}\\ \vdots & & \vdots \\ x_{n1}-\bar{x}_{1} & \cdots & x_{np}-\bar{x}_{p} \end{pmatrix} \end{equation}
    • 上の結果を用いて次の最適化問題の解の条件を求めなさい

      \begin{equation} \text{maximize}\quad f(\boldsymbol{a}) \quad\text{s.t.}\quad \boldsymbol{a}^{\mathsf{T}}\boldsymbol{a}=1 \end{equation}

解答例

  • 定義どおりに計算する

    \begin{align} f(\boldsymbol{a}) &= \sum_{i=1}^n(\boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_{i} -\boldsymbol{a}^{\mathsf{T}}\bar{\boldsymbol{x}})^2\\ &= \sum_{i=1}^n (\boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_{i} -\boldsymbol{a}^{\mathsf{T}}\bar{\boldsymbol{x}}) (\boldsymbol{x}_{i}^{\mathsf{T}}\boldsymbol{a} -\bar{\boldsymbol{x}}\boldsymbol{a}^{\mathsf{T}})\\ &= \boldsymbol{a}^{\mathsf{T}}X^{\mathsf{T}}X\boldsymbol{a} \end{align}
    • 回帰分析の Gram 行列を参照
  • 制約付き最適化なので未定係数法を用いればよい

    \begin{equation} L(\boldsymbol{a},\lambda) =f(\boldsymbol{a})+\lambda(1-\boldsymbol{a}^{\mathsf{T}}\boldsymbol{a}) \end{equation}

    の鞍点

    \begin{equation} \frac{\partial}{\partial\boldsymbol{a}}L(\boldsymbol{a},\lambda) =0 \end{equation}

    を求めればよいので

    \begin{align} 2X^{\mathsf{T}}X\boldsymbol{a}-2\lambda\boldsymbol{a} &=0\\ X^{\mathsf{T}}X\boldsymbol{a} &=\lambda\boldsymbol{a} \quad\text{(固有値問題)} \end{align}

第1主成分の解

ベクトル \(\boldsymbol{a}\) の解

  • 最適化問題

    \begin{equation} \text{maximize}\quad f(\boldsymbol{a}) = \boldsymbol{a}^{\mathsf{T}}X^{\mathsf{T}}X\boldsymbol{a} \quad\text{s.t.}\quad \boldsymbol{a}^{\mathsf{T}}\boldsymbol{a}=1 \end{equation}
  • 固有値問題

    \(f(\boldsymbol{a})\) の極大値を与える \(\boldsymbol{a}\) は \(X^{\mathsf{T}}X\) の固有ベクトルとなる

    \begin{equation} X^{\mathsf{T}}X\boldsymbol{a} = \lambda\boldsymbol{a} \end{equation}

第1主成分

  • 固有ベクトル\(\boldsymbol{a}\)に対する\(f(\boldsymbol{a})\) は行列 \(X^{\mathsf{T}}X\) の固有値

    \begin{equation} f(\boldsymbol{a}) =\boldsymbol{a}^{\mathsf{T}}X^{\mathsf{T}}X\boldsymbol{a} =\boldsymbol{a}^{\mathsf{T}}\lambda\boldsymbol{a} =\lambda \end{equation}
  • 求める \(\boldsymbol{a}\) は行列 \(X^{\mathsf{T}}X\) の最大固有ベクトル (長さ1)
  • 第1主成分負荷量 : 最大(第一)固有ベクトル \(\boldsymbol{a}\)
  • 第1主成分得点

    \begin{equation} z_{i1} =a_{1}x_{i1}+\cdots+a_{p}x_{ip} =\boldsymbol{a}^{\mathsf{T}}\boldsymbol{x}_{i}, \quad(i=1,\dots,n) \end{equation}

Gram 行列の性質

Gram 行列の固有値

  • \(X^{\mathsf{T}}X\) は非負定値対称行列
  • \(X^{\mathsf{T}}X\) の固有値は0以上の実数
    • 固有値を重複を許して降順に並べる

      \begin{equation} \lambda_{1}\geq\dotsb\geq\lambda_{p}\quad(\geq0) \end{equation}
    • 固有値 \(\lambda_{k}\) に対する固有ベクトルを \(\boldsymbol{a}_{k}\)(長さ1)とする

      \begin{equation} \|\boldsymbol{a}_{k}\|=1, \quad (k=1,\dotsc,p) \end{equation}

Gram 行列のスペクトル分解

  • \(\boldsymbol{a}_{1},\dotsc,\boldsymbol{a}_{p}\) は 互いに直交 するようとることができる

    \begin{equation} j\neq k \quad\Rightarrow\quad \boldsymbol{a}_{j}^{\mathsf{T}}\boldsymbol{a}_k=0 \end{equation}
  • 行列 \(X^{\mathsf{T}}X\) (非負定値対称行列) のスペクトル分解

    \begin{align} X^{\mathsf{T}}X &=\lambda_{1}\boldsymbol{a}_{1}\boldsymbol{a}_{1}^{\mathsf{T}}+ \lambda_{2}\boldsymbol{a}_{2}\boldsymbol{a}_{2}^{\mathsf{T}}+ \dotsb+\lambda_{p}\boldsymbol{a}_{p}\boldsymbol{a}_{p}^{\mathsf{T}}\\ &=\sum_{k=1}^{p}\lambda_{k}\boldsymbol{a}_{k}\boldsymbol{a}_{k}^{\mathsf{T}} \end{align}
    • 固有値と固有ベクトルによる行列の表現

演習

問題

  • 以下の問に答えなさい
    • Gram 行列のスペクトル分解において \(\lambda_{j}\) と \(\boldsymbol{a}_{j}\) が固有値・固有ベクトルとなることを確かめなさい

      \begin{equation} X^{\mathsf{T}}X =\sum_{k=1}^{p}\lambda_{k}\boldsymbol{a}_{k}\boldsymbol{a}_{k}^{\mathsf{T}} \end{equation}
    • 以下の行列を用いて Gram 行列のスペクトル分解を書き直しなさい

      \begin{equation} A = \begin{pmatrix} \boldsymbol{a}_{1}^{\mathsf{T}}\\ \vdots \\ \boldsymbol{a}_{p}^{\mathsf{T}} \end{pmatrix}, \quad \Lambda = \begin{pmatrix} \lambda_{1} & 0 & \dotsm & 0\\ 0 & \lambda_{2} & \dotsm & 0\\ 0 & 0 & \ddots & 0\\ 0 & 0 & \dotsm & \lambda_{p}\\ \end{pmatrix} \end{equation}

解答例

  • 固有ベクトルの直交性に注意する

    \begin{align} X^{\mathsf{T}}X\boldsymbol{a}_{j} &=\sum_{k=1}^{p}\lambda_{k}\boldsymbol{a}_{k}\boldsymbol{a}_{k}^{\mathsf{T}}\boldsymbol{a}_{j} &&\text{(直交性)}\\ &=\lambda_{j}\boldsymbol{a}_{j}\boldsymbol{a}_{j}^{\mathsf{T}}\boldsymbol{a}_{j} &&\text{(単位ベクトル)}\\ &=\lambda_{j}\boldsymbol{a}_{j} \end{align}
  • 転置に注意して計算する

    \begin{equation} X^{\mathsf{T}}X = A^{\mathsf{T}}\Lambda A \end{equation}

第2主成分以降の計算

第2主成分の考え方

  • 第1主成分
    • 主成分負荷量 : ベクトル \(\boldsymbol{a}_{1}\)
    • 主成分得点 : \(\boldsymbol{a}_{1}^{\mathsf{T}}\boldsymbol{x}_{i}\) (\(i=1,\dotsc,n\))
  • 第1主成分負荷量に関してデータが有する情報

    \begin{equation} (\boldsymbol{a}_{1}^{\mathsf{T}}\boldsymbol{x}_{i})\,\boldsymbol{a}_{1} \quad(i=1,\dotsc,n) \end{equation}
  • 第1主成分を取り除いた観測データ (分析対象)

    \begin{equation} \tilde{\boldsymbol{x}}_{i} = \boldsymbol{x}_{i} -(\boldsymbol{a}_{1}^{\mathsf{T}}\boldsymbol{x}_{i})\,\boldsymbol{a}_{1} \quad(i=1,\dotsc,n) \end{equation}

第2主成分の最適化

  • 最適化問題

    制約条件 \(\|\boldsymbol{a}\|=1\) の下で 以下の関数を最大化せよ

    \begin{equation} \tilde{f}(\boldsymbol{a}) = \sum_{i=1}^n(\boldsymbol{a}^{\mathsf{T}}\tilde{\boldsymbol{x}}_{i} -\boldsymbol{a}^{\mathsf{T}}\bar{\tilde{\boldsymbol{x}}})^2 \quad\text{ただし}\quad \bar{\tilde{\boldsymbol{x}}} = \frac{1}{n}\sum_{i=1}^n\tilde{\boldsymbol{x}}_{i} \end{equation}

演習

問題

  • 以下の問に答えなさい
    • 以下の中心化したデータ行列を \(X\) と \(\boldsymbol{a}_{1}\) で表しなさい

      \begin{equation} \tilde{X} = \begin{pmatrix} \tilde{\boldsymbol{x}}_{1}^{\mathsf{T}}-\bar{\tilde{\boldsymbol{x}}}^{\mathsf{T}} \\ \vdots \\ \tilde{\boldsymbol{x}}_{n}^{\mathsf{T}}-\bar{\tilde{\boldsymbol{x}}}^{\mathsf{T}} \end{pmatrix} \end{equation}
    • 上の結果を用いて 次の最適化問題の解を求めなさい

      \begin{equation} \text{maximize}\quad \tilde{f}(\boldsymbol{a}) \quad\text{s.t.}\quad \boldsymbol{a}^{\mathsf{T}}\boldsymbol{a}=1 \end{equation}

解答例

  • 定義どおりに計算する

    \begin{equation} \tilde{X} = \begin{pmatrix} \tilde{\boldsymbol{x}}_{1}^{\mathsf{T}}-\bar{\tilde{\boldsymbol{x}}}^{\mathsf{T}} \\ \vdots \\ \tilde{\boldsymbol{x}}_{n}^{\mathsf{T}}-\bar{\tilde{\boldsymbol{x}}}^{\mathsf{T}} \end{pmatrix} = X-X\boldsymbol{a}_{1}\boldsymbol{a}_{1}^{\mathsf{T}} \end{equation}
  • Gram 行列 \(\tilde{X}^{\mathsf{T}}\tilde{X}\) を計算する

    \begin{align} \tilde{X}^{\mathsf{T}}\tilde{X} &= (X-X\boldsymbol{a}_{1}\boldsymbol{a}_{1}^{\mathsf{T}})^{\mathsf{T}} (X-X\boldsymbol{a}_{1}\boldsymbol{a}_{1}^{\mathsf{T}})\\ &= X^{\mathsf{T}}X -X^{\mathsf{T}}X\boldsymbol{a}_{1}\boldsymbol{a}_{1}^{\mathsf{T}} -\boldsymbol{a}_{1}\boldsymbol{a}_{1}^{\mathsf{T}}X^{\mathsf{T}}X +\boldsymbol{a}_{1}\boldsymbol{a}_{1}^{\mathsf{T}}X^{\mathsf{T}}X\boldsymbol{a}_{1}\boldsymbol{a}_{1}^{\mathsf{T}}\\ &= X^{\mathsf{T}}X-\lambda_{1}\boldsymbol{a}_{1}\boldsymbol{a}_{1}^{\mathsf{T}}\\ &= \sum_{k=2}^{p}\lambda_{k}\boldsymbol{a}_{k}\boldsymbol{a}_{k}^{\mathsf{T}} \end{align}

    元の Gram 行列 \(X^{\mathsf{T}}X\) の固有ベクトル \(\boldsymbol{a}_{1}\) の固有値が0となっていると考えることができる

第2主成分以降の解

第2主成分

  • Gram 行列 \(\tilde{X}^{\mathsf{T}}\tilde{X}\) の固有ベクトル \(\boldsymbol{a}_{1}\) の固有値は 0

    \begin{equation} \tilde{X}^{\mathsf{T}}\tilde{X}\boldsymbol{a}_{1} = 0 \end{equation}
  • Gram 行列 \(\tilde{X}^{\mathsf{T}}\tilde{X}\) の最大固有値は \(\lambda_2\)
  • 解は第2固有値 \(\lambda_2\) に対応する固有ベクトル \(\boldsymbol{a}_2\)

  • 以下同様に 第 \(k\) 主成分負荷量は \(X^{\mathsf{T}}X\) の第 \(k\) 固有値 \(\lambda_k\) に対応する固有ベクトル \(\boldsymbol{a}_k\)

解析の事例

データセットについて

社会生活統計指標の分析

  • データ(の一部)の内容

    Pref Forest Agri Ratio Land Goods Area
    Hokkaido 67.9 1150.6 4.23 96.8 283.3 Hokkaido
    Aomori 63.8 444.7 1.03 186.0 183.0 Tohoku
    Iwate 74.9 334.3 1.01 155.2 179.4 Tohoku
    Miyagi 55.9 299.9 1.84 125.3 365.9 Tohoku
    Akita 70.5 268.7 0.81 98.5 153.3 Tohoku
    Yamagata 68.7 396.3 0.88 174.1 157.5 Tohoku
    Fukushima 67.9 236.4 1.51 127.1 184.5 Tohoku
    Ibaraki 31.0 479.0 2.30 249.1 204.9 Kanto
    Tochigi 53.2 402.6 1.55 199.6 204.3 Kanto
    Gumma 63.8 530.6 1.55 321.6 270.0 Kanto
    Saitama 31.9 324.7 5.72 247.0 244.7 Kanto
    Chiba 30.4 565.5 4.90 326.1 219.7 Kanto
    Tokyo 34.8 268.5 10.63 404.7 1062.6 Kanto
    Kanagawa 38.8 322.8 7.18 396.4 246.1 Kanto
    Niigata 63.5 308.6 1.81 141.9 205.5 Chubu
  • データの散布図

js_pairs.png

Figure 6: 散布図

  • データの箱ひげ図

js_boxplot.png

Figure 7: 箱ひげ図

  • 標準化したデータ(の一部)

    Pref Forest Agri Ratio Land Goods Area
    Hokkaido 0.425 4.630 0.9790 -1.400 0.421 Hokkaido
    Aomori 0.151 0.489 -0.5120 -0.446 -0.274 Tohoku
    Iwate 0.892 -0.159 -0.5210 -0.776 -0.299 Tohoku
    Miyagi -0.376 -0.361 -0.1340 -1.100 0.993 Tohoku
    Akita 0.599 -0.544 -0.6140 -1.380 -0.480 Tohoku
    Yamagata 0.479 0.205 -0.5810 -0.574 -0.451 Tohoku
    Fukushima 0.425 -0.734 -0.2880 -1.080 -0.264 Tohoku
    Ibaraki -2.040 0.691 0.0801 0.229 -0.123 Kanto
    Tochigi -0.556 0.242 -0.2690 -0.301 -0.127 Kanto
    Gumma 0.151 0.994 -0.2690 1.010 0.329 Kanto
    Saitama -1.980 -0.215 1.6700 0.207 0.153 Kanto
    Chiba -2.080 1.200 1.2900 1.050 -0.020 Kanto
    Tokyo -1.780 -0.546 3.9600 1.900 5.820 Kanto
    Kanagawa -1.520 -0.227 2.3500 1.810 0.163 Kanto
    Niigata 0.131 -0.310 -0.1480 -0.918 -0.118 Chubu
  • 標準化したデータの箱ひげ図

js_scaled_boxplot.png

Figure 8: 箱ひげ図 (データを標準化)

  • 主成分負荷量を計算 (標準化後)

    PC1 PC2 PC3 PC4 PC5
    Forest −0.4871 0.1046 −0.4575 0.6860 −0.2682
    Agri 0.1339 0.8115 0.4791 0.3045 0.0348
    Ratio 0.5851 −0.1511 0.0447 0.1641 −0.7784
    Land 0.3548 0.4851 −0.7417 −0.2897 0.0689
    Goods 0.5258 −0.2689 −0.0952 0.5708 0.5624
  • 主成分方向から読み取れること
    • 第1 : 人の多さに関する成分(正の向きほど人が多い)
    • 第2 : 農業生産力に関する成分(正の向きほど高い)
  • 主成分得点の表示

js_pcaplot.png

Figure 9: 主成分得点による散布図

  • データの標準化を行わない場合

    PC1 PC2 PC3 PC4 PC5
    Forest −0.0142 0.0482 −0.0004 −0.9975 −0.0495
    Agri 0.9729 0.1208 −0.1971 −0.0080 0.0004
    Ratio 0.0022 −0.0116 0.0000 0.0489 −0.9987
    Land 0.2217 −0.2467 0.9433 −0.0155 0.0026
    Goods 0.0647 −0.9602 −0.2672 −0.0476 0.0090
    • ばらつきの大きな変数に第1主成分は重みが偏る

次回の予定

  • 第1日 : 主成分分析の考え方
  • 第2日 : 分析の評価と視覚化