数理科学続論J
(Press ?
for help, n
and p
for next and previous slide)
村田 昇
2019.11.15
最適化問題: 制約条件 \(\|\boldsymbol{a}\|=1\) の下で関数
を最大化せよ
中心化したデータ行列
評価関数 \(f(\boldsymbol{a})\) は行列 \(\boldsymbol{X}^\top\boldsymbol{X}\) の二次形式
\(f(\boldsymbol{a})\) の極大値を与える \(\boldsymbol{a}\) は \(\boldsymbol{X}^\top\boldsymbol{X}\) の固有ベクトル
回帰分析で考察した 寄与率 の一般形
主成分分析での定義 (proportion of variance)
行列 \(X^{\top}X\) (非負値正定対称行列) のスペクトル分解
(固有値と固有ベクトルによる行列の表現)
主成分のばらつきの評価
(固有ベクトル(単位ベクトル)の直交性を利用)
主成分と全体のばらつき
寄与率の固有値による表現:
累積寄与率 (cumulative proportion) : 第 \(k\) 主成分までのばらつきの累計
(第1から第 \(k\) までの寄与率の総和)
summary()
および plot()
mydata
: 必要な変数を含むデータフレーム## データフレームを分析 est <- prcomp( ~ x1の変数名 + ... + xpの変数名, data = mydata) ## 主成分方向や寄与率を確認 summary(est) ## 寄与率を図示 plot(est)
主成分と変数の相関係数:
第 \(k\) 主成分に対する第 \(l\) 変数の相関係数
第 \(k\) 主成分に対する相関係数ベクトル
階数 \(r\) の \(n\times p\) 型行列 \(X\) の分解:
\(\Sigma\) は \(n\times p\) 型行列
Gram行列の展開:
行列 \(\Sigma^{\top}\Sigma\) は対角行列
特異値の平方
Gram行列の固有値問題
データ行列の特異値分解: (注意 \(\Sigma\) は対角行列)
第 \(k\) 主成分と第 \(l\) 主成分を用いた行列 \(X\) の近似 \(X'\)
\(0\leq s\leq1\) として
biplot()
の使い方biplot()
mydata
: 必要な変数を含むデータフレーム## データフレームを分析 est <- prcomp( ~ x1の変数名 + ... + xpの変数名, data = mydata) ## 第1と第2主成分を利用した散布図 biplot(est) ## 第2と第3主成分を利用した散布図 biplot(est, choices = c(2,3)) ## パラメタ s を変更 (既定値は1) biplot(est, scale=0)
biplot()
の使い方