数理科学続論J
(Press ?
for help, n
and p
for next and previous slide)
村田 昇
2019.11.01
回帰係数 \(\beta_0,\beta_1,\dotsc,\beta_p\) を用いた一次式:
誤差項 を含む確率モデルで観測データを表現:
確率モデル:
式の評価: 残差平方和 の最小による推定
解の条件: 正規方程式
解の一意性: Gram 行列 \(\boldsymbol{X}^\top\boldsymbol{X}\) が正則
決定係数 (R-squared):
自由度調整済み決定係数 (adjusted R-squared):
\(t\) -統計量: 各係数ごと,\(\xi\) は \((X^\top X)^{-1}\) の対角成分
\(F\) -統計量: 決定係数(または残差)を用いて計算
新しいデータ (説明変数) \(\boldsymbol{x}\) に対する予測値
予測値は元データの目的変数の重み付け線形和
重みは元データと新規データの説明変数で決定
推定量は以下の性質をもつ多変量正規分布
この性質を利用して以下の3つの値の違いを評価
(\(\hat{y}\) と \(y\) は独立な正規分布に従うことに注意)
差の分布は以下の平均・分散の正規分布
正規化による表現
未知の分散を不偏分散で推定
確率 \(\alpha\) の信頼区間 (最適な予測値 \(\tilde{y}\) が入ることが期待される区間)
ただし \(C_{\alpha}\) は以下を満たす定数
差の分布は以下の平均・分散の正規分布
正規化による表現
未知の分散を不偏分散で推定
確率 \(\alpha\) の予測区間 (観測値 \(y\) が入ることが期待される区間)
ただし \(C_{\alpha}\) は以下を満たす定数
I()
を用いる## 目的変数 Y, 説明変数 X1,X2,X3 ## 交互作用を含む式 (formula) の書き方 Y ~ X1 + X1:X2 # X1 + X1*X2 Y ~ X1 * X2 # X1 + X2 + X1*X2 Y ~ (X1 + X2 + X3)^2 # X1 + X2 + X3 + X1*X2 + X2*X3 + X3*X1 ## 非線形変換を含む式 (formula) の書き方 Y ~ f(X1) # f(X1) Y ~ X1 + I(X1^2) # X1 + X1^2
factor()
を利用する## データフレーム mydat1, mydat2, mydat3 ## 変数名 X, Y, Z mydat2 <- transform(mydat1, Y=as.factor(X)) mydat3 <- transform(mydat1, Z=as.factor(X > 0))
モデルの再構築のための視覚化
などが用意されている