数理科学続論J
(Press ?
for help, n
and p
for next and previous slide)
村田 昇
2018.10.25
回帰係数 \(\beta_0,\beta_1,\dotsc,\beta_p\) を用いた一次式:
誤差項 を含む確率モデルで観測データを表現:
デザイン行列:
ベクトル:
確率モデル:
回帰式の評価: 残差平方和 の最小化による推定
解の条件: 正規方程式
解の一意性: Gram 行列 \(\boldsymbol{X}^\top\boldsymbol{X}\) が正則
残差 \(\boldsymbol{\hat{\epsilon}}=\boldsymbol{y}-\boldsymbol{\hat{y}}\) はあてはめ値 \(\boldsymbol{\hat{y}}\) と直交する
回帰式は説明変数と目的変数の 標本平均 を通る
決定係数 (R-squared):
自由度調整済み決定係数 (adjusted R-squared):
(不偏分散で補正)
定義:
あてはめ値や残差は \(H\) を用いて簡潔に表現される
推定量と誤差の関係
正規分布の重要な性質:
正規分布に従う独立な確率変数の和は正規分布に従う
推定量は以下の多変量正規分布に従う:
通常 \(\sigma^{2}\) は未知,必要な場合には不偏分散で代用
決定係数 (R-squared):
(回帰式で説明できるばらつきの比率)
自由度調整済み決定係数 (adjusted R-squared):
(決定係数を不偏分散で補正)
標準誤差 (standard error): \(\hat{\beta}_j\) の精度の評価指標
回帰係数の分布に関する定理:
\(t\) -統計量 は自由度 \(n{-}p{-}1\) の \(t\) 分布に従う:
\(p\) -値: 確率変数の絶対値が \(|t|\) を超える確率
ばらつきの比に関する定理:
\(\beta_1=\dotsb=\beta_p=0\) ならば,
\(F\) -統計量 は自由度 \(p,n{-}p{-}1\) の \(F\) 分布に従う
\(p\) -値: 確率変数の値が \(F\) を超える確率