数理科学続論J
(Press ?
for help, n
and p
for next and previous slide)
村田 昇
2019.11.29
\(X=\boldsymbol{x}\) の下で \(Y=k\) となる 条件付確率 を計算
観測データ: \(n\) 個のデータ \((Y,X_1,\dots,X_q)\)
から \(p_k(\boldsymbol{x})\) を構成
事象 \(X=\boldsymbol{x}\) が起きたという条件の下で 事象 \(Y=k\) が起きる条件付確率
\(Y=k\) の下での \(X\) の条件付き確率質量関数
のモデル化を通じて \(p_k(\boldsymbol{x})\) をモデル化する
ベイズの公式
定義より
求める条件付確率:
分母の展開:
ベイズの公式の書き換え:
(事前確率が特徴量の確率の重みで変更される)
事前に特別な情報がない場合:
データから自然に決まる確率
判別関数: \(\delta_k(\boldsymbol{x})\) (\(k=1,\dots,K\))
事後確率の順序を保存する計算しやすい関数
\(f_k(\boldsymbol{x})\) の仮定:
線形判別関数: \(\boldsymbol{x}\) の1次式
事後確率と判別関数の関係
平均の推定 (クラスごとに行う)
分散の推定 (まとめて行う)
lda()
MASS::lda()
mydata
: 必要な変数を含むデータフレーム
書式は lm()
とほぼ同じ
## データフレームを分析 require(MASS) # または library(MASS) est <- lda(yの変数名 ~ x1の変数名 + ... + xpの変数名, data = mydata) ## 各クラスの判別関数値を図示 plot(est)
\(f_k(\boldsymbol{x})\) の仮定:
2次判別関数: \(\boldsymbol{x}\) の2次式
事後確率と判別関数の関係
平均の推定 (クラスごとに行う)
分散の推定 (クラスごとに行う)
qda()
MASS::qda()
mydata
: 必要な変数を含むデータフレーム
書式は lda()
と同じ
## データフレームを分析 require(MASS) est <- qda(yの変数名 ~ x1の変数名 + ... + xpの変数名, data = mydata)
3種類の変動の関係
Fisherの基準:
\(K=2\) の場合:
(線形判別と一致する)