条件付確率と独立性

確率・統計 - 第5講

(Press ? for help, n and p for next and previous slide)

村田 昇

前回のおさらい

  • 確率変数
    • 確率空間上の関数としての確率変数
    • 確率変数の確率空間
    • 複数の確率変数の同時確率(結合確率)
    • 確率変数の平均,分散,モーメント
    • 確率変数の特性関数

特性関数

  • 定義

    特性関数 は指数関数を用いて変数変換された確率変数の平均として

    \begin{equation} \phi(s)=\mathbb{E}[e^{isX}] \end{equation}

    で定義される.

    • 特性関数は実数値ではなく複素数値をとることに注意

特性関数の性質

  • 逆変換の存在

    特性関数と確率測度(確率密度)は一対一に対応している

    (Levy-Havilandの反転公式)

  • 分布の同一性

    2つの分布の特性関数が同じであれば, 2つの分布が同じであることが言える.

演習

練習問題

  • 以下の確率測度の特性関数を求めよ.
    1. 標準正規分布
    2. 平均 \(\mu\) 分散 \(\sigma^{2}\) の正規分布

条件付確率

条件付確率

  • 定義

    確率空間 \((\Omega,\mathcal{F},P)\) において 2つの事象 \(A,B\subset\Omega\) を考える. 事象 \(A\) のもとにおける事象 \(B\) の 条件付確率 (conditional probability) を

    \begin{equation} P(B|A)=P_A(B)=\frac{P(A\cap B)}{P(A)} \end{equation}

    で定義する.

同時確率と条件付確率

  • 同時確率 \(P(A\cap B)\)

    “事象 \(A\) と事象 \(B\) が同時に起きている” 確率

  • 条件付確率 \(P(B|A)\)

    “事象 \(A\) が起きたときに事象 \(B\) が起きている” 確率

条件付確率に関する注意

  • 事象 \(A\) は空でない \(A\not=\emptyset\) とする
  • \(P(A)=0\) のときは \(P(B|A)\) は意味がないが, 適当に一点 \(\omega_0\in A\) を選び

    \begin{equation} P(B|A)= \begin{cases} 1,& \omega_0\in B\\ 0,& \omega_0\not\in B \end{cases} \end{equation}

    とすることがある

条件付確率の例

  • 骰子を一回振る試行

    以下の事象を定義する.

    \begin{align} A&=\{\text{偶数の目が出る}\}\\ B&=\{\text{素数の目が出る}\} \end{align}

    このとき以下の確率は条件付確率で表される.

    • “偶数の目が出たとき,それが素数である” 確率
    • “偶数の目が出たとき,それが素数でない” 確率
  • “偶数の目が出たとき,それが素数である” 確率

    \begin{align} P(B|A) &=\frac{P(A\cap B)}{P(A)}\\ &=\frac{P(\text{偶数かつ素数の目が出る})}{P(\text{偶数の目が出る})}\\ &=\frac{P\{2\}}{P(\{2,4,6\})} =\frac{1/6}{1/2}=\frac{1}{3} \end{align}
  • “偶数の目が出たとき,それが素数でない” 確率

    \begin{align} P(B^c|A) &=\frac{P(A\cap B^{c})}{P(A)}\\ &=\frac{P(\text{偶数かつ素数でない目が出る})}{P(\text{偶数の目が出る})}\\ &=\frac{2/6}{1/2}=\frac{2}{3} =1-P(B|A) \end{align}

確率変数による条件の表現

  • 確率変数が一つの値を取る場合

    \begin{align} A&=\{\omega|X(\omega)=x\} \Leftrightarrow A=X^{-1}(x)\; (x\in\Omega^X) \\ B&=\{\omega|Y(\omega)=y\} \Leftrightarrow B=Y^{-1}(y)\; (y\in\Omega^Y) \end{align}

    のようにある事象に対応づけられるので,

    \begin{equation} P(Y\!=\!y|X\!=\!x)\quad\text{または}\quad P_{X=x}(Y\!=\!y) \end{equation}

    という条件付確率を考えることができる.

  • 確率変数がある集合に含まれる場合

    同様に

    \begin{align} A&=\{\omega|X(\omega)\in E\} \Leftrightarrow A=X^{-1}(E)\; (E\subset\Omega^X) \\ B&=\{\omega|Y(\omega)\in F\} \Leftrightarrow B=Y^{-1}(F)\; (F\subset\Omega^Y) \end{align}

    と事象と対応づけられるので,

    \begin{equation} P(Y\!\in F|X\!\in E)\quad\text{または}\quad P_{X\in E}(Y\in F) \end{equation}

    のように表した条件付確率を考えることができる.

  • 同時確率の表現

    単に変数を並べて

    \begin{align} P(X\!=\!x,Y\!=\!y) &=P(\{\omega|X(\omega)=x\}\cap\{\omega|Y(\omega)=y\})\\ P(X\!\in E,Y\!\in F) &=P(\{\omega|X(\omega)\in E\}\cap\{\omega|Y(\omega)\in F\}) \end{align}

    と表すことが多い.

  • 確率法則(確率分布)の表現

    確率変数 \(X\),\(Y\) のいろいろな値に対する 同時確率や条件付確率をまとめて表現する場合

    \begin{equation} P(X,Y),\quad P(Y|X) \end{equation}

    といった記述を行うことが多い.

条件付確率の性質

  • 定理

    条件付確率には次の性質がある.

    1. \(\Big.P(A\cap B)=P(A)P(B|A)\)
    2. \(\Big.P(A|A)=1\)
    3. \(\Big.P(A_1\cap A_2\cap\dotsb\cap A_n) =P(A_1)P(A_2|A_1)\dotsm P(A_n|A_1\cap A_2\cap\dotsb\cap A_{n-1})\)
    4. \(\Big.P(A\cap B)=P(A)P(B|A)=P(B)P(A|B)\)
    • 証明は定義から明らか

条件付確率分布

  • 定義

    定理の2. より \(P(\cdot|A)\) は \(A\) を標本空間とする確率法則になっている. これを \(A\) のもとにおける 条件付確率分布 (conditional probability distribution) という.

条件付平均値

  • 定義

    条件付確率分布のもとでの平均値

    \begin{align} \mathbb{E}[Y|A] &=\sum_{\omega\in A}Y(\omega)P(\omega|A) \quad\text{(離散分布の場合)}\\ \mathbb{E}[Y|A] &=\int_{A}Y(\omega)P(d\omega|A) \quad\text{(連続分布の場合)} \end{align}

    条件付平均値 (conditional expectation) と呼ぶ.

Bayesの定理

Bayesの定理 (基本形)

  • 定理

    条件付確率では次の等式が成り立つ.

    \begin{equation} P(A|B) =\frac{P(A)P(B|A)}{P(B)}. \end{equation}
    • 前出の定理の4.より導かれる
    • 左辺と右辺で事象 \(A,B\) の役割が異なる

Bayesの定理 (一般形)

  • 定理

    \(\Omega=A_1+A_2+\dotsb+A_n\) のとき

    \begin{equation} P(A_i|B) =\frac{P(A_i)P(B|A_i)}{\sum_{k=1}^nP(A_k)P(B|A_k)} \end{equation}

    が成り立つ.

演習

練習問題

  • Bayes の定理(一般形)を証明せよ.

独立性

確率変数の独立性

  • 定義 (有限試行の場合)

    二つの確率変数 \(X,Y\) が互いに 独立 (independent) であるとは, 任意の \(x,y\) に対して

    \begin{equation} P(X\!=\!x,Y\!=\!y)=P(X\!=\!x)P(Y\!=\!y) \end{equation}

    となることである.

  • 条件付確率による意味付け

    条件付確率を用いて同時確率を書き直すと

    \begin{equation} P(X\!=\!x,Y\!=\!y)=P(X\!=\!x)P(Y\!=\!y|X\!=\!x) \end{equation}

    であるが, 独立性の定義から

    \begin{equation} P(Y\!=\!y|X\!=\!x)=P(Y\!=\!y) \end{equation}

    となり,\(Y\) の確率は \(X\) に左右されないことを示す.

  • 定義 (無限試行の場合)

    任意の事象(集合) \(E\subset\Omega^X\),\(F\subset\Omega^Y\) に対して

    \begin{equation} P(X\!\in E,Y\!\in F)=P(X\!\in E)P(Y\!\in F) \end{equation}

    が成り立つことである.

  • 定義 (確率密度を持つ場合)

    \(X,Y\) の同時確率分布の密度関数 (同時確率密度; joint probability density) を \(f(x,y)\) ,\(X,Y\) のそれぞれの確率分布の密度関数 (周辺確率密度; marginal probability density) を \(g(x),h(y)\) とすると, 確率変数 \(X,Y\) が互いに独立とは 任意の \(x,y\) に対して

    \begin{equation} f(x,y)=g(x)h(y) \end{equation}

    となることである.

  • 特性関数による表現 (Kacの定理)

    確率変数 \(X,Y\) が互いに独立とは, 特性関数を用いて

    \begin{equation} \mathbb{E}[e^{isX+itY}]=\mathbb{E}[e^{isX}]\mathbb{E}[e^{itY}] \end{equation}

    が成り立つことと同値である.

独立性の性質

  • 定理

    独立性に関しては以下の性質が成り立つ.

    • 確率変数 \(X,Y\) が独立 \(\Leftrightarrow\) \(\Big.P(Y|X)=P(Y)\ \text{a.s.}\)
      (周辺分布 \(P(Y)\) と 条件付分布 \(P(Y|X)\) が確率1で等しい)
    • 確率変数\(X_1,X_2,\dotsc,X_n\) が独立 \(\Rightarrow\) 変数変換した確率変数

      \begin{equation} Y_1=\phi_1(X_1),Y_2=\phi_2(X_2),\dotsc,Y_n=\phi_n(X_n) \end{equation}

      は独立 (逆が成り立つとは限らないことに注意)

  • (定理のつづき)

    • 確率変数 \(X_1,X_2,\dotsc,X_n\) が独立 \(\Rightarrow\)

      \begin{equation} \mathbb{E}[X_1X_2\dotsm X_n] =\mathbb{E}[X_1]\mathbb{E}[X_2]\dotsm\mathbb{E}[X_n] \end{equation}

      (平均値の乗法性)

    • 確率変数 \(X_1,X_2,\dotsc,X_n\) の任意の2変数が独立 \(\Rightarrow\)

      \begin{equation} \mathrm{Var}(X_1+X_2+\dotsb+X_n) =\mathrm{Var}(X_1)+\mathrm{Var}(X_2)+\dotsb+\mathrm{Var}(X_n) \end{equation}

      (分散の加法性)

    • 平均値の加法性は独立とは無関係に成り立つ
    • 平均値の乗法性は独立性の定義から明らか
    • 分散の加法性は展開して平均値の乗法性を用いれば明らか

事象の独立性

  • 指示関数

    集合 \(A\) の 指示関数 (定義関数)

    \begin{equation} 1_A(\omega)= \begin{cases} 1,& \omega\in A\\ 0,& \omega\not\in A \end{cases} \end{equation}

    で定義する.

    • 指示関数は実数値関数
    • \(Y=1_A(\omega)\) 確率変数
      (標本点 \(\omega\) が事象 \(A\) に含まれたかどうかを表す)
  • 定義

    事象 \(A_1,A_2,\dotsc,A_n\) の それぞれの指示関数で定義される確率変数 \(Y_1,Y_2,\dotsc,Y_n\) が互いに独立である場合, 事象 \(A_1,A_2,\dotsc,A_n\) は独立であるという.

    • 確率変数の独立性の定義に帰着することに注意

事象の独立性の同値条件

  • 定理

    以下の3つは同値である.

    1. 事象 \(A_1,A_2,\dotsc,A_n\) が独立
    2. \(B_i=A_i\) または \(B_i=A_i^c\) としたとき

      \begin{equation} P(B_1\cap B_2\cap\dotsb\cap B_n) =P(B_1)P(B_2)\dotsm P(B_n) \end{equation}
    3. \(\forall k=2,3,\dotsc,n\), \(1\leq\forall i_1<\forall i_2<\dotsb\forall i_k\leq n\)

      \begin{equation} P(A_{i_1}\cap A_{i_2}\cap\dotsb\cap A_{i_k}) =P(A_{i_1})P(A_{i_2})\dotsm P(A_{i_k}) \end{equation}

演習

練習問題

  • 以下の問に答えよ.

    高田馬場のラーメン屋Aの売上は, 前の週の口コミサイトBとCにおける評価に強く影響される. 詳しく調べた結果以下のことが判った.

    • 売上,および評価は上がるか下がるかの二通りしかない
    • B,C共に評価が上がったときに売上が上がる確率は \(0.9\) である
    • B,Cの一方のみ評価が上がったときに売上が上がる確率は \(0.6\) である
    • B,C共に評価が下がったときに売上が下がる確率は \(0.8\) である
    • Bの評価が上がる確率は \(0.5\) である
    • Cの評価が上がる確率は \(0.6\) である
    • Bの評価が上がるとき \(X=1\), 下がるとき \(X=0\), Cの評価が上がるとき \(Y=1\), 下がるとき \(Y=0\) となる 確率変数 \(X,Y\) を考えると,\(X,Y\) の共分散は \(0.1\) である
  • このとき以下の確率を求めよ.
    • B,C共に評価が上がる確率はいくつか?
    • Aの売上が下がったとき, B,C共に評価が下がった確率はいくつか?
    • Aの売上が上がったとき, B,Cの一方のみ評価が上がった確率はいくつか?

今回のまとめ

  • 条件付確率と独立性
    • 同時確率,周辺確率,条件付確率
    • 条件付確率分布,条件付確率密度,条件付平均値
    • 条件付確率とBeyesの定理
    • 確率変数と事象の独立性