独立変数の和の性質

確率・統計 - 第6講

(Press ? for help, n and p for next and previous slide)

村田 昇

前回のおさらい

  • 条件付確率と独立性
    • 同時確率,周辺確率,条件付確率
    • 条件付確率分布,条件付確率密度,条件付平均値
    • 条件付確率とBeyesの定理
    • 確率変数と事象の独立性

特性関数

  • 定義

    特性関数 は指数関数を用いて変数変換された確率変数の平均として

    \begin{equation} \phi(s)=\mathbb{E}[e^{isX}] \end{equation}

    で定義される.

    • 特性関数は実数値ではなく複素数値をとることに注意する

特性関数の性質

  • 逆変換の存在

    特性関数と確率測度(確率密度)は一対一に対応している

    (Levy-Havilandの反転公式)

  • 分布の同一性

    2つの分布の特性関数が同じであれば, 2つの分布が同じであることが言える.

標準正規分布の特性関数

  • \(X\) を標準正規分布に従う確率変数とする

    \begin{align} \phi_{X}(s) &=\mathbb{E}[e^{isX}]\\ &=\int_{-\infty}^{\infty}e^{isx}\cdot \frac{1}{\sqrt{2\pi}}e^{-\frac{x^{2}}{2}}dx\\ &=e^{-\frac{s^{2}}{2}}\int_{-\infty}^{\infty} \frac{1}{\sqrt{2\pi}}e^{-\frac{(x-is)^{2}}{2}}dx\\ &=e^{-\frac{s^{2}}{2}} \end{align}

独立性の重要な性質

  • 平均値の乗法性

    確率変数 \(X_1,X_2,\dotsc,X_n\) が独立 \(\Rightarrow\)

    \begin{equation} \mathbb{E}[X_1X_2\dotsm X_n] =\mathbb{E}[X_1]\mathbb{E}[X_2]\dotsm\mathbb{E}[X_n] \end{equation}
  • 分散の加法性

    確率変数 \(X_1,X_2,\dotsc,X_n\) の任意の2変数が独立 \(\Rightarrow\)

    \begin{align} &\mathrm{Var}(X_1+X_2+\dotsb+X_n)\\ &=\mathrm{Var}(X_1)+\mathrm{Var}(X_2)+\dotsb+\mathrm{Var}(X_n) \end{align}

大数の法則

記号の準備

  • 確率変数列

    確率変数の列(可算無限でも良い)を

    \begin{equation} \{X_{n}\}=\{X_{1},X_{2},X_{3},\dotsc\} \end{equation}

    と書く. 一般に \(X_{n}\) はそれぞれ異なる分布 \(P^{X_{n}}\) に従っていて構わない.

  • 確率変数列の性質の記述

    確率変数 \(X_{n}\) の平均や分散などをまとめて表記するときは \(\{\mathbb{E}[X_{n}]\}\) や \(\{\mathrm{Var}(X_{n})\}\) のように書く. 例えば

    \begin{equation} \sup_{n} \mathrm{Var}(X_{n}) < \infty \end{equation}

    は “\(\{\mathrm{Var}(X_{n})\}\) が有界である” と書く.

大数の法則

  • 定理

    \(\{X_n\}\) を確率変数列として

    \begin{equation} S_n=\sum_{k=1}^n X_k \end{equation}

    とする. また, \(\{X_n\}\) は独立で, \(\{\mathrm{Var}(X_n)\}\) は有界とする. 任意の \(\varepsilon>0\) に対して, \(n(\varepsilon)\) を十分大きくとれば, すべての \(n>n(\varepsilon)\) に対して

    \begin{equation} P\left(\frac{|S_n-\mathbb{E}[S_n]|}{n}>\varepsilon\right) <\varepsilon \end{equation}

    とすることができる.

Čebyšëv の不等式

  • 定理

    任意の確率変数 \(X\) において任意の \(a>0\) に対して

    \begin{equation} P\left(|X(\omega)-\mathbb{E}[X]|>a\right) \le\frac{1}{a^2}\mathrm{Var}(X) \end{equation}

    が成り立つ.

  • 証明

    \begin{equation} A=\left\{\omega\big||X(\omega)-\mathbb{E}[X]|>a\right\} \end{equation}

    とする.分散の性質から

    \begin{align} \mathrm{Var}(X) &=\mathbb{E}[(X-\mathbb{E}[X])^2]\\ &=\mathbb{E}[(X-\mathbb{E}[X])^2, \Omega]\\ &=\mathbb{E}[(X-\mathbb{E}[X])^2, A+A^c]\\ &=\mathbb{E}[(X-\mathbb{E}[X])^2, A]+\mathbb{E}[(X-\mathbb{E}[X])^2, A^c]\\ &\ge \mathbb{E}[(X-\mathbb{E}[X])^2,A]\ge a^2 P(A) \end{align}

    であるので,題意が証明される.

大数の法則の略証

  • step 1

    まず \(a>0\) として Čebyšëv の不等式より

    \begin{equation} P\left(|S_n-\mathbb{E}[S_n]|>a\right) \le\frac{1}{a^2}\mathrm{Var}(S_n) \end{equation}

    が成り立つ.

  • step 2

    \(\{X_n\}\) の独立性より

    \begin{equation} \mathrm{Var}(S_n) =\sum_{k=1}^n\mathrm{Var}(X_k) \le n\cdot\max_{k}\mathrm{Var}(X_k) \end{equation}

    がいえる.

  • step 3

    \(a=n\varepsilon\) と置き換えることによって

    \begin{equation} P\left(\frac{|S_n-\mathbb{E}[S_n]|}{n}>\varepsilon\right) \le\frac{1}{n\varepsilon^2}\max_{k}\mathrm{Var}(X_k) \end{equation}

    が成り立つ.

  • step 4

    \(n\to\infty\) とすると右辺は \(\{\mathrm{Var}(X_n)\}\) の有界性より0になる. したがって任意の \(\varepsilon>0\) に対して

    \begin{equation} \lim_{n\to\infty} P\left(\frac{|S_n-\mathbb{E}[S_n]|}{n}>\varepsilon\right) \to 0 \end{equation}

    が成り立つ.

Kolmogorov の大数の強法則

  • 定理

    \(\{X_n\}\) を確率変数列として

    \begin{equation} S_n=\sum_{k=1}^n X_k \end{equation}

    とする. \(\{X_n\}\) が独立で, \(\{\mathrm{Var}(X_n)\}\) が有界ならば

    \begin{equation} \frac{S_n-\mathbb{E}[S_n]}{n}\to 0 \text{ a.s.} \end{equation}

    が成り立つ.

  • 大数の法則(弱法則)より強い意味での収束性を主張
    • 大数の弱法則 : 確率収束
    • 大数の強法則 : 概収束

同分布の場合の大数の強法則

  • 定理

    確率変数列 \(\{X_n\}\) が独立で同じ分布に従い, \(\{\mathbb{E}[|X_n|]\}\) が有界であるとする. \(\{X_n\}\) の平均値を \(\mu\) とすると,

    \begin{equation} \frac{S_n}{n}\to \mu\quad \text{a.s.} \end{equation}

    が成り立つ.

    • 絶対値の平均が有界という条件に緩められている
  • 定理の意味

    条件を満たすならば, \(n\) が十分大きくとれる(十分多くの観測を行うことができる)とき, 平均値 \(\mu\) の近似値として観測値の算術平均

    \begin{equation} \frac{S_n}{n}=\frac{\sum_{i=1}^nX_i}{n} \end{equation}

    を使って良い.

演習

練習問題

  • 確率変数 \(X\) は平均50,標準偏差10の分布に従うとする. このとき以下の確率を Čebyšëv の不等式を用いて評価せよ.
    • \(P(|X-50| > 10)\)
    • \(P(|X-50| > 20)\)
    • \(P(|X-50| > 30)\)

中心極限定理

Lindeberg の中心極限定理

  • 定理

    \(\{X_n\}\) は独立で,その分散が有界, \(S_n=\sum_{k=1}^n X_k\) とする. すべての \(\varepsilon>0\) に対し

    \begin{multline} \frac{1}{\mathrm{Var}(S_n)}\sum_{k=1}^n \mathbb{E}\left[(X_k-\mathbb{E}[X_k])^2, |X_k-\mathbb{E}[X_k]|\ge\varepsilon\sqrt{\mathrm{Var}(S_n)}\right]\\ \to 0 \; (n\to\infty) \end{multline}

    ならば, \(n\to\infty\) のとき

    \begin{equation} T_n=\frac{S_n-\mathbb{E}[S_n]}{\sqrt{\mathrm{Var}(S_n)}} \end{equation}

    の確率法則は 標準正規分布 \(N(0,1)\) に近づく.

同分布の場合の中心極限定理

  • 定理

    \(\{X_n\}\) が独立で,正の分散を持つ同じ分布に従うときには 中心極限定理が成り立つ.

    • “正の分散を持つ”とは定数ではないことを意味する
  • Lindeberg の条件の確認

    同分布の場合には

    \begin{multline} \frac{1}{\mathrm{Var}(X)} \mathbb{E}\left[(X-\mathbb{E}[X])^2, |X-\mathbb{E}[X]|\ge\varepsilon\sqrt{n\mathrm{Var}(X)}\right] \to 0\\ (n\to\infty) \end{multline}

    と書かれる. 左辺は, 平均値から \(\sqrt{n\mathrm{Var}(X)}\) 以上離れた標本点が得られるという 事象 \(|X-\mathbb{E}[X]|\ge\varepsilon\sqrt{n\mathrm{Var}(X)}\) の下での分散の評価を表すが, これは \(n\) が大きくなるとともに0に近づくので, Lindeberg の条件は満たされる.

  • \(T_n\) の書き換え

    \(\{X_n\}\) の 平均を \(\mathbb{E}[X]=\mu\) , 分散を \(\mathrm{Var}(X)=\sigma^{2}\) と書き, \(\{X_n\}\) の標本平均を

    \begin{equation} \bar{X}_{n}=\frac{1}{n}\sum_{i=1}^{n}X_{i}=\frac{S_{n}}{n} \end{equation}

    と定義すると

    \begin{equation} T_n=\frac{S_n-\mathbb{E}[S_n]}{\sqrt{\mathrm{Var}(S_n)}} =\frac{n\bar{X}_{n}-n\mathbb{E}[X]}{\sqrt{n\mathrm{Var}(X)}} =\frac{\sqrt{n}(\bar{X}_{n}-\mu)}{\sigma} \end{equation}

    である.

  • 定理の別表現

    \(\{X_n\}\) は独立で, 平均 \(\mu\) ,標準偏差 \(\sigma\) の同じ分布に従うとする. このとき,すべての実数 \(a < b\) に対して

    \begin{equation} P\Bigl(a\leq\frac{\sqrt{n}(\bar{X}_n-\mu)}{\sigma}\leq b \Bigr) \to\frac{1}{\sqrt{2\pi}}\int_a^be^{-\frac{x^2}{2}}dx\quad (n\to\infty) \end{equation}

    が成り立つ.

  • 定理の意味

    \(X_i\) の分布が何であっても, サンプル数 \(n\) が十分大きければ, 標本平均と真の平均の差 \(\bar{X}_n-\mu\) の分布は, 標準正規分布 を利用して

    \begin{equation} P\Bigl(a\frac{\sigma}{\sqrt{n}}\leq\bar{X}_n-\mu\leq b\frac{\sigma}{\sqrt{n}} \Bigr) \simeq \frac{1}{\sqrt{2\pi}}\int_a^be^{-\frac{x^2}{2}}dx \end{equation}

    で近似できる.

  • 評価の例

    \begin{align} \alpha&=1&&\frac{1}{\sqrt{2\pi}}\int_{-1}^{1}e^{-\frac{x^2}{2}}dx=0.6827\\ \alpha&=2&&\frac{1}{\sqrt{2\pi}}\int_{-2}^{2}e^{-\frac{x^2}{2}}dx=0.9545\\ \alpha&=3&&\frac{1}{\sqrt{2\pi}}\int_{-3}^{3}e^{-\frac{x^2}{2}}dx=0.9973 \end{align}
    • Čebyšëv の不等式による評価と比較してみよ

演習

練習問題

  • 以下の関数を \(x=0\) のまわりで Taylor 展開せよ.

    • \(\log(1+x)\)
    • \(\exp(x)\)

    関数 \(f(x)\) の点 \(x=a\) における Taylor 展開:

    \begin{multline} f(x)=f(a) +(x-a)\frac{f^{(1)}(a)}{1!} +(x-a)^2\frac{f^{(2)}(a)}{2!} +\dotsb\\ +(x-a)^{n-1}\frac{f^{(n-1)}(a)}{(n-1)!} +(x-a)^n\frac{f^{(n)}(\xi)}{n!} \end{multline}
    \begin{equation} \xi=a+\theta(x-a),\quad 0<\theta<1 \end{equation}

練習問題

  • 以下の極限を求めよ

    \begin{equation} \lim_{n\to\infty}\left(1+\frac{x}{n}\right)^n \end{equation}

定理の略証

証明の考え方

  • 以下では同分布の場合の定理を考える

    \(\{X_n\}\) は独立で, 平均 \(\mathbb{E}[X]=\mu\), 分散 \(\mathrm{Var}(X)=\sigma^{2}>0\) の同分布に従い, \(S_n=\sum_{k=1}^n X_k\) とする. \(n\to\infty\) のとき

    \begin{equation} T_n =\frac{S_n-\mathbb{E}[S_n]}{\sqrt{\mathrm{Var}(S_n)}} \end{equation}

    の確率法則は 標準正規分布 \(N(0,1)\) に近づく.

  • step 1

    確率変数 \(Y_{nk}\) を

    \begin{equation} Y_{nk} =\frac{X_k-\mathbb{E}[X]}{\sqrt{n\mathrm{Var}(X)}} =\frac{X_k-\mu}{\sqrt{n}\sigma} \end{equation}

    とおくと \(\mathrm{Var}(S_n)=n\mathrm{Var}(X)\) であることから \(T_n\) は

    \begin{equation} T_n=\sum_{k=1}^nY_{nk} \end{equation}

    と表される.

  • step 2

    このとき

    \begin{align} \mathbb{E}[Y_{nk}]&=0, \\ \mathrm{Var}(Y_{nk})&=\mathbb{E}[Y_{nk}^2] =\frac{1}{n}\frac{\mathrm{Var(X)}}{\sigma^{2}} =\frac{1}{n},\\ \mathbb{E}[T_n] &=0, \\ \mathrm{Var}(T_n)&=\sum_{k=1}^n\mathrm{Var}(Y_{nk}) =\sum_{k=1}^n\mathbb{E}[Y_{nk}^2] =1 \end{align}

    となる.

  • step 3

    \(\{Y_{nk},k=1,2,\dotsc,n\}\) は独立であるから, \(T_n\) の特性関数は独立変数の平均値の乗法性より

    \begin{equation} \mathbb{E}[e^{isT_n}]=\prod_{k=1}^{n}\mathbb{E}[e^{isY_{nk}}] \end{equation}

    と分解できる.

  • step 4

    \(Y_{nk}\) の特性関数に着目して 指数関数を適当な項までTaylor展開する.

    \begin{align} \mathbb{E}[e^{isY_{nk}}] &=\mathbb{E}\left[1+isY_{nk}-\frac{1}{2}s^2Y_{nk}^2 +\text{(\(Y_{nk}^3\)以上の項)}\right]\\ &=1+is\mathbb{E}[Y_{nk}]-\frac{1}{2}s^2\mathbb{E}[Y_{nk}^2] +\mathbb{E}[\text{(\(s^{3}Y_{nk}^3\)以上の項)}]\\ &=1-\frac{1}{2n}s^2 +\frac{r_{n}(s)}{n} \end{align}

    ただし \(r_{n}(s)\) は \(\lim_{n\to\infty}r_{n}(s)=0\) となることに注意.

  • step 5

    したがって

    \begin{equation} \mathbb{E}[e^{isT_n}] =\prod_{k=1}^{n}\left( 1-\frac{1}{2n}s^2 +\frac{r_{n}(s)}{n}\right) =\left( 1+\frac{-s^2/2}{n} +\frac{r_{n}(s)}{n}\right)^{n} \end{equation}

    であるから

    \begin{equation} \lim_{n\to\infty}\mathbb{E}[e^{isT_n}] =\lim_{n\to\infty}\left( 1+\frac{-s^2/2}{n} +\frac{r_{n}(s)}{n}\right)^{n} =e^{-\frac{s^2}{2}} \end{equation}

演習

練習問題

  • 偏りのないコインを投げたとき表なら1, 裏なら-1となる確率変数 \(X\) を考える. n回投げたときに得られた結果を \(X_1,X_2,\dotsc,X_n\) と書く.

    \begin{equation} Y_{n}=\frac{X_{1}+X_{2}+\dotsb+X_{n}}{\sqrt{n}} \end{equation}

    とするとき,以下の問に答えよ.

    • \(Y_{n}\) の平均と分散を求めよ.
    • \(Y_{n}\) の特性関数 \(\phi_n(s)\) を求めよ.
    • 特性関数 \(\phi_n(s)\) の極限 \(\lim_{n\to\infty}\phi_n(s)\) を求めよ.

今回のまとめ

  • 独立変数の和の性質
    • 大数の法則とその条件
    • 中心極限定理とその条件