はじめに
機械学習で登場する確率分布について色々な角度から理解したいシリーズです。
ポアソン分布の統計量を特性関数から導出します。
【前の内容】
www.anarchive-beta.com
【他の記事一覧】
www.anarchive-beta.com
【この記事の内容】
ポアソン分布の統計量の導出
特性関数利用して、ポアソン分布(Poisson Distribution)の平均(期待値)と分散を導出します。ポアソン分布については「ポアソン分布の定義式 - からっぽのしょこ」を参照してください。
ポアソン分布の特性関数は、次の式になります。詳しくは「ポアソン分布の特性関数の導出 - からっぽのしょこ」を参照してください。
$$
\varphi(t)
= e^{\lambda(e^{it}-1)}
= \exp \Bigl(
\lambda (\exp(i t) - 1)
\Bigr)
$$
ここで、$\lambda$はポアソン分布のパラメータで発生回数の期待値、$e$はネイピア数、$i$は虚数単位です。指数分布が分かりやすいように、$e^x = \exp(x)$でも表します。
ポアソン分布の平均と分散は、どちらもパラメータ$\lambda$になります。
$$
\begin{aligned}
\mathbb{E}[x]
&= \lambda
\\
\mathbb{V}[x]
&= \lambda
\end{aligned}
$$
関数の微分を用いて、平均と分散の計算式を導出します。
特性関数の1階微分の計算
特性関数を$t$に関して微分します。
$$
\frac{d \varphi(t)}{d t}
= \frac{d}{d t} \Bigl\{
e^{\lambda(e^{it}-1)}
\Bigr\}
$$
式全体を$g(f(x))$、指数部分を$f(x)$として、合成関数の微分$\frac{d g(f(x))}{d x} = \frac{d g(x)}{d f(x)} \frac{d f(x)}{d x}$を行います。
$$
\begin{aligned}
\frac{d \varphi(t)}{d t}
&= e^{\lambda (e^{it}-1)}
\frac{d}{d t} \Bigl\{
\lambda (e^{it}-1)
\Bigr\}
\\
&= e^{\lambda(e^{it}-1)} \left\{
\frac{d \lambda e^{it}}{d t}
- \frac{d \lambda}{d t}
\right\}
\\
&= e^{\lambda(e^{it}-1)}
\lambda
e^{it}
\frac{d i t}{d t}
\\
&= e^{\lambda(e^{it}-1)}
\lambda
e^{it} i
\end{aligned}
$$
指数に係数を含む指数関数の微分は$\frac{d e^{ax}}{d x} = e^{ax} \frac{d ax}{d x} = a e^{ax}$です。
式を整理します。
$$
\frac{d \varphi(t)}{d t}
= i \lambda
e^{\lambda(e^{it}-1)+it}
$$
1階微分が求まりました。
特性関数の2階微分の計算
続いて、特性関数を$t$に関して2階微分します。1階微分$\frac{d \varphi(t)}{d t}$を更に微分します。
$$
\begin{aligned}
\frac{d^2 \varphi(t)}{d t^2}
&= \frac{d}{d t} \frac{d \varphi(t)}{d t}
\\
&= \frac{d}{d t} \Bigl\{
i \lambda
e^{\lambda (e^{it}-1)+it}
\Bigr\}
\end{aligned}
$$
指数関数の微分(合成関数の微分)を行います。
$$
\begin{aligned}
\frac{d^2 \varphi(t)}{d t^2}
&= i \lambda
e^{\lambda (e^{it}-1)+it}
\frac{d}{d t} \Bigl\{
\lambda (e^{it} - 1) + i t
\Bigr\}
\\
&= i \lambda
e^{\lambda (e^{it}-1)+it} \left\{
\frac{d \lambda e^{it}}{d t}
- \frac{d \lambda}{d t}
+ \frac{d i t}{d t}
\right\}
\\
&= i \lambda
e^{\lambda (e^{it}-1)+it} \left(
\lambda e^{it} \frac{d i t}{d t}
+ i
\right)
\\
&= i \lambda
e^{\lambda (e^{it}-1)+it} (
i \lambda e^{it} + i
)
\end{aligned}
$$
2階微分が求まりました。
平均の計算
特性関数の微分に$t = 0$を代入し、$i$の逆数を掛けると、平均が得られます。
$$
\begin{aligned}
\mathbb{E}[x]
&= \frac{1}{i}
\frac{d \varphi(0)}{d t}
\\
&= \frac{1}{i}
i \lambda
e^{\lambda(e^{0}-1)+0}
\\
&= \lambda e^0
\\
&= \lambda
\end{aligned}
$$
0乗は$x^0 = 1$です。
二乗の平均の計算
同様に、特性関数の2階微分に$t = 0$を代入し、$i$の2乗の逆数を掛けると、二乗の平均が得られます。
$$
\begin{aligned}
\mathbb{E}[x^2]
&= \frac{1}{i^2}
\frac{d^2 \varphi(0)}{d t^2}
\\
&= \frac{1}{-1} \Bigl\{
i \lambda
e^{\lambda(e^{0}-1)+0} (
i \lambda e^{0} + i
)
\Bigr\}
\\
&= - \Bigl\{
i \lambda e^0
(i \lambda + i)
\Bigr\}
\\
&= \lambda^2 + \lambda
\end{aligned}
$$
虚数単位の2乗は$i^2 = -1$です。
分散の計算
分散は「$x$の2乗の平均」と「$x$の平均の2乗」の差で求められます。
$$
\begin{aligned}
\mathbb{V}[x]
&= \mathbb{E}[x^2]
- (\mathbb{E}[x])^2
\\
&= \lambda^2 + \lambda
- \lambda^2
\\
&= \lambda
\end{aligned}
$$
分散の計算式が得られました。
参考文献
- 星野満博・西崎雅仁『数理統計の探求』晃洋書房,2012年.
おわりに
順調です。
【次の内容】