はじめに
機械学習や統計学で登場する各種の確率分布について、「計算式の導出・計算のスクラッチ実装・計算過程や結果の可視化」などの「数式・プログラム・図」を用いた解説により、様々な角度から理解を目指すシリーズです。
この記事では、ポアソン分布のパラメータの影響についてR言語を使って確認します。
【前の内容】
【他の内容】
【今回の内容】
ポアソン分布のパラメータの可視化
ポアソン分布(Poisson distribution)のグラフやアニメーションを作成して、パラメータの影響を図で確認します。この記事では、Rのggplot2パッケージを利用して作図します。
ポアソン分布については「ポアソン分布の定義式 - からっぽのしょこ」、グラフ作成については「【R】混合ポアソン分布の作図 - からっぽのしょこ」、Pythonを利用する場合は「ポアソン分布|確率分布の可視化」を参照してください。
パラメータの影響
前の記事では、複数のパラメータのポアソン分布のグラフを並べて描画しました。

この記事では、パラメータの値を少しずつ変化させてグラフの変化をアニメーションで確認します。
作図コードについては「Probability-Distribution/code/poisson/parameter.R at main · anemptyarchive/Probability-Distribution · GitHub」を参照してください。
パラメータと形状の関係
パラメータ を変化させたときのポアソン分布の形状の変化をアニメーションにします。
パラメータ(発生回数の期待値) が大きくなるに従って、確率変数の値(発生回数)
が大きいほど確率が高くなる(山が右に移動する)のが分かります。
パラメータと統計量の関係
パラメータ を変化させたときのポアソン分布の統計量の変化をアニメーションにします。
期待値を破線、最頻値(mode)を鎖線、期待値を中心に標準偏差1つ分離れた値を点線、またその範囲を線分で示します。
が大きくなるほど、期待値と最頻値が大きくなる(右に移動する)のが分かります。また、標準偏差(分散)が大きくなり、分布の裾が広く確率の最大値が小さくなる(山がなだらかになる)のも分かります。
このことは、それぞれの計算式からも分かります。
パラメータとモーメントの関係
パラメータ を変化させたときのポアソン分布の歪度と尖度の変化をアニメーションにします。
ポアソン分布の形状が分かりやすいように、 がとりうる離散値ごとの確率値(バーの高さ)に点を表示し、緑色の実線の折れ線で結んでいます。
形状の比較用に、ポアソン分布の期待値 ] と標準偏差
] に一致するガウス分布(正規分布)を赤色の破線の曲線で示します。
が大きくなるほど、歪度(skewness)と尖度(kurtosis)が0に近付く(正規分布の形状に近付く)のが分かります。
このことは、それぞれの計算式からも分かります。
以上で、パラメータの影響を確認しました。
この記事では、ポアソン分布のパラメータの影響を可視化しました。次の記事では、乱数を生成します。
参考文献
おわりに
加筆修正の際に「ポアソン分布の作図」から記事を分割しました。
アニメーションの作図の解説は(面倒な割に需要もなさそうなので)やめることにしたら、R版とPython版とで同じ図が並ぶだけの別の記事になってしまうので、1つの記事に両方の図をまとめようかとも思ったのですが、Python版の一部の記事をZennの方に投稿することにしました。
現時点では記事が充実していませんが、こっちも覗いてみてください。
(数式を書く時にバックスラッシュを入れなくてもいいなんて捗るなぁ、でも動画を貼れないのは困るなぁ。色んなサービスのいいとこ取りをしたいなぁ。)
この記事の投稿日が8月6日ということで、Juice=Juiceのリーダーの段原瑠々さんのコラボ曲が先ほど公開されました。
平和を守っていこうな。
【次の内容】
