はじめに
機械学習や統計学で登場する各種の確率分布について、「計算式の導出・計算のスクラッチ実装・計算過程や結果の可視化」などの「数式・プログラム・図」を用いた解説により、様々な角度から理解を目指すシリーズです。
この記事では、二項分布のパラメータの影響についてR言語を使って確認します。
【前の内容】
【他の内容】
【今回の内容】
二項分布のパラメータの可視化
二項分布(Binomial distribution)のグラフやアニメーションを作成して、パラメータの影響を図で確認します。この記事では、Rのggplot2パッケージを利用して作図します。
二項分布については「二項分布の定義式 - からっぽのしょこ」、グラフ作成については「【R】二項分布の作図 - からっぽのしょこ」、Pythonを利用する場合は「二項分布|確率分布の可視化」を参照してください。
パラメータの影響
前の記事(「分布の作図」)では、複数のパラメータのグラフを並べて描画しました。

この記事では、パラメータの値を少しずつ変化させてグラフの変化をアニメーションで確認します。
作図コードについては「Probability-Distribution/code/binomial/parameter.R at main · anemptyarchive/Probability-Distribution · GitHub」を参照してください。
パラメータと形状の関係
パラメータ を変化させたときの二項分布の形状の変化をアニメーションにします。
パラメータ(成功確率) が大きくなるに従って、確率変数の値(成功回数)
が大きいほど確率が高くなる(山が右に移動する)のが分かります。
試行回数 による変化をアニメーションにします。
試行回数 が増えるに従って、成功回数
が大きいほど確率が高くなる(山が右に移動する)のが分かります。ただし、
がとり得る範囲が広がるため、各値となる確率は小さくなり(山全体が低くなり)ます。
パラメータと統計量の関係
パラメータ を変化させたときの二項分布の統計量の変化をアニメーションにします。
期待値を破線、最頻値(mode)を鎖線、期待値を中心に標準偏差1つ分離れた値を点線、またその範囲を線分で示します。
が大きくなる(1に近付く)ほど、期待値と最頻値が大きくなる(右に移動する)のが分かります。また、
に近いほど、標準偏差(分散)が大きくなり、分布の裾が広く確率の最大値が小さくなり(山がなだらかになり)ます。
このことを、 と
の関係をグラフで確認します。

分散などの計算式について、 のとき、成功確率
と失敗確率
の積(
に関する項)が最大になります。
試行回数 による変化をアニメーションにします。
が大きくなるほど、期待値や最頻値、標準偏差(分散)が大きくなるのが分かります。
これらのことは、それぞれの計算式からも分かります。
パラメータとモーメントの関係
パラメータ を変化させたときの二項分布の歪度と尖度の変化をアニメーションにします。
分布の形状が分かりやすいように、 がとりうる離散値ごとの確率値(バーの高さ)に点を表示し、緑色の実線の折れ線で結んでいます。
形状の比較用に、二項分布の期待値 と標準偏差
に一致するガウス分布(正規分布)を赤色の破線の曲線で示します。
のとき歪度
になり左右対称な分布、
のとき
、
のとき
になります。
のとき尖度が最小になります。
このことを、 と計算式の分子の関係をグラフで確認します。


試行回数 による変化をアニメーションにします。
が大きくなるほど、歪度(skewness)と尖度(kurtosis)が0に近付く(正規分布の形状に近付く)のが分かります。
これらのことは、それぞれの計算式からも分かります。
以上で、パラメータの影響を確認しました。
この記事では、ポアソン分布のパラメータの影響を可視化しました。次の記事では、乱数を生成します。
参考文献
おわりに
加筆修正の際に「【R】二項分布の作図」から記事を分割しました。
2025年8月16日は、BEYOOOOONDSの小林萌花さんの25歳のお誕生日です♪
ほのピアノを未だに聴いたことがないんだよなぁ。ぜひ聴きたい。イラストや服も見る機会はあるのだろうか。
【次の内容】
