からっぽのしょこ

読んだら書く!書いたら読む!同じ事は二度調べ(たく)ない

【R】負の二項分布のパラメータの可視化

はじめに

 機械学習や統計学で登場する各種の確率分布について、「計算式の導出・計算のスクラッチ実装・計算過程や結果の可視化」などの「数式・プログラム・図」を用いた解説により、様々な角度から理解を目指すシリーズです。

 この記事では、負の二項分布のパラメータの影響についてR言語を使って確認します。

【前の内容】

www.anarchive-beta.com

【他の内容】

www.anarchive-beta.com

【今回の内容】

負の二項分布のパラメータの可視化

 負の二項分布(Negative Binomial distribution)のグラフやアニメーションを作成して、パラメータの影響を図で確認します。この記事では、Rのggplot2パッケージを利用して作図します。
 負の二項分布については「負の二項分布の定義式 - からっぽのしょこ」、グラフ作成については「【R】負の二項分布の作図 - からっぽのしょこ」、Pythonを利用する場合は「Python版」を参照してください。

パラメータの影響

 前の記事(「分布の作図」)では、複数のパラメータのグラフを並べて描画しました。

負の二項分布のグラフ

 この記事では、パラメータの値を少しずつ変化させてグラフの変化をアニメーションで確認します。
 作図コードについては「Probability-Distribution/code/negative_binomial/parameter.R at main · anemptyarchive/Probability-Distribution · GitHub」を参照してください。

パラメータと形状の関係

 成功確率パラメータ  \phi を変化させたときの負の二項分布の形状の変化をアニメーションにします。

 パラメータ(成功確率)  \phi が大きくなるほど、確率のピークとなる確率変数の値(失敗回数)  x が小さくなる(山が左に移動する)のが分かります。

 成功回数パラメータ  r による変化をアニメーションにします。

 成功回数  r が増えるほど、確率のピークとなる確率変数の値(失敗回数)  x が大きくなる(山が右に移動する)のが分かります。

パラメータと統計量の関係

 成功確率  \phi を変化させたときの負の二項分布の統計量の変化をアニメーションにします。

 期待値を破線、最頻値(mode)を鎖線、期待値を中心に標準偏差1つ分離れた値を点線、また標準偏差2つ分(左右1つずつ)の範囲を水平の線分で示します。

  \phi が大きくなる(1に近付く)ほど、期待値と最頻値が小さくなる(左に移動する)のが分かります。また、標準偏差(分散)が小さくなり、分布の裾が狭く確率の最大値が大きくなる(山が高くなる)のも分かります。

 このことを、 \phi \frac{1 - \phi}{\phi} の関係をグラフで確認します。

パラメータとパラメータの項の関係

 期待値などの計算式について、 \phi が1に近付くほど、 \phi に関する項が0に近付き(最小になり)ます。

 成功回数  r による変化をアニメーションにします。

  r が大きくなるほど、期待値や最頻値、標準偏差(分散)が大きくなるのが分かります。

 これらのことは、それぞれの計算式からも分かります。

 \displaystyle
\begin{aligned}
\mathbb{E}[x]
   &= \frac{r (1 - \phi)}{\phi}
\\
\mathbb{V}[x]
   &= \frac{r (1 - \phi)}{\phi^2}
\\
\mathrm{mode}[x]
   &= \begin{cases}
          \left\lfloor
              \frac{(r - 1) (1 - \phi)}{\phi}
          \right\rfloor
             &\quad
                (r \gt 1)
      \\
          0
             &\quad
                (r \leq 1)
      \end{cases}
\end{aligned}


パラメータとモーメントの関係

 成功確率  \phi を変化させたときの負の二項分布の歪度と尖度の変化をアニメーションにします。

 分布の形状の比較用に、負の二項分布の期待値  \mu = \mathbb{E}[x] と標準偏差  \sigma = \mathbb{s}[x] に一致するガウス分布(正規分布)を赤色の破線の曲線で示します。
 比較しやすいように、負の二項分布の  x がとりうる離散値ごとの確率値(バーの高さ)に点を表示し、緑色の実線で結んでいます。

  \phi が大きくなるほど、歪度(skewness)と尖度(kurtosis)が0に近付く(正規分布の形状に近付く)のが分かります。

 発生回数  r による変化をアニメーションにします。

  r が大きくなるほど、歪度(skewness)と尖度(kurtosis)が0に近付く(正規分布の形状に近付く)のが分かります。

 これらのことは、それぞれの計算式からも分かります。

 \displaystyle
\begin{aligned}
\mathrm{Skewness}
    = \frac{
          2 - \phi
      }{
          \sqrt{(1 - \phi) r}
      }
\\
\mathrm{Kurtosis}
    = \frac{6}{\phi}
      + \frac{
          \phi^2
        }{
          (1 - \phi) r
        }
\end{aligned}


 以上で、パラメータの影響を確認しました。

 この記事では、負の二項分布のパラメータの影響を可視化しました。次の記事では、乱数を生成します。

参考文献

おわりに

 ほぼほぼ出来上がって放置していたものですが、他記事との表現の揺れなどを気合で完成させて、なんとか日々更新を続けています。

 2025年10月20日は、BEYOOOOONDSの岡村美波さんの21歳のお誕生日です!

 みいみの笑顔に救われています。

【次の内容】

https://www.anarchive-beta.com/entry/2025/10/21/235500www.anarchive-beta.com