はじめに
機械学習や統計学で登場する各種の確率分布について、「計算式の導出・計算のスクラッチ実装・計算過程や結果の可視化」などの「数式・プログラム・図」を用いた解説により、様々な角度から理解を目指すシリーズです。
この記事では、負の二項分布の定義について数式を使って確認します。
【前の内容】
【他の内容】
【今回の内容】
負の二項分布の定義式
負の二項分布(Negative Binomial distribution)の定義式や、関連する計算式を確認します。
変数・パラメータと定義式
コインの裏表やくじの当たり外れのように、成功・失敗の2値をとる事象(ベルヌーイ試行)を独立に複数回試行するときの「ある成功回数(一方の事象が発生する回数)に達するまでの失敗回数(他方の事象が発生する回数)」の確率分布を負の二項分布と言います。
失敗回数(裏などの注目しない事象の発生回数)を で表します。
は、0以上の整数(非負の整数)をとります。これを次のように表記します。
成功回数(表などの注目する事象の発生回数)を で表します。
は、0より大きい整数(正の整数)を満たす必要があります。
成功回数と失敗回数の和が試行回数なので、試行回数は で表わせます。
成功確率(注目する事象の発生確率)を で表します。
は、0から1の実数を満たす必要があります。
これを とも表記します。
失敗確率(注目しない事象の発生確率)は で表わせます。
負の二項分布は、パラメータ を用いて、次の式で定義されます。後の式変形での対応関係が分かりやすいように、成功確率を
で表します。
ここで、 は二項係数です。
は、成功確率
において
回成功するまでに
回失敗する確率です。
失敗確率を とすると、成功確率は
であり、定義式の
を
に置き換えます。
パラメータ を用いて表わせました。
は、失敗確率
において
回成功するまでに
回失敗する確率と言えます。
試行回数を とすると、失敗回数は
であり、定義式の
を
を置き換えます。
途中式の途中式(クリックで展開)
二項係数について、次のように変形できます。
より、
となります。
- 二項係数の性質
より、
となります。
より、
となります。
変数 とパラメータ
を用いて表わせました。
は、成功確率
において
回成功するまでに
回試行する確率と言えます。
対数をとった負の二項分布は、次の式になります。
途中式の途中式(クリックで展開)
対数の性質 、
、
により、式を変形しています。
組み合わせの項
二項係数(組み合わせの項)についてのいくつかの表記を確認します。
二項係数の性質 より、変形します。
二項係数の2つの表記 より、置き換えます。また、二項係数の性質
より、変形します。
二項係数の定義 、
より、置き換えます。
ガンマ関数の性質 より、置き換えます。
それぞれ 回の試行のうち失敗回数が
(成功回数が
)となる組合せの数を表します。
スポンサードリンク
統計量の計算式
二項分布の分布の期待値(平均)・分散・標準偏差・最頻値は、それぞれ次の式になります。
ここで、 は床関数です。
モーメントの計算式
負の二項分布の歪度・尖度は、次の式になります。
ここで、 の期待値
、標準偏差
で表しています。
この記事では、負の二項分布の定義式を確認しました。次からの記事では、負の二項分布について詳しくみていきます。
参考文献
おわりに
過去にベイズ推論についてまとめた際に、負の二項分布について調べるとパラメータや式の表記揺れで混乱したので、(前回まではスルーしていましたが)今回まとめました。
途中でpとかqが登場してごちゃごちゃするのは、揺れる表記の対応関係について書いておきたかったためです。
2025年10月17日は、ロージークロニクルのリーダーの橋田歩果さんの二十歳のお誕生日です!!
(右端の方です♪)
初めて直接見たのはグループとリーダーは決まったもののデビューは未定の頃だったと思うのですが、覚悟が決まっている感じがして印象深かったです。
【次の内容】
つづく
