からっぽのしょこ

読んだら書く!書いたら読む!同じ事は二度調べ(たく)ない

2019-05-01から1ヶ月間の記事一覧

3.3:混合ユニグラムモデルの最尤推定(EMアルゴリズム)の導出【青トピックモデルのノート】

はじめに 『トピックモデル』(MLPシリーズ)の勉強会資料のまとめです。各種モデルやアルゴリズムを「数式」と「プログラム」を用いて解説します。 本の補助として読んでください。 この記事では、混合カテゴリモデルにおけるEMアルゴリズムを用いた最尤推定…

『トピックモデル』の勉強ノート:記事一覧

はじめに 『トピックモデル』(MLPシリーズ)の勉強会資料のまとめです。各種モデルやアルゴリズムを「数式」と「プログラム」を用いて解説します。 本の補助として読んでください。 この記事は、各節の内容のリンクページです。 各記事では、「数式の行間埋め…

2.7:ユニグラムモデルの経験ベイズ推定の導出:一様なハイパーパラメータの場合【青トピックモデルのノート】

はじめに 『トピックモデル』(MLPシリーズ)の勉強会資料のまとめです。各種モデルやアルゴリズムを「数式」と「プログラム」を用いて解説します。 本の補助として読んでください。 この記事では、カテゴリモデルに対する経験ベイズ推定(ハイパーパラメータ推…

2.5-6:ユニグラムモデルのベイズ推定とベイズ予測分布【『トピックモデル』の勉強ノート】

はじめに 機械学習プロフェッショナルシリーズの『トピックモデル』の勉強時に自分の理解の助けになったことや勉強会資料のまとめです。トピックモデルの各種アルゴリズムを「数式」と「プログラム」から理解することを目指します。 この記事は、2.5節「ベイ…

2.3:ユニグラムモデルの最尤推定の導出【青トピックモデルのノート】

はじめに 『トピックモデル』(MLPシリーズ)の勉強会資料のまとめです。各種モデルやアルゴリズムを「数式」と「プログラム」を用いて解説します。 本の補助として読んでください。 この記事では、カテゴリモデルに対する最尤推定の数式の行間を埋めます。 【…

ディリクレ分布の統計量の導出

はじめに 機械学習で登場する確率分布について色々な角度から理解したいシリーズです。 この記事では、ベータ分布の期待値・分散・共分散・最頻値・対数の期待値を導出します。 【前の内容】 www.anarchive-beta.com 【他の記事一覧】 www.anarchive-beta.co…

ベータ分布の統計量の導出

はじめに 機械学習で登場する確率分布について色々な角度から理解したいシリーズです。 この記事では、ベータ分布の期待値・分散・最頻値を導出します。 【前の内容】 www.anarchive-beta.com 【他の記事一覧】 www.anarchive-beta.com 【この記事の内容】 …

多項分布の平均と分散の導出

はじめに 機械学習で登場する確率分布について色々な角度から理解したいシリーズです。 多項分布の統計量を導出します。 【前の内容】 www.anarchive-beta.com 【他の記事一覧】 www.anarchive-beta.com 【この記事の内容】 はじめに 多項分布の統計量の導出…

二項分布の平均と分散の導出:定義式を利用

はじめに 機械学習で登場する確率分布について色々な角度から理解したいシリーズです。 二項分布の統計量を定義式から導出します。 【前の内容】 www.anarchive-beta.com 【他の記事一覧】 www.anarchive-beta.com 【この記事の内容】 はじめに 二項分布の統…

1.1.11:ラグランジュの未定乗数法【『トピックモデル』の勉強ノート】

はじめに 機械学習プロフェッショナルシリーズの『トピックモデル』の勉強時に自分の理解の助けになったことや勉強会資料のまとめです。トピックモデルの各種アルゴリズムを「数式」と「プログラム」から理解することを目指します。 この記事は、1.1.10項「…

1.1.8-10:カルバック・ライブラー・ダイバージェンスとイェンゼンの不等式【『トピックモデル』の勉強ノート】

はじめに 機械学習プロフェッショナルシリーズの『トピックモデル』の勉強時に自分の理解の助けになったことや勉強会資料のまとめです。トピックモデルの各種アルゴリズムを「数式」と「プログラム」から理解することを目指します。 この記事は、1.1.8項「カ…

1.1.1-7:確率の基礎【『トピックモデル』の勉強ノート】

はじめに 機械学習プロフェッショナルシリーズの『トピックモデル』の勉強時に自分の理解の助けになったことや勉強会用のレジュメのまとめです。トピックモデルの各種アルゴリズムを「数式」と「プログラム」から理解することを目指します。 この記事は、1.1…

太宰治作品の話者判別

はじめに 計量言語学・計量文献学に著者推定・著者判別というものがあります。文書中の単語の出現頻度などから、著者の癖といったものを割り出すことで著者を識別します。この手法は、作者不明作品の執筆者の推定やスパムメールの判別に応用されます。 この…