からっぽのしょこ

読んだら書く!書いたら読む!同じ事は二度調べ(たく)ない

攻略ノート

4.2.1:GridWorldクラスの実装:可視化に関するメソッド【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、4.2.1節の内容です。3×4マスのグリッドワールド…

【R】2.3.0:分散共分散行列の固有ベクトルによるガウス分布の回転の可視化【PRMLのノート】

はじめに 『パターン認識と機械学習』の独学時のまとめです。一連の記事は「数式の行間埋め」または「R・Pythonでのスクラッチ実装」からアルゴリズムの理解を補助することを目的としています。本とあわせて読んでください。 また、機械学習で登場する確率分…

2.3.0:分散共分散行列の固有ベクトルによるガウス分布の回転の導出【PRMLのノート】

はじめに 『パターン認識と機械学習』の独学時のまとめです。一連の記事は「数式の行間埋め」または「R・Pythonでのスクラッチ実装」からアルゴリズムの理解を補助することを目的としています。本とあわせて読んでください。 また、機械学習で登場する確率分…

【R】2.3.0:分散共分散行列と固有値・固有ベクトルの関係の計算【PRMLのノート】

はじめに 『パターン認識と機械学習』の独学時のまとめです。一連の記事は「数式の行間埋め」または「R・Pythonでのスクラッチ実装」からアルゴリズムの理解を補助することを目的としています。本とあわせて読んでください。 また、機械学習で登場する確率分…

2.3.0:分散共分散行列と固有値・固有ベクトルの関係の導出【PRMLのノート】

はじめに 『パターン認識と機械学習』の独学時のまとめです。一連の記事は「数式の行間埋め」または「R・Pythonでのスクラッチ実装」からアルゴリズムの理解を補助することを目的としています。本とあわせて読んでください。 また、機械学習で登場する確率分…

4.5.2:価値反復法の実装【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、4.5.2節の内容です。価値反復法を実装して最適…

4.5.1:価値反復法の導出【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、4.5.1節の内容です。価値反復法のアルゴリズム…

4.4:方策反復法の実装【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、4.4節の内容です。方策反復法を実装して最適方…

4.3:方策反復法【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、4.3節の内容です。方策反復法の計算式を確認し…

4.2.3:反復方策評価の実装【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、4.2.3節の内容です。反復方策評価アルゴリズム…

4.2.1:GridWorldクラスの実装:評価と改善に関するメソッド【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、4.2.1節の内容です。3×4マスのグリッドワールド…

4.1:動的計画法と方策評価【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、4.1節の内容です。簡単な例を使って反復方策評…

3.5.2:最適方策【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、3.5.2節の内容です。最適方策の定義を確認しま…

3.5.1:ベルマン最適方程式の適用【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、3.5.1節の内容です。ベルマン最適方程式の計算…

3.4:ベルマン最適方程式【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、3.4節の内容です。状態価値関数と行動価値関数…

3.3.2:行動価値関数のベルマン方程式の導出【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、3.3.2節の内容です。行動価値関数についてのベ…

3.3.1:行動価値関数【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、3.3.1節の内容です。行動価値関数の定義式を確…

3.2.1:状態価値関数のベルマン方程式の例【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、3.2.1節の内容です。状態価値関数についてのベ…

3.1.2:状態価値関数のベルマン方程式の導出【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、3.1.2節の内容です。状態価値関数についてのベ…

3.1.1:報酬の期待値計算【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、3.1.1節の内容です。報酬の期待値の計算から同…

2.3:収益と状態価値関数【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、2.3節の内容です。割引累積報酬と状態価値関数…

2.2:環境とエージェントの定式化【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、2.2節の内容です。環境とエージェントのやり取…

1.5.2:非定常バンディット問題の学習【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、1.5.2節の内容です。非定常な多腕バンディット…

1.5.1:非定常問題のエージェントの実装【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、1.5.1節と1.5.2節の内容です。非定常問題に対応…

1.5.0:非定常問題のスロットマシンの実装【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、1.5節の始めの内容です。非定常問題に対応した…

1.4.3-4:バンディット問題の学習【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、1.4.3節と1.4.4節の内容です。多腕バンディット…

『ゼロから作るDeep Learning 4』の学習ノート:記事一覧

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、各節の記事のリンクページです。 【前巻の内容…

1.4.2:エージェントの実装【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、1.4.2節の内容です。ε-greedy法により行動する…

1.4.1:スロットマシンの実装【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、1.4.1節の内容です。簡単なスロットマシンを実…

1.2:バンディット問題【ゼロつく4のノート】

はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、1.2節の内容です。スロットマシンの価値(期待値…