強化学習を学ぶ上での数学的前提から始まり、重要なアルゴリズムおよび新たな手法までを簡潔に自己完結した記述で解説。
まだレビューがありません
TRPOのフィッシャー情報行列の解釈
【強化学習中級者向け】実装例から学ぶ優先順位付き経験再生 prioritized experience replay DQN 【CartPoleで棒立て:1ファイルで完結】
これから強化学習を勉強する人のための「強化学習アルゴリズム・マップ」と、実装例まとめ
【強化学習中級者向け】実装例から学ぶDueling Network DQN 【CartPoleで棒立て:1ファイルで完結】
【強化学習】実装しながら学ぶA3C【CartPoleで棒立て:1ファイルで完結】
【強化学習初心者向け】シンプルな実装例で学ぶQ学習、DQN、DDQN【CartPoleで棒立て:1ファイルで完結、Kearas使用】