コース概要

導入

Reinforcement Learning 基本

基本Reinforcement Learningテクニック

バーラップの紹介

価値の収束とポリシーの反復

報酬の形成

探検

一般化

部分的に観測可能な MDP

オプション

ロジスティクス

TD ラムダ

ポリシーの勾配

ディープ Q ラーニング

ゲーム理論のトピック

概要と次のステップ

要求

  • Pythonに精通していること
  • 大学の微積分と線形代数の理解
  • 確率とStatisticsの基本的な理解
  • PythonとNumpyで機械学習モデルを作成した経験

観客

  • 開発者
  • データサイエンティスト
 21 時間

参加者の人数



Price per participant

関連コース

関連カテゴリー