コース概要

ロボット学習の概要

  • ロボティクスにおける機械学習の概要。
  • 教師あり学習、非教師あり学習、強化学習の比較。
  • 制御、ナビゲーション、操作における RL の応用。

強化学習の基礎

  • マルコフ決定過程 (MDP)。
  • 方策、価値、報酬関数。
  • 探索と活用のトレードオフ。

古典的な RL アルゴリズム

  • Q-learning と SARSA。
  • モンテカルロ法と時間差分法。
  • 価値反復法と方策反復法。

深層強化学習技術

  • 深層学習と RL の組み合わせ(Deep Q-Networks)。
  • 方策勾配法。
  • 高度なアルゴリズム:A3C, DDPG, PPO。

ロボット学習のシミュレーション環境

  • OpenAI Gym と ROS 2 を使用したシミュレーション。
  • ロボットタスク向けカスタム環境の構築。
  • パフォーマンス評価とトレーニング安定性の確認。

強化学習をロボティクスに適用する

  • 制御と運動方策の学習。
  • ロボット操作のための強化学習。
  • 群ロボティクスにおけるマルチエージェント強化学習。

最適化、展開、および実世界統合

  • ハイパーパラメータ調整と報酬整形。
  • シミュレーションから現実への学習方策の移行 (Sim2Real)。
  • ロボットハードウェア上での学習モデルの展開。

まとめと次ステップ

要求

  • 機械学習概念の理解。
  • Python プログラミングの経験。
  • ロボティクスと制御システムに関する知識。

対象者

  • 機械学習エンジニア。
  • ロボティクス研究者。
  • 知能型ロボットシステムの開発者。
 21 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (1)

今後のコース

関連カテゴリー