コース概要

プロダクションでのエージェンシスシステムの基礎

  • エージェンシーアーキテクチャ:ループ、ツール、メモリ、およびオーケストレーションレイヤー
  • エージェントのライフサイクル:開発、デプロイメント、および継続的な運用
  • プロダクションスケールのエージェント管理の課題

インフラストラクチャとデプロイメントモデル

  • コンテナ化およびクラウド環境でのエージェントのデプロイメント
  • スケーリングパターン:水平スケーリング対垂直スケーリング、並行処理、およびスロットリング
  • マルチエージェントのオーケストレーションとワークロードバランス

監視と可観測性

  • キーメトリクス:遅延、成功率、メモリ使用量、エージェントコール深さ
  • エージェント活動とコールグラフの追跡
  • Prometheus、OpenTelemetry、およびGrafanaを使用した可観測性のインストルメンテーション

ログ記録、監査、コンプライアンス

  • 集中型ログ記録と構造化イベント収集
  • エージェントワークフローのコンプライアンスと監査可能性
  • デバッグ用に監査トレイルとリプレイメカニズムを設計する

パフォーマンストーニングとリソース最適化

  • 推論オーバーヘッドの削減とエージェントオーケストレーションサイクルの最適化
  • モデルキャッシュと軽量エンベディングによる高速な検索
  • AIパイプラインのロードテストとストレスシナリオ

コスト制御とガバナンス

  • エージェントコストドライバーの理解:APIコール、メモリ、コンピューティング、外部統合
  • エージェントレベルのコスト追跡とチャージバックモデルの実装
  • エージェントスプロールとアイドルリソース消費を防止する自動化ポリシー

CI/CDおよびエージェントの展開戦略

  • エージェントパイプラインをCI/CDシステムに統合する。
  • イテレーティブなエージェント更新のテスト、バージョン管理、およびロールバック戦略
  • 進行展開と安全なデプロイメントメカニズム

故障回復と信頼性エンジニアリング

  • 障害耐え性とグレースフルデグレーデーションのための設計
  • エージェント信頼性のためのリトライ、タイムアウト、サーキットブレーカーパターン
  • AIオペレーションのインシデント対応と事後分析フレームワーク

総仕上げプロジェクト

  • 完全な監視とコスト追跡を備えたエージェンシAIシステムの構築とデプロイメント
  • 負荷をシミュレートし、パフォーマンスを測定し、リソース使用量を最適化する。
  • 最終アーキテクチャと監視ダッシュボードを同僚に提示する。

まとめと次の一歩

要求

  • MLOpsおよびプロダクション機械学習システムの深い理解
  • コンテナ化デプロイメント(Docker/Kubernetes)の経験
  • クラウドコスト最適化および可観測性ツールへの慣れ

対象者

  • MLOpsエンジニア
  • サイト信頼性エンジニア(SREs)
  • AIインフラストラクチャを監督するエンジニアリングマネージャー
 21 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (3)

今後のコース

関連カテゴリー