コース概要
Kubernetes 上の MLOps の基礎
- MLOps の基本概念
- 伝統的な DevOps と MLOps の違い
- ML ライフサイクル管理の主要な課題
ML ワークロードのコンテナ化
- モデルとトレーニングコードのパッケージ化
- 機械学習用にコンテナイメージを最適化する
- 依存関係と再現性の管理
機械学習用 CI/CD
- 自動化のために ML リポジトリを構造化する
- テストと検証ステップの統合
- 再トレーニングやアップデートのためのパイプラインのトリガー
モデルデプロイ用 GitOps
- GitOps の原理とワークフロー
- Argo CD を使用したモデルのデプロイ
- モデルと構成のバージョン管理
Kubernetes 上でのパイプラインオーケストレーション
- Tekton を使用したパイプラインの構築
- 複数ステップの ML ワークフローの管理
- スケジューリングとリソース管理
監視、ログ、ロールバック戦略
- データの変動とモデル性能の追跡
- アラートと観測可能性の統合
- ロールバックとフェイルオーバーのアプローチ
自動再トレーニングと継続的な改善
- フィードバックループの設計
- 予定された再トレーニングの自動化
- MLflow を使用した追跡と実験管理の統合
高度な MLOps アーキテクチャ
- 複数クラスターとハイブリッドクラウドのデプロイメントモデル
- 共有インフラストラクチャでのチームのスケーリング
- セキュリティとコンプライアンスに関する考慮事項
まとめと次なるステップ
要求
- Kubernetes の基本的理解
- 機械学習ワークフローの経験
- Git ベースの開発に関する知識
対象者
- ML エンジニア
- DevOps エンジニア
- ML プラットフォームチーム
お客様の声 (3)
彼は忍耐強く、私たちが遅れることを理解していました
Albertina - REGNOLOGY ROMANIA S.R.L.
コース - Deploying Kubernetes Applications with Helm
機械翻訳
MLエコシステムは、MLflowだけでなく、Optuna、Hyperopt、Docker、docker-composeも含みます。
Guillaume GAUTIER - OLEA MEDICAL
コース - MLflow
機械翻訳
Kubeflowのトレーニングにリモートで参加できて楽しかったです。このトレーニングでは、AWSサービス、K8s、Kubeflow周辺のDevOpsツールに関する知識を確実に定着させることができました。これらの知識は、このテーマに適切に対処するための必要不可欠な基礎となっています。Malawski Marcin氏のトレーニングとベストプラクティスに関するアドバイスに対する忍耐力と専門性に感謝したいと思います。Malawski氏は、異なる角度から、異なるデプロイツール(Ansible、EKS kubectl、Terraform)を使用してこのテーマにアプローチします。今では、自分が適切なアプリケーション分野に進んでいることに確信を持っています。
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
コース - Kubeflow
機械翻訳