お問い合わせ

コース概要

デプロイメント向けの機械学習モデルの準備

  • Dockerによるモデルのパッケージ化
  • TensorFlowおよびPyTorchからのモデルエクスポート
  • バージョニングとストレージの考慮事項

Kubernetesでのモデル提供

  • 推論サーバーの概要
  • TensorFlow ServingおよびTorchServeのデプロイメント
  • モデルエンドポイントの設定

推論の最適化技法

  • バッチ処理戦略
  • 同時リクエストの処理
  • レイテンシーとスループットの調整

MLワークロードのオートスケーリング

  • Horizontal Pod Autoscaler (HPA)
  • Vertical Pod Autoscaler (VPA)
  • Kubernetes Event-Driven Autoscaling (KEDA)

GPUのプロビジョニングとリソース管理

  • GPUノードの設定
  • NVIDIAデバイスプラグインの概要
  • MLワークロード向けのリソース要求と制限

モデル展開およびリリース戦略

  • ブルー/グリーンデプロイメント
  • カナリア展開パターン
  • モデル評価のためのA/Bテスト

プロダクションでのMLにおける監視と観測性

  • 推論ワークロードのメトリクス
  • ログ記録とトレーシングのプラクティス
  • ダッシュボードとアラート

セキュリティと信頼性の考慮事項

  • モデルエンドポイントのセキュリティ確保
  • ネットワークポリシーとアクセス制御
  • 高可用性の確保

まとめと次のステップ

要求

  • コンテナ化されたアプリケーションのワークフローに関する知識
  • Pythonベースの機械学習モデルの経験
  • Kubernetesの基本原理に関する理解

対象者

  • MLエンジニア
  • DevOpsエンジニア
  • プラットフォームエンジニアリングチーム
 14 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (3)

今後のコース

関連カテゴリー