コース概要

機械学習向け Apache Airflow の概要

  • Apache Airflow の概要とデータサイエンスにおける重要性
  • 機械学習ワークフローの自動化に必要な主な機能
  • データサイエンスプロジェクト向けの Airflow の設定方法

Airflow を使用した機械学習パイプラインの構築

  • 端から端までの ML ワークフロー用に DAGs の設計
  • データ取り込み、前処理、特徴量エンジニアリングのためのオペレーターの使用
  • パイプライン依存関係のスケジューリングと管理

モデル訓練と検証

  • Airflow を使用したモデル訓練タスクの自動化
  • ML フレームワーク(TensorFlow、PyTorch など)との Airflow の統合
  • モデルの検証と評価指標の保存

モデル展開と監視

  • 自動パイプラインを使用した機械学習モデルの展開
  • Airflow タスクを使用した展開済みモデルの監視
  • 再訓練とモデル更新の処理

高度なカスタマイズと統合

  • ML 特有のタスク向けにカスタムオペレーターの開発
  • クラウドプラットフォームや ML サービスとの Airflow の統合
  • プラグインとセンサーを使用した Airflow ワークフローの拡張

ML パイプラインの最適化とスケーリング

  • 大規模データ向けのワークフローパフォーマンスの向上
  • Celery と Kubernetes を使用した Airflow 展開のスケーリング
  • 生産環境向け ML ワークフローのベストプラクティス

ケーススタディと実践的なアプリケーション

  • Airflow を使用した ML 自動化の実際の事例
  • 実習: 端から端までの ML パイプラインの構築
  • ML ワークフローマネジメントにおける課題と解決策のディスカッション

まとめと次なるステップ

要求

  • 機械学習ワークフローと概念に精通していること
  • Apache Airflow(DAGs およびオペレーター)の基本的な理解があること
  • Python プログラミングに習熟していること

対象者

  • データサイエンティスト
  • 機械学習エンジニア
  • AI 開発者
 21 時間

参加者の人数


参加者1人当たりの料金

今後のコース

関連カテゴリー