コース概要
モジュール1: MLワークフローのためのコアPython
• コースの開講と環境設定
目的の調整と再現可能なPython MLワークスペースの設定
• Python言語のエッセンス(速修コース)
構文、制御フロー、関数、およびMLコードベースで一般的に使用されるパターンのレビュー
• MLのためのデータ構造
特徴、ラベル、メタデータのためのリスト、辞書、セット、タプル
• コンプレ헨ションと関数型ツール
コンプレヘンションと高階関数を使用した変換の表現
• ML開発者のためのオブジェクト指向Python
クラス、メソッド、合成、および実践的な設計決定
• dataclassesと軽量モデリング
設定、例、結果のための型付きコンテナ
• デコレータとコンテキストマネージャ
タイミング、キャッシュ、ログ、およびリソース安全な実行パターン
• ファイルとパスの操作
ロバストなデータセット処理とシリアライゼーション形式
• 例外と防衛的プログラミング
安全で透過的に失敗するMLスクリプトの作成
• モジュール、パッケージ、およびプロジェクト構造
再利用可能なMLコードベースの整理
• タイピングとコード品質
型ヒント、ドキュメント、およびリントフレンドリーな構造
モジュール2: 数値Python、SciPy、およびデータハンドリング
• ベクトル化計算のためのNumPyの基礎
効率的な配列操作とパフォーマンスに配慮したコーディング
• インデクシング、スライシング、ブロードキャスト、および形状
安全なテンソル操作と形状推論
• NumPyとSciPyを使用した線形代数のエッセンス
MLで使用される安定した行列操作と分解
• SciPyの深掘り
統計、最適化、カーブフィッティング、および疎行列
• テーブル形式のMLデータのためのPandas
データのクリーニング、結合、集計、および準備
• scikit-learnの深掘り
推定器インターフェース、パイプライン、および再現可能なワークフロー
• 可視化のエッセンス
データ探索とモデル動作のための診断プロット
モジュール3: MLアプリケーションの構築のためのプログラミングパターン
• ノートブックから保守可能なプロジェクトへ
探索的なコードを構造化されたパッケージにリファクタリング
• 設定管理
外部化されたパラメータと起動時の検証
• ログ、警告、およびオブザーバビリティ
デバッグ可能なMLシステムのための構造化されたログ
• OOPと合成を使用した再利用可能なコンポーネント
拡張可能なトランスフォーマーと予測器の設計
• 実践的な設計パターン
パイプライン、ファクトリ、レジストリ、ストラテジー、アダプタパターン
• データ検証とスキーマチェック
静的なデータ問題の防止
• パフォーマンスとプロファイリング
ボトルネックの特定と最適化手法の適用
• モデルのI/Oと推論インターフェース
安全な永続化とクリーンな予測インターフェース
• エンドツーエンドのミニビルド
設定とログを含むプロダクションスタイルのMLパイプライン
モジュール4: テーブル、テキスト、画像のための統計的学習
• 評価の基礎
学習と検証の分割、正直なクロスバリデーション、ビジネスに合わせたメトリクス
• 高度なテーブル形式のML
正規化されたGLM、ツリーのアンサンブル、リークフリーな前処理
• キャリブレーションと不確実性
Plattスケーリング、等間隔回帰、ブートストラップ、適合予測
• 古典的なNLP手法
トークン化のトレードオフ、TF-IDF、線形モデル、ナイーブベイズ
• トピックモデリング
LDAの基礎と実践的な制限
• 古典的なコンピュータビジョン
HOG、PCA、特徴量ベースのパイプライン
• エラーアナリシス
バイアス検出、ラベルノイズ、偶然の相関
• 実践的なラボ
リークフリーのテーブル形式のパイプライン
テキストの基準比較と解釈
古典的なビジョンの基準と構造化された失敗分析
モジュール5: テーブル、テキスト、画像のためのニューラルネットワーク
• トレーニングループのマスター
AMP、クリッピング、再現性を備えたクリーンなPyTorchループ
• 最適化と正則化
初期化、正規化、最適化手法、スケジューラ
• 混合精度とスケーリング
グラディエント蓄積とチェックポイント戦略
• テーブル形式のニューラルネットワーク
カテゴリカルエンベディング、特徴クロス、アブレーションスタディ
• テキストのニューラルネットワーク
エンベディング、CNN、BiLSTMまたはGRU、シーケンス処理
• ビジョンのニューラルネットワーク
CNNの基礎とResNetスタイルのアーキテクチャ
• 実践的なラボ
再利用可能なトレーニングフレームワーク
テーブルNNとブースティングの比較
CNNのデータ拡張とスケジューリング実験
モジュール6: 高度なニューラルアーキテクチャ
• トランスファーラーニング戦略
FreezeとUnfreezeパターン、差別的学習率
• テキストのためのトランスフォーマーアーキテクチャ
セルフアテンションの内部とファインチューニング手法
• ビジョンバックボーンと密集予測
ResNet、EfficientNet、ビジョントランスフォーマー、U-Netの概念
• 高度なテーブル形式のアーキテクチャ
TabTransformer、FT-Transformer、Deep and Crossネットワーク
• タイムシリーズの考慮事項
時系列の分割と共変量シフト検出
• PEFTと効率手法
LoRA、ディスティレーション、量子化のトレードオフ
• 実践的なラボ
事前学習済みテキストトランスフォーマーのファインチューニング
事前学習済みビジョンモデルのファインチューニング
テーブルトランスフォーマーとGBDTの比較
モジュール7: 生成型AIシステム
• プロンプトの基礎
構造化されたプロンプティングと制御された生成
• LLMの基礎
トークン化、指示調整、幻覚軽減
• リトリーバル強化生成
チャンキング、エンベディング、ハイブリッド検索、評価メトリクス
• ファインチューニング戦略
LoRAとQLoRA、データ品質制御
• ディフュージョンモデル
潜在ディフュージョンの直感と実践的な適用
• 合成テーブルデータ
CTGANとプライバシーの考慮
• 実践的なラボ
生産スタイルのRAGミニアプリケーション
スキーマ強制による構造化出力検証
オプションのディフュージョン実験
モジュール8: AIエージェントとMCP
• エージェントループの設計
観察、計画、行動、反省、永続化
• エージェントアーキテクチャ
ReAct、計画と実行、マルチエージェントの調整
• メモリ管理
エピソード、意味、スクラップパッドのアプローチ
• ツール統合と安全性
ツール契約、サンドボックス、プロンプト注入防御
• 評価フレームワーク
再現可能なトレース、タスクスイート、回帰テスト
• MCPとプロトコルベースの相互運用性
セキュアなツールエクスポージャを持つMCPサーバーの設計
• 実践的なラボ
ゼロからエージェントを構築する
MCPスタイルのサーバーでツールを公開する
安全性の制約を持つ評価ハーネスの作成
要求
参加者はPythonプログラミングの実践的な知識を持っていることが望まれます。
このプログラムは、中級から上級の技術者向けです。
お客様の声 (2)
MLエコシステムは、MLflowだけでなく、Optuna、Hyperopt、Docker、docker-composeも含みます。
Guillaume GAUTIER - OLEA MEDICAL
コース - MLflow
機械翻訳
Kubeflowのトレーニングにリモートで参加できて楽しかったです。このトレーニングでは、AWSサービス、K8s、Kubeflow周辺のDevOpsツールに関する知識を確実に定着させることができました。これらの知識は、このテーマに適切に対処するための必要不可欠な基礎となっています。Malawski Marcin氏のトレーニングとベストプラクティスに関するアドバイスに対する忍耐力と専門性に感謝したいと思います。Malawski氏は、異なる角度から、異なるデプロイツール(Ansible、EKS kubectl、Terraform)を使用してこのテーマにアプローチします。今では、自分が適切なアプリケーション分野に進んでいることに確信を持っています。
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
コース - Kubeflow
機械翻訳