コース概要
イントロダクション
- パターン認識、分類、回帰における効果的なアルゴリズムの構築。
開発環境のセットアップ
- Pythonライブラリ
- オンラインエディタとオフラインエディタ
特徴量エンジニアリングの概要
- 入力変数と出力変数(特徴量)
- 特徴量エンジニアリングの利点と欠点
生データで遭遇する問題の種類
- 不潔なデータ、欠損値など
変数の前処理
- 欠損値の扱い
データ内の欠損値の処理
カテゴリ変数の扱い
ラベルを数字に変換する
カテゴリ変数内のラベルの処理
予測力向上のために変数を変換する
- 数値、カテゴリ、日付など
データセットのクリーニング
機械学習モデリング
データ内の外れ値の処理
- 数値変数、カテゴリ変数など
まとめと結論
要求
- Pythonプログラミング経験。
- Numpy, Pandas, scikit-learnの使用経験。
- 機械学習アルゴリズムに関する知識。
対象者
- 開発者
- データサイエンティスト
- データアナリスト
お客様の声 (2)
MLエコシステムは、MLflowだけでなく、Optuna、Hyperopt、Docker、docker-composeも含みます。
Guillaume GAUTIER - OLEA MEDICAL
コース - MLflow
機械翻訳
Kubeflowのトレーニングにリモートで参加できて楽しかったです。このトレーニングでは、AWSサービス、K8s、Kubeflow周辺のDevOpsツールに関する知識を確実に定着させることができました。これらの知識は、このテーマに適切に対処するための必要不可欠な基礎となっています。Malawski Marcin氏のトレーニングとベストプラクティスに関するアドバイスに対する忍耐力と専門性に感謝したいと思います。Malawski氏は、異なる角度から、異なるデプロイツール(Ansible、EKS kubectl、Terraform)を使用してこのテーマにアプローチします。今では、自分が適切なアプリケーション分野に進んでいることに確信を持っています。
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
コース - Kubeflow
機械翻訳