コース概要
機械学習入門
- 機械学習の種類 - 監督学習と非監督学習
- 統計的学習から機械学習へ
- データマイニングのワークフロー:ビジネス理解、データ準備、モデリング、展開
- タスクに適したアルゴリズムの選択
- 過学習とバイアス-バリアンストレードオフ
Pythonと機械学習ライブラリの概要
- なぜプログラミング言語を使用するのか
- RとPythonの選択
- Pythonの入門とJupyter Notebook
- Pythonライブラリ:pandas, NumPy, scikit-learn, matplotlib, seaborn
機械学習アルゴリズムのテストと評価
- 一般化、過学習、モデル検証
- 評価戦略:ホールアウト、クロスバリデーション、ブートストラップ
- 回帰の評価指標:ME, MSE, RMSE, MAPE
- 分類の評価指標:精度、混同行列、不均衡クラス
- モデル性能の可視化:利益曲線、ROC曲線、リフト曲線
- グリッドサーチによるモデル選択と調整
データ準備
- Pythonでのデータインポートと格納
- 探索的分析と要約統計量
- 欠損値や外れ値の処理
- 標準化、正規化、変換
- pandasを使用した質的データの再コーディングとデータ整形
分類アルゴリズム
- 二値分類 vs 複数クラス分類
- ロジスティック回帰と判別関数
- ナイーブベイズ、k-近傍法
- 決定木:CART, Random Forests, Bagging, Boosting, XGBoost
- サポートベクターマシンとカーネル
- 組み合わせ学習技法
回帰と数値予測
- 最小二乗法と変数選択
- 正則化手法:L1, L2
- 多項式回帰と非線形モデル
- 回帰木とスプライン
ニューラルネットワーク
- ニューラルネットワークとディープラーニングの概要
- 活性化関数、層、バックプロパゲーション
- 多層パーセプトロン(MLP)
- TensorFlowやPyTorchを使用した基本的なニューラルネットワークモデリング
- 分類と回帰のためのニューラルネットワーク
セールス予測と予測分析
- 時系列予測 vs 回帰ベースの予測
- 季節性やトレンドに基づくデータの処理
- ML技術を用いたセールス予測モデルの構築
- 予測精度と不確実性の評価
- 結果のビジネス解釈と伝達
非監督学習
- クラスタリング技法:k-平均法、k-メディオイド法、階層クラスタリング、SOMs
- 次元削減:PCA, 因子分析、SVD
- 多次元スケーリング
テキストマイニング
- テキストの前処理とトークン化
- バッグオブワーズ、ステミング、レマタイゼーション
- 感情分析と単語の頻度
- ワードクラウドを使用したテキストデータの可視化
推薦システム
- ユーザーベースとアイテムベースの協調フィルタリング
- 推薦エンジンの設計と評価
関連パターンマイニング
- 頻出アイテムセットとAprioriアルゴリズム
- マーケットバスケット分析とリフト比
外れ値検出
- 極端値の分析
- 距離ベースと密度ベースの手法
- 高次元データでの外れ値検出
機械学習ケーススタディ
- ビジネス課題の理解
- データ前処理と特徴量エンジニアリング
- モデル選択とパラメータ調整
- 結果の評価と発表
- 展開
まとめと次なるステップ
要求
- 監督学習と非監督学習などの機械学習概念の基本的な知識
- Pythonプログラミング(変数、ループ、関数)に精通していること
- pandasやNumPyなどのライブラリを使用したデータ処理の経験があると役立つが、必須ではない
- 高度なモデリングやニューラルネットワークに関する事前知識は期待されない
対象者
- データサイエンティスト
- ビジネスアナリスト
- データを扱うソフトウェアエンジニアや技術者
お客様の声 (2)
MLエコシステムは、MLflowだけでなく、Optuna、Hyperopt、Docker、docker-composeも含みます。
Guillaume GAUTIER - OLEA MEDICAL
コース - MLflow
機械翻訳
Kubeflowのトレーニングにリモートで参加できて楽しかったです。このトレーニングでは、AWSサービス、K8s、Kubeflow周辺のDevOpsツールに関する知識を確実に定着させることができました。これらの知識は、このテーマに適切に対処するための必要不可欠な基礎となっています。Malawski Marcin氏のトレーニングとベストプラクティスに関するアドバイスに対する忍耐力と専門性に感謝したいと思います。Malawski氏は、異なる角度から、異なるデプロイツール(Ansible、EKS kubectl、Terraform)を使用してこのテーマにアプローチします。今では、自分が適切なアプリケーション分野に進んでいることに確信を持っています。
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
コース - Kubeflow
機械翻訳