コース概要

機械学習入門

  • 機械学習の種類 - 監督学習と非監督学習
  • 統計的学習から機械学習へ
  • データマイニングのワークフロー:ビジネス理解、データ準備、モデリング、展開
  • タスクに適したアルゴリズムの選択
  • 過学習とバイアス-バリアンストレードオフ

Pythonと機械学習ライブラリの概要

  • なぜプログラミング言語を使用するのか
  • RとPythonの選択
  • Pythonの入門とJupyter Notebook
  • Pythonライブラリ:pandas, NumPy, scikit-learn, matplotlib, seaborn

機械学習アルゴリズムのテストと評価

  • 一般化、過学習、モデル検証
  • 評価戦略:ホールアウト、クロスバリデーション、ブートストラップ
  • 回帰の評価指標:ME, MSE, RMSE, MAPE
  • 分類の評価指標:精度、混同行列、不均衡クラス
  • モデル性能の可視化:利益曲線、ROC曲線、リフト曲線
  • グリッドサーチによるモデル選択と調整

データ準備

  • Pythonでのデータインポートと格納
  • 探索的分析と要約統計量
  • 欠損値や外れ値の処理
  • 標準化、正規化、変換
  • pandasを使用した質的データの再コーディングとデータ整形

分類アルゴリズム

  • 二値分類 vs 複数クラス分類
  • ロジスティック回帰と判別関数
  • ナイーブベイズ、k-近傍法
  • 決定木:CART, Random Forests, Bagging, Boosting, XGBoost
  • サポートベクターマシンとカーネル
  • 組み合わせ学習技法

回帰と数値予測

  • 最小二乗法と変数選択
  • 正則化手法:L1, L2
  • 多項式回帰と非線形モデル
  • 回帰木とスプライン

ニューラルネットワーク

  • ニューラルネットワークとディープラーニングの概要
  • 活性化関数、層、バックプロパゲーション
  • 多層パーセプトロン(MLP)
  • TensorFlowやPyTorchを使用した基本的なニューラルネットワークモデリング
  • 分類と回帰のためのニューラルネットワーク

セールス予測と予測分析

  • 時系列予測 vs 回帰ベースの予測
  • 季節性やトレンドに基づくデータの処理
  • ML技術を用いたセールス予測モデルの構築
  • 予測精度と不確実性の評価
  • 結果のビジネス解釈と伝達

非監督学習

  • クラスタリング技法:k-平均法、k-メディオイド法、階層クラスタリング、SOMs
  • 次元削減:PCA, 因子分析、SVD
  • 多次元スケーリング

テキストマイニング

  • テキストの前処理とトークン化
  • バッグオブワーズ、ステミング、レマタイゼーション
  • 感情分析と単語の頻度
  • ワードクラウドを使用したテキストデータの可視化

推薦システム

  • ユーザーベースとアイテムベースの協調フィルタリング
  • 推薦エンジンの設計と評価

関連パターンマイニング

  • 頻出アイテムセットとAprioriアルゴリズム
  • マーケットバスケット分析とリフト比

外れ値検出

  • 極端値の分析
  • 距離ベースと密度ベースの手法
  • 高次元データでの外れ値検出

機械学習ケーススタディ

  • ビジネス課題の理解
  • データ前処理と特徴量エンジニアリング
  • モデル選択とパラメータ調整
  • 結果の評価と発表
  • 展開

まとめと次なるステップ

要求

  • 監督学習と非監督学習などの機械学習概念の基本的な知識
  • Pythonプログラミング(変数、ループ、関数)に精通していること
  • pandasやNumPyなどのライブラリを使用したデータ処理の経験があると役立つが、必須ではない
  • 高度なモデリングやニューラルネットワークに関する事前知識は期待されない

対象者

  • データサイエンティスト
  • ビジネスアナリスト
  • データを扱うソフトウェアエンジニアや技術者
 28 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (2)

今後のコース

関連カテゴリー