コース概要

    機械学習の概要 機械学習の種類 – 教師あり学習と教師なし学習 統計学習から機械学習まで データ マイニング ワークフロー: ビジネスの理解 データの理解 データの準備 モデリング 評価 導入 機械学習アルゴリズム 問題に対する適切なアルゴリズムの選択 ML における過学習とバイアス分散のトレードオフライブラリとプログラミング言語 プログラミング言語を使用する理由 R と Python の選択 Python クラッシュ コース Python リソース 機械学習用の Python ライブラリ Jupyter ノートブックとインタラクティブ コーディング ML アルゴリズムのテスト 一般化と過学習 過学習の回避 ホールドアウト法 相互検証 ブートストラッピング 数値予測の評価 精度の尺度: ME、MSE、RMSE、MAPE パラメーターと予測の安定性 分類アルゴリズムの評価 精度とその問題 混同行列 不平衡クラスの問題 モデルのパフォーマンスの視覚化 利益曲線 ROC 曲線 リフト曲線 モデルの選択 モデルのチューニング – グリッド検索戦略 Python での例 データの準備 データのインポートと保存データを理解する – 基本的な探索 pandas ライブラリを使用したデータ操作 データ変換 – データ ラングリング 探索的分析 欠落した観測値 – 検出と解決策 外れ値 – 検出と戦略 標準化、正規化、二値化 定性的データの記録 Python での例 分類 バイナリ vs マルチクラス分類 数学関数による分類 線形判別関数 二次判別関数 ロジスティック回帰と確率アプローチ k 最近傍法 ナイーブ ベイズ デシジョン ツリー CART Bagging Random Forests Xgboost サポート ベクター マシンとカーネルのブースティング Maximal Margin Classifier サポート ベクター マシン アンサンブル学習 Python の例 回帰と数値予測 最小二乗推定 変数選択テクニック 正則化と安定性 - L1、L2 非線形性と一般化最小二乗 多項式回帰 回帰スプライン 回帰ツリー Python の例 教師なし学習 クラスタリング セントロイドベースのクラスタリング – k-means、k-medoids、PAM、CLARA 階層的クラスタリング – Diana、Agnes Model-ベースのクラスタリング - EM 自己組織化マップ クラスターの評価と評価 次元削減 主成分分析と因子分析 特異値分解 多次元尺度法 Python での例 テキスト マイニング データの前処理 バッグオブワード モデル ステミングとレム化 単語頻度の分析 センチメント分析 ワード クラウドの作成 例Python での推奨エンジンと協調フィルタリング 推奨データ ユーザーベースの協調フィルタリング アイテムベースの協調フィルタリング Python での例 関連パターンマイニング 頻度の高いアイテムセットアルゴリズム マーケットバスケット分析 Python での例 外れ値分析 極値分析 距離ベースの外れ値検出 密度ベースの手法 高-次元外れ値の検出 Python での例 機械学習のケーススタディ ビジネス上の問題の理解 データの前処理 アルゴリズムの選択とチューニング 結果の評価 導入

 

 

要求

0]基礎の知識と認識

 21 時間

参加者の人数



Price per participant

お客様の声 (3)

関連コース

関連カテゴリー