コース概要

spar.mllib: データ型、アルゴリズム、およびユーティリティ

    データの種類 基本統計の概要 統計相関 層化サンプリング 仮説テスト ストリーミング有意性テスト ランダム データ生成
分類および回帰線形モデル (SVM、ロジスティック回帰、線形回帰)
  • ナイーブ・ベイズ
  • デシジョンツリー
  • ツリーのアンサンブル (Random Forest および勾配ブースト ツリー)
  • 等張回帰
  • 協調フィルタリング交互最小二乗法 (ALS)
  • K 平均法によるクラスタリング
  • 混合ガウス
  • べき乗反復クラスタリング (PIC)
  • 潜在ディリクレ配分 (LDA)
  • K 平均法を二等分する
  • K 平均法をストリーミングする
  • 次元削減特異値分解 (SVD)
  • 主成分分析 (PCA)
  • 特徴の抽出と変換
  • 頻繁なパターンマイニング FP-growth
  • 関連付けルール
  • プレフィックススパン
  • 評価指標
  • PMML モデルのエクスポート
  • 最適化 (開発者) 確率的勾配降下法
  • メモリ制限付き BFGS (L-BFGS)
  • smile.ml: ML パイプライン用の高レベル API
  • 概要: 推定器、変換器、パイプライン 特徴の抽出、変換、選択 分類と回帰 クラスタリング 高度なトピック

    要求

    以下のいずれかの知識

    • Java
    • Scala
    • パイソン
    • スパークR
     35 時間

    参加者の人数



    Price per participant

    お客様の声 (1)

    関連コース

    Big Data Analytics in Health

    21 時間

    関連カテゴリー