コース概要

簡単な概要

  • データソース
  • データ管理
  • レコメンデーションシステム
  • ターゲットマーケティング

データタイプ

  • 構造化と非構造化
  • 静的とストリーミング
  • 態度、行動、人口統計データ
  • データ駆動型とユーザー駆動型分析
  • データの有効性
  • データのボリューム、速度、多様性

モデル

  • モデル構築
  • 統計的モデル
  • 機械学習

データ分類

  • クラスタリング
  • kグループ、k平均法、最近傍法
  • アリのコロニー、鳥の群れ飛行

予測モデル

  • 決定木
  • サポートベクターマシン
  • ナイーブベイズ分類
  • ニューラルネットワーク
  • マルコフモデル
  • 回帰分析
  • アンサンブル方法

ROI(投資対効果)

  • 利益/コスト比率
  • ソフトウェアのコスト
  • 開発のコスト
  • 潜在的な利点

モデル構築

  • データ準備(MapReduce)
  • データクリーニング
  • 方法選択
  • モデル開発
  • モデルテスト
  • モデル評価
  • モデル展開と統合

オープンソースおよび商用ソフトウェアの概要

  • Rプロジェクトパッケージの選択
  • Pythonライブラリ
  • HadoopとMahout
  • ビッグデータと分析に関連する選択されたApacheプロジェクト
  • 選択された商用ソリューション
  • 既存のソフトウェアやデータソースとの統合

要求

従来のデータ管理と分析方法(SQL、データウェアハウス、ビジネスインテリジェンス、OLAPなど)の理解。基本的な統計と確率(平均、分散、確率、条件付き確率など)の理解。

 21 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (2)

今後のコース

関連カテゴリー