コース概要

概要

  • データソース
  • データを気にする
  • 推薦システム
  • ターゲットMarketing

データ型

  • 構造化と非構造化
  • 静的とストリーミング
  • 態度、行動、人口統計データ
  • データ主導型分析とユーザー主導型分析
  • データの有効性
  • データの量、速度、種類

モデル

  • モデルの構築
  • 統計モデル
  • 機械学習

データの分類

  • クラスタリング
  • kGroups、k-means、最近傍法
  • アリのコロニー、群がる鳥

予測モデル

  • ディシジョンツリー
  • サポートベクターマシン
  • ナイーブベイズ分類
  • ニューラルネットワーク
  • マルコフモデル
  • 回帰
  • アンサンブルメソッド

ROI

  • 利益/費用比
  • ソフトウェアのコスト
  • 開発コスト
  • 潜在的な利点

モデルの構築

  • データ準備 (MapReduce)
  • データクレンジング
  • 方法の選択
  • 開発モデル
  • テストモデル
  • モデルの評価
  • モデルの展開と統合

オープンソースと商用ソフトウェアの概要

  • Rプロジェクトパッケージの選択
  • Python ライブラリ
  • Hadoopと象使い
  • Big Data と Analytics に関連する選択された Apache プロジェクト
  • 選択された商用ソリューション
  • 既存のソフトウェアおよびデータソースとの統合

要求

0]、データウェアハウス、ビジネスインテリジェンス、OLAPなどの伝統的なデータ管理・分析手法を理解していること。基本的な統計と確率(平均、分散、確率、条件付き確率など)の理解

 21 時間

参加者の人数



Price per participant

お客様の声 (2)

関連コース

Unified Batch and Stream Processing with Apache Beam

14 時間

Apache Apex: Processing Big Data-in-Motion

21 時間