コース概要

1週目: ビッグデータの概念

  • VVVV(Velocity, Volume, Variety, Veracity)の定義
  • 従来のデータ処理能力の限界
  • 分散処理
  • 統計解析
  • 機械学習の分析タイプ
  • データ可視化
  • 分散処理(例:マップ・リデュース)
  • 使用言語の紹介
  • R言語の入門
  • Pythonの入門

2週目&3週目: データ分析の実施

  • 統計解析
  • ビッグデータセットでの記述統計(例:平均値の計算)
  • 推測統計(推定)
  • 相関と回帰モデルによる予測
  • 時系列分析
  • 機械学習の基礎
  • 監督学習 vs 非監督学習
  • 分類とクラスタリング
  • 特定の方法のコスト推定
  • フィルタ

4週目: 自然言語処理

  • テキストの処理
  • テキストの意味理解
  • 自動的なテキスト生成
  • 感情/トピック分析
  • コンピュータビジョン

5週目&6週目: ツールの概念

  • データストレージ・ソリューション(SQL, NoSQL, 階層型, オブジェクト指向, ドキュメント指向)
  • MySQL, Cassandra, MongoDB, Elasticsearch, HDFS など
  • 問題に適した解決策の選択
  • 分散処理
  • Spark
  • Sparkを使用した機械学習(MLLib)
  • Spark SQL
  • スケーラビリティ
  • パブリッククラウド(AWS, Google など)
  • プライベートクラウド(OpenStack, Cloud Foundry)
  • 自動スケーリング

7週目: ソフトスキル

  • アドバイザリーやリーダーシップのスキル
  • 影響力を持つ:データに基づいたストーリーテリング
  • 聴衆の理解
  • 効果的なデータプレゼンテーション - メッセージを伝える方法
  • 影響力と変革のリーダーシップ
  • 難しい状況の対処法

試験

  • プログラム修了試験

要求

参加者は数学の基礎知識(少なくとも高校レベル)が必要です。

プログラミングスキルは必須ではありませんが、持っていると役立ちます。

参加者はこのトレーニングプログラムへの参加前に評価と面接が行われます。

 245 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (5)

今後のコース

関連カテゴリー