コース概要

  1. ビッグデータの基礎
    • ビッグデータとその企業界での役割
    • 企業内のビッグデータ戦略の発展段階
    • 包括的なビッグデータアプローチの根拠を説明する
    • ビッグデータプラットフォームに必要なコンポーネント
    • ビッグデータのストレージソリューション
    • 従来技術の限界
    • データベースの種類の概要
    • ビッグデータの4つの次元
  2. ビッグデータのビジネスへの影響
    • ビッグデータのビジネスにおける重要性
    • 有用なデータを抽出する際の課題
    • 伝統的なデータとビッグデータの統合
  3. ビッグデータのストレージ技術
    • ビッグデータ技術の概要
      • データストレージモデル
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • 適切なビッグデータ技術の選択
  4. ビッグデータの処理
    • データベースからデータを接続して抽出する
    • データを処理のために変換と準備する
    • Hadoop MapReduceを使用した分散データの処理
    • Hadoop MapReduceジョブの監視と実行
    • Hadoop分散ファイルシステムの構成要素
    • MapReduceとYarn
    • Sparkを使用したストリーミングデータの処理
  5. ビッグデータ分析ツールと技術
    • Pig Latin言語を使用したHadoopプログラミング
    • Hiveを使用した大規模データのクエリ
    • Mahoutを使用したデータマイニング
    • 可視化とレポートツール
  6. ビッグデータとビジネス
    • ビッグデータのニーズを管理し、確立する
    • ビッグデータのビジネスにおける重要性
    • 問題に適した正しいビッグデータツールを選択する

データウェアハウスの概念

  • データウェアハウスとは何か?
  • OLTPとデータウェアハウスの違い
  • データ取得
  • データ抽出
  • データ変換
  • データロード
  • データマート
  • 依存型と非依存型のデータマート
  • データベース設計

ETLテストの概念:

  • 概要
  • ソフトウェア開発ライフサイクル
  • テスト手法
  • ETLテストワークフロープロセス
  • Data stageでのETLテストの責任範囲。

ビッグデータの基礎

  • ビッグデータとその企業界での役割
  • 企業内のビッグデータ戦略の発展段階
  • 包括的なビッグデータアプローチの根拠を説明する
  • ビッグデータプラットフォームに必要なコンポーネント
  • ビッグデータのストレージソリューション
  • 従来技術の限界
  • データベースの種類の概要

NoSQLデータベース

Hadoop

MapReduce

Apache Spark

要求

参加者は、ストレージツールに関する知識と経験を持ち、大規模なデータセットの取り扱いについての理解を持っていることが望まれます。

 14 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (1)

今後のコース

関連カテゴリー