コース概要

  1. ビッグデータの基礎
    • Big Data と企業社会におけるその役割
    • 企業内での Big Data 戦略の策定段階
    • Big Data に対する総合的なアプローチの基礎となる理論的根拠を説明します。
    • Big Data プラットフォームに必要なコンポーネント
    • ビッグデータストレージソリューション
    • 従来技術の限界
    • データベースの種類の概要
    • Big Data の 4 つの次元
  2. ビッグデータがビジネスに与える影響
    • Business Big Dataの重要性
    • 有用なデータを抽出する際の課題
    • ビッグデータと従来のデータの統合
  3. ビッグデータストレージテクノロジー
    • ビッグデータ技術の概要
      • データストレージモデル
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • 適切なビッグデータ テクノロジーの選択
  4. ビッグデータの処理
    • データベースに接続してデータを抽出する
    • 処理のためのデータの変換と準備
    • Hadoop MapReduce を使用した分散データの処理
    • Hadoop MapReduceジョブの監視と実行
    • Hadoop 分散ファイル システムの構成要素
    • Mapreduce と Yarn
    • Spark を使用したストリーミング データの処理
  5. ビッグデータ分析ツールとテクノロジー
    • Programming Hadoop ブタラテン語
    • Hive によるビッグデータのクエリ
    • Mahout によるデータのマイニング
    • 視覚化およびレポートツール
  6. ビジネスにおけるビッグデータ
    • Big Data ニーズの管理と確立
    • Business Big Dataの重要性
    • 問題に適したビッグデータ ツールを選択する

データ ウェアハウジングの概念

  • データ ウェアハウスとは何ですか?
  • OLTPとデータウェアハウジングの違い
  • データ収集
  • データ抽出
  • データ変換。
  • データのロード
  • データマート
  • 依存型データ マートと独立型データ マート
  • データベース設計

ETL テストの概念:

  • 導入。
  • ソフトウェア開発ライフサイクル。
  • テスト方法論。
  • ETL テストのワークフロー プロセス。
  • データ段階における ETL テストの責任。

ビッグデータの基礎

  • Big Data と企業社会におけるその役割
  • 企業内での Big Data 戦略の策定段階
  • Big Data に対する総合的なアプローチの基礎となる理論的根拠を説明します。
  • Big Data プラットフォームに必要なコンポーネント
  • ビッグデータストレージソリューション
  • 従来技術の限界
  • データベースの種類の概要

NoSQL Database

Hadoop

マップリデュース

Apache Spark

要求

受講者は、ストレージツールの使用経験や、大規模なデータセットの取り扱いに関する知識を有していることが望ましい。

  14 時間
 

参加者の人数


開始

完了


Dates are subject to availability and take place between 10:00 and 17:00.
Open Training Courses require 5+ participants.

お客様の声 (4)

関連コース

Unified Batch and Stream Processing with Apache Beam

  14 時間

Apache Apex: Processing Big Data-in-Motion

  21 時間

関連カテゴリー