コース概要

導入

  • プロジェクト チームが採用する理由と方法 Hadoop
  • すべてはどのように始まったのか
  • Hadoop プロジェクトにおけるプロジェクト マネージャーの役割

Hadoop のアーキテクチャと主要な概念を理解する

  • HDFS
  • MapReduce
  • Hadoop エコシステムのその他の部分

Big Data を構成するものは何ですか?

保管に対するさまざまなアプローチ Big Data

基盤としての HDFS (Hadoop 分散ファイル システム)

Big Data の処理方法

  • 分散処理の力

MapReduce によるデータの処理

  • データを段階的に抽出する方法

大規模分散処理におけるクラスタリングの役割

  • アーキテクチャの概要
  • クラスタリングのアプローチ

YARN を使用したデータとプロセスのクラスタリング

Big Data ストレージにおける非リレーショナル Database の役割

Hadoop の非リレーショナル Database の操作: HBase

データ ウェアハウスのアーキテクチャの概要

Data Warehouse を Hive で管理する

シェルスクリプトから Hadoop を実行する

Hadoop ストリーミングの操作

その他 Hadoop ツールとユーティリティ

Hadoop プロジェクトの開始

  • 複雑さを解明する

既存のプロジェクトを Hadoop に移行する

  • インフラストラクチャに関する考慮事項
  • 割り当てられたリソースを超えて拡張する

Hadoop プロジェクトの関係者とそのツールキット

  • 開発者、データサイエンティスト、ビジネスアナリスト、プロジェクトマネージャー

Hadoop 新しいテクノロジーとアプローチの基盤として

閉会の辞

要求

  • プログラミングの一般的な理解
  • データベースに対する理解
  • Linuxに関する基本的な知識
 14 時間

参加者の人数



Price per participant

お客様の声 (3)

関連コース

Datameer for Data Analysts

14 時間

関連カテゴリー