コース概要

[1。概要:

  • Big Dataとは何ですか
  • なぜBig Dataが人気を集めているのか
  • Big Data 事例紹介
  • Big Data 特徴
  • 取り組むべき解決策 Big Data。

Hadoop とそのコンポーネント:

  • Hadoop とは何か、またその構成要素は何ですか。
  • Hadoop アーキテクチャとその処理可能なデータ/プロセスの特性。
  • Hadoop 歴史、使用企業、使用を開始した理由についての概要。
  • Hadoop フレームワークとそのコンポーネント - 詳細に説明されています。
  • HDFS と Hadoop 分散ファイル システムへの読み取り/書き込みとは何ですか。
  • セットアップ方法 Hadoop さまざまなモードでのクラスター - スタンドアロン/擬似/マルチノード クラスター。

(これには、VirtualBox/KVM/VMware での Hadoop クラスターのセットアップ、慎重に調査する必要があるネットワーク構成、Hadoop デーモンの実行、クラスターのテストが含まれます)。

  • Map Reduce フレームワークとは何か、またその仕組み。
  • Hadoop クラスターで Map Reduce ジョブを実行しています。
  • Hadoop クラスターのコンテキストにおけるレプリケーション、ミラーリング、およびラックの認識を理解します。

Hadoop クラスター計画:

  • Hadoop クラスターを計画する方法。
  • Hadoop クラスターを計画するためのハードウェアとソフトウェアを理解します。
  • ワークロードを理解し、障害を回避して最適なパフォーマンスを実行するためにクラスターを計画します。

MapR とは何か、なぜ MapR を使用するのか:

  • MapR とそのアーキテクチャの概要。
  • MapR コントロール システム、MapR ボリューム、スナップショット、ミラーの理解と動作。
  • MapR のコンテキストでクラスターを計画します。
  • MapR と他のディストリビューションおよび Apache との比較 Hadoop。
  • MapR のインストールとクラスターの展開。

クラスターのセットアップと管理:

  • サービス、ノード、スナップショット、ミラー ボリューム、リモート クラスターの管理。
  • ノードの理解と管理。
  • Hadoop コンポーネントの理解、MapR Services と一緒に Hadoop コンポーネントをインストールする。
  • NFS 管理サービスおよびノード経由を含む、クラスター上のデータを Accessing します。
  • ボリュームを使用したデータの管理、ユーザーとグループの管理、ノードへのロールの管理と割り当て、ノードの廃止のコミッショニング、クラスター管理とパフォーマンスの監視、パフォーマンスを監視するためのメトリクスの構成/分析と監視、MapR セキュリティの構成と管理。
  • M7 - MapR テーブルのネイティブ ストレージの理解と操作。
  • 最適なパフォーマンスを実現するためのクラスターの構成とチューニング。

クラスターのアップグレードと他のセットアップとの統合:

  • MapR のソフトウェア バージョンのアップグレードとアップグレードの種類。
  • HDFS クラスターにアクセスするための Mapr クラスターの構成。
  • Amazon Elastic Mapreduce で MapR クラスターをセットアップします。

上記のすべてのトピックには、学習者がテクノロジーを実際に体験するためのデモンストレーションと練習セッションが含まれています。

要求

  • LinuxFSの基礎知識
  • Javaの基礎知識
  • ApacheHadoopの知識(推奨)
  28 時間
 

参加者の人数


開始

完了


Dates are subject to availability and take place between 10:00 and 17:00.
Open Training Courses require 5+ participants.

お客様の声 (1)

関連コース

Datameer for Data Analysts

  14 時間

関連カテゴリー