コース概要

ビッグデータの概要:

  • ビッグデータとは何か
  • ビッグデータが注目される理由
  • ビッグデータの事例
  • ビッグデータの特性
  • ビッグデータの処理方法

Hadoop とそのコンポーネント:

  • Hadoop とは何か、そのコンポーネントは何か。
  • Hadoop のアーキテクチャと処理可能なデータの特性
  • Hadoop の歴史、使用している企業、およびその導入理由
  • Hadoop フレームワークとそのコンポーネントの詳細解説
  • HDFS とは何か、Hadoop Distributed File System への読み書き操作
  • Stand-alone, Pseudo, Multi Node クラスターの構築方法

(これは VirtualBox/KVM/VMware 上での Hadoop クラスターの構築、注意すべきネットワーク設定、Hadoop デーモンの実行とクラスターのテストを含みます)

  • MapReduce フレームワークとは何か、その動作原理
  • Hadoop クラスター上で MapReduce ジョブの実行方法
  • Hadoop クラスターにおけるレプリケーション、ミラーリング、ラック認識の理解

Hadoop クラスタープランニング:

  • Hadoop クラスターの計画方法
  • Hadoop クラスターを計画するためのハードウェアとソフトウェアの理解
  • ワークロードの理解とクラスターの最適化、故障回避のための計画方法

MapR とは何か、なぜ MapR を使用するのか:

  • MapR の概要とアーキテクチャの解説
  • MapR Control System, MapR Volumes, スナップショット、ミラーの理解と操作方法
  • MapR のコンテキストでのクラスター計画
  • 他のディストリビューションや Apache Hadoop との比較
  • MapR インストールとクラスターデプロイメントの方法

クラスターのセットアップと管理:

  • サービス、ノード、スナップショット、ミラー ボリューム、およびリモートクラスターの管理
  • ノードの理解と管理方法
  • Hadoop コンポーネントの理解と MapR サービスとの併用インストール方法
  • NFS 経由でのクラスター上のデータアクセス、サービスとノードの管理
  • ボリュームを使用したデータの管理、ユーザーとグループの管理、ロールの割り当て、ノードのコミッション/デコミッション、クラスターマネージメントとパフォーマンス監視、メトリクスの設定/分析/監視によるパフォーマンス監視、MapR セキュリティの設定と管理
  • M7 - MapR テーブル用のネイティブストレージの理解と操作方法
  • 最適なパフォーマンスを実現するためのクラスターコンフィギュレーションとチューニング

クラスターのアップグレードと他のセットアップとの統合:

  • MapR のソフトウェアバージョンのアップグレード方法とアップグレードの種類
  • HDFS クラスターへのアクセスを設定するための MapR クラスターの構成方法
  • Amazon Elastic MapReduce 上での MapR クラスターのセットアップ方法

以上のすべてのトピックには、学習者が技術を実際に体験できるデモンストレーションと実践セッションが含まれています。

要求

  • Linux FS の基本的な知識
  • 基本的な Java 知識
  • Apache Hadoop の知識(推奨)
 28 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (1)

今後のコース

関連カテゴリー