コース概要

  • セクション 1: Big Data と NoSQL の紹介
    • Big Data エコシステム
    • NoSQL 概要
    • CAP 理論
    • NoSQL が適切な場合
    • カラム指向のストレージ
    • HBase と NoSQL
  • セクション 2: HBase の紹介
    • 概念と設計
    • アーキテクチャ (HMaster と Region Server)
    • データの整合性
    • HBase エコシステム
    • ラボ: HBase の探索
  • セクション 3: HBase データモデル
    • ネームスペース、テーブル、リージョン
    • 行、列、カラムファミリー、バージョン
    • HBase シェルと管理コマンド
    • ラボ: HBase シェルの使用
  • セクション 3: Java API を使用した HBase アクセス
    • Java API の紹介
    • 読み取り/書き込みパス
    • 時系列データ
    • スキャン
    • MapReduce
    • フィルタ
    • カウンタ
    • コプロセッサ
    • ラボ (複数): Java API を使用した時系列データ、MapReduce、フィルタ、カウンタの実装
  • セクション 4: HBase スキーマ設計: グループセッション
    • 学生に実際のユースケースを提示
    • 学生がグループで設計ソリューションを作成
    • 複数のデザインを議論/評価し、学習
    • ラボ: HBase でのシナリオ実装
  • セクション 5: HBase 内部構造
    • HBase の内部を理解する
    • Memfile / HFile / WAL
    • HDFS ストレージ
    • コンパクション
    • スプリット
    • Bloom フィルタ
    • キャッシュ
    • 診断
  • セクション 6: HBase のインストールと設定
    • ハードウェア選択
    • インストール方法
    • 一般的な設定
    • ラボ: HBase のインストール
  • セクション 7: HBase エコシステム
    • HBase を使用したアプリケーション開発
    • 他の Hadoop スタック (MapReduce, Pig, Hive) との連携
    • HBase 周辺のフレームワーク
    • 高度な概念 (コプロセッサ)
    • ラボ: HBase アプリケーションの作成
  • セクション 8: 監視とベストプラクティス
    • 監視ツールと手法
    • HBase の最適化
    • クラウド上の HBase
    • HBase の実際のユースケース
    • ラボ: HBase の健康状態確認

要求

  • Java 言語に習熟していること
  • Linux コマンドラインの操作や vi/nano でのファイル編集が可能なこと
  • EclipseIntelliJ のような Java IDE

ラボ環境:

学生用の動作している HBase クラスターが提供されます。学生は SSH クライアントとブラウザを使用してクラスターにアクセスします。

ゼロインストール: 学生のマシンに HBase ソフトウェアをインストールする必要はありません!

 21 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (5)

今後のコース

関連カテゴリー