コース概要

  • 第1節 Big DataとNoSQLの紹介
    • Big Data エコシステム
    • NoSQLの概要
    • CAPの定理
    • 5]が適切な場合
    • カラム型ストレージ
    • HBaseと[5]
  • セクション2:HBaseの紹介
    • コンセプトと設計
    • アーキテクチャ (HMaster と Region Server)
    • データの完全性
    • HBaseエコシステム
    • ラボ : HBaseの探索
  • セクション 3 : HBase データモデル
    • 名前空間、テーブル、リージョン
    • 行、カラム、カラムファミリー、バージョン
    • HBaseシェルと管理コマンド
    • ラボ : HBase シェル
  • セクション3 : Java APIを使ったHBaseのAccess化
    • 4] API の紹介
    • 読み書きパス
    • 時系列データ
    • スキャン
    • マップ・リデュース
    • フィルター
    • カウンタ
    • コプロセッサ
    • ラボ(複数):HBase Java APIを使って、時系列、Map Reduce、フィルタ、カウンタを実装する。
  • セクション4:HBaseスキーマ設計:グループセッション
    • 実際のユースケースを紹介
    • グループで設計ソリューションを考える
    • 複数の設計について議論/批評し、そこから学ぶ
    • 実習 : HBaseでシナリオを実装する
  • セクション 5 : HBase の内部
    • HBaseの内部を理解する
    • Memfile / HFile / WAL
    • HDFSストレージ
    • コンパクション
    • スプリット
    • ブルームフィルタ
    • キャッシュ
    • 診断
  • セクション 6 : HBase のインストールと設定
    • ハードウェアの選択
    • インストール方法
    • 一般的な構成
    • ラボ : HBaseのインストール
  • 第7節 : HBaseエコシステム
    • HBaseを使ったアプリケーションの開発
    • 他の Hadoop スタック (MapReduce, Pig, Hive) との相互作用
    • HBase周辺のフレームワーク
    • 高度な概念(コプロセッサ)
    • ラボ:HBaseアプリケーションの作成
  • セクション8:モニタリングとベストプラクティス
    • 監視ツールとプラクティス
    • HBaseの最適化
    • クラウドにおけるHBase
    • HBaseの実際の使用例
    • ラボ : HBaseのバイタルチェック

要求

  • Javaプログラミング言語に慣れていること
  • Javaプログラミング言語に慣れている(コマンドラインの操作Linux、vi / nanoによるファイルの編集)
  • EclipseやIntelliJのようなJava IDE

ラボの環境:

HBaseクラスタは学生用に提供される。学生はクラスタにアクセスするためにSSHクライアントとブラウザが必要です。

インストール不要:生徒のマシンにHBaseソフトウェアをインストールする必要はありません!

  21 時間
 

参加者の人数


開始

完了


Dates are subject to availability and take place between 10:00 and 17:00.
Open Training Courses require 5+ participants.

関連コース

A Practical Introduction to NoSQL Databases

  28 時間

関連カテゴリー