コース概要

Apache Iceberg への導入

  • Apache Iceberg の概要
  • 基本概念の復習

Iceberg アーキテクチャへの深堀り

  • Iceberg のテーブル形式に関する詳細分析
  • メタデータとファイルレイアウトを含むアーキテクチャの全体像
  • スキーマとパーティション進化の内部構造

高度なインストールと設定

  • さまざまな環境での Iceberg の最適パフォーマンス設定
  • 複数のデータ処理エンジンとの統合
  • 高度な設定:セキュリティ、暗号化、アクセス制御
  • 分散環境での Iceberg のセットアップ

高度な操作とメンテナンス

  • 大規模な Iceberg テーブルの管理
  • 複雑なスキーマ変更の実装と管理
  • パーティション進化と隠れたパーティショニングの取り扱い
  • スキーマとパーティション変更を伴う高度な CRUD 操作

クエリ最適化技術

  • クエリのラティーンシーリダクト技術
  • パーティションプルーニングとファイルプルーニング
  • メタデータキャッシュと最適化戦略
  • クエリ最適化技術の実装とテスト

大容量データセットのパフォーマンスチューニング

  • 大規模データセット向けのパフォーマンス最適化
  • Iceberg の組み込み機能を用いたパフォーマンスチューニング
  • 実際のシナリオにおけるパフォーマンスチューニングの事例研究
  • 大規模データセット向けのパフォーマンス最適化

高度なデータ移行と統合

  • 他のシステムからの複雑なデータ構造の移行
  • リアルタイムデータストリームとの Iceberg の統合
  • 複雑なデータセットの移行とリアルタイムデータストリームの統合

信頼性と一貫性

  • 分散環境でのデータの一貫性と整合性の確保
  • トランザクショナル保証の実装と管理
  • 障害処理と復旧メカニズム
  • 信頼性と一貫性機能の実装

高度な機能とカスタマイズ

  • カスタムカタログの実装
  • Iceberg のカスタム機能の拡張
  • カスタムカタログの実装と Iceberg 機能の拡張

データガバナンスとコンプライアンス

  • データガバナンスポリシーの実装
  • データ規制への準拠
  • 审计追踪和数据血统的管理
  • 治理とコンプライアンス機能の実装

まとめと次のステップ

要求

  • コア概念、基本操作、Iceberg テーブル管理についての知識

対象者

  • データエンジニア
  • データアーキテクト
  • データアナリスト
  • ソフトウェア開発者
 21 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (5)

今後のコース

関連カテゴリー