お問い合わせを送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
予約を送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
コース概要
Apache Iceberg への導入
- Apache Iceberg の概要
- 基本概念の復習
Iceberg アーキテクチャへの深堀り
- Iceberg のテーブル形式に関する詳細分析
- メタデータとファイルレイアウトを含むアーキテクチャの全体像
- スキーマとパーティション進化の内部構造
高度なインストールと設定
- さまざまな環境での Iceberg の最適パフォーマンス設定
- 複数のデータ処理エンジンとの統合
- 高度な設定:セキュリティ、暗号化、アクセス制御
- 分散環境での Iceberg のセットアップ
高度な操作とメンテナンス
- 大規模な Iceberg テーブルの管理
- 複雑なスキーマ変更の実装と管理
- パーティション進化と隠れたパーティショニングの取り扱い
- スキーマとパーティション変更を伴う高度な CRUD 操作
クエリ最適化技術
- クエリのラティーンシーリダクト技術
- パーティションプルーニングとファイルプルーニング
- メタデータキャッシュと最適化戦略
- クエリ最適化技術の実装とテスト
大容量データセットのパフォーマンスチューニング
- 大規模データセット向けのパフォーマンス最適化
- Iceberg の組み込み機能を用いたパフォーマンスチューニング
- 実際のシナリオにおけるパフォーマンスチューニングの事例研究
- 大規模データセット向けのパフォーマンス最適化
高度なデータ移行と統合
- 他のシステムからの複雑なデータ構造の移行
- リアルタイムデータストリームとの Iceberg の統合
- 複雑なデータセットの移行とリアルタイムデータストリームの統合
信頼性と一貫性
- 分散環境でのデータの一貫性と整合性の確保
- トランザクショナル保証の実装と管理
- 障害処理と復旧メカニズム
- 信頼性と一貫性機能の実装
高度な機能とカスタマイズ
- カスタムカタログの実装
- Iceberg のカスタム機能の拡張
- カスタムカタログの実装と Iceberg 機能の拡張
データガバナンスとコンプライアンス
- データガバナンスポリシーの実装
- データ規制への準拠
- 审计追踪和数据血统的管理
- 治理とコンプライアンス機能の実装
まとめと次のステップ
要求
- コア概念、基本操作、Iceberg テーブル管理についての知識
対象者
- データエンジニア
- データアーキテクト
- データアナリスト
- ソフトウェア開発者
21 時間
お客様の声 (5)
ライブ例
Ahmet Bolat - Accenture Industrial SS
コース - Python, Spark, and Hadoop for Big Data
機械翻訳
非常に対話的...
Richard Langford
コース - SMACK Stack for Data Science
機械翻訳
実践的な内容で、講師の知識が豊富です
Chris Tan
コース - A Practical Introduction to Stream Processing
機械翻訳
Spark Streaming、Databricks、AWS Redshiftの学習を始めましょう
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
コース - Apache Spark in the Cloud
機械翻訳
練習課題
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
コース - Python and Spark for Big Data (PySpark)
機械翻訳