コース概要

導入

  • DatabricksとApache Sparkの概要。
  • Databricksアーキテクチャの理解。

開始方法

  • 環境の設定。
  • Databricksの設定と構成。
  • Databricksユーザーインターフェースのナビゲーション。
  • Databricksワークスペースの作成。

Databricksでのデータ操作

  • Apache Sparkデータソースへの接続。
  • 列とデータ型の基本理解。
  • Notebooksにファイルシステムを管理。

ジョブとクラスターの管理

  • クラスターの作成と構成。
  • Notebookを使用してジョブの作成。
  • ジョブの実行。
  • ジョブとジョブ詳細の表示。

DatabricksでDelta Lakeの使用

  • Delta Lakeへのデータロード。
  • Delta Lakeでのデータ管理。

Databricksのセキュリティ設定

  • Databricksセキュリティの管理。
  • バックアップと復旧の管理。

トラブルシューティング

まとめと次のステップ

要求

  • データ分析の基本的な理解。
  • Apache Sparkに関する知識。

対象者

  • データエンジニア。
  • データサイエンティスト。
  • 開発者。
 14 時間

参加者の人数


参加者1人当たりの料金

今後のコース

関連カテゴリー