Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
コース概要
導入:
- Apache Spark の Hadoop エコシステム
- Python、scala の短い紹介
基礎(理論):
- 建築
- RDD
- 変換とアクション
- ステージ、タスク、依存関係
Databricks 環境を使用して基本を理解します (ハンズオン ワークショップ):
- RDD APIを使った演習
- 基本的なアクションと変形機能
- ペアRDD
- 参加する
- キャッシュ戦略
- DataFrame APIを使用した演習
- スパークSQL
- データフレーム: 選択、フィルター、グループ化、並べ替え
- UDF (ユーザー定義関数)
- DataSet API の検討
- ストリーミング
AWS 環境を使用してデプロイメントを理解します (ハンズオン ワークショップ):
- AWS Glue の基本
- AWS EMR と AWS Glue の違いを理解する
- 両方の環境でのジョブの例
- 長所と短所を理解する
余分な:
- Apache Airflow オーケストレーションの概要
要求
プログラミングスキル(python、scalaが望ましい)
SQL 基本
21 時間
お客様の声 (3)
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
コース - Apache Spark in the Cloud
1. Right balance between high level concepts and technical details. 2. Andras is very knowledgeable about his teaching. 3. Exercise
Steven Wu - Intelligent Medical Objects
コース - Apache Spark in the Cloud
Get to learn spark streaming , databricks and aws redshift