コース概要
-
Scala 入門
- Scala の簡単な紹介
- 実習:Scala を使い始める
-
Spark 基礎
- 背景と歴史
- Spark と Hadoop
- Spark の概念とアーキテクチャ
- Spark エコシステム(Core, Spark SQL, MLlib, Streaming)
- 実習:Spark のインストールと実行
-
初めての Spark
- ローカルモードでの Spark 実行
- Spark Web UI
- Spark shell
- データセット分析 – 第1部
- RDD の検査
- 実習:Spark shell を使って探求する
-
RDDs
- RDD の概念
- パーティション
- RDD 操作 / 変換
- RDD タイプ
- キーバリュー型 RDDs
- RDD での MapReduce
- キャッシュと永続化
- 実習:RDD の作成と検査;RDD のキャッシング
-
Spark API プログラミング
- Spark API / RDD API の紹介
- 最初のプログラムを Spark に提出する
- デバッグとロギング
- 設定プロパティ
- 実習:Spark API を使用したプログラミング、ジョブの提出
-
Spark SQL
- Spark での SQL サポート
- Dataframes
- テーブルの定義とデータセットのインポート
- SQL を使用した Dataframe のクエリ実行
- ストレージ形式:JSON / Parquet
- 実習:Dataframes の作成とクエリ;データ形式の評価
-
MLlib
- MLlib への紹介
- MLlib アルゴリズム
- 実習:MLib アプリケーションの作成
-
GraphX
- GraphX ライブラリの概要
- GraphX API
- 実習:Spark を使用したグラフデータの処理
-
Spark ストリーミング
- ストリーミングの概要
- ストリーミングプラットフォームの評価
- ストリーミング操作
- スライディングウィンドウ操作
- 実習:Spark ストリーミングアプリケーションの作成
-
Spark と Hadoop
- Hadoop の概要(HDFS / YARN)
- Hadoop + Spark アーキテクチャ
- Hadoop YARN 上での Spark 実行
- Spark を使用した HDFS ファイルの処理
-
Spark のパフォーマンスとチューニング
- Broadcast variables(ブロードキャスト変数)
- Accumulators(アキュムレータ)
- メモリ管理とキャッシュ
-
Spark オペレーション
- 本番環境での Spark の展開
- サンプル展開テンプレート
- 設定
- 監視
- Troubleshooting(トラブルシューティング)
要求
前提知識:
Java / Scala / Python のいずれかの言語についての基本的な知識(実習は Scala と Python を使用します)
Linux 開発環境に関する基本的な理解(コマンドラインでの移動、VI や nano によるファイル編集)
お客様の声 (6)
異なる方法で似たような演習を行うことで、各コンポーネント(Hadoop/Spark、スタンドアロン/クラスター)が個別にそして組み合わせて何ができるのかを理解するのが本当に役立ちます。これは、開発時にローカルマシンでアプリケーションをテストする方法と、クラスターに展開した際のテスト方法についてのアイデアを与えてくれました。
Thomas Carcaud - IT Frankfurt GmbH
コース - Spark for Developers
機械翻訳
アジャイはとても親切で、役に立つだけでなく、話し合っていたトピックについても知識が豊富でした。
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
コース - Spark for Developers
機械翻訳
Ernesto did a great job explaining the high level concepts of using Spark and its various modules.
Michael Nemerouf
コース - Spark for Developers
機械翻訳
The trainer made the class interesting and entertaining which helps quite a bit with all day training.
Ryan Speelman
コース - Spark for Developers
機械翻訳
We know a lot more about the whole environment.
John Kidd
コース - Spark for Developers
機械翻訳
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.
Kieran Mac Kenna
コース - Spark for Developers
機械翻訳