コース概要

導入

  • Spark の概要と Hadoop の機能とアーキテクチャ
  • ビッグデータを理解する
  • Python プログラミングの基礎

はじめる

  • Python、Spark、Hadoopの設定
  • Python のデータ構造を理解する
  • PySpark API を理解する
  • HDFS と MapReduce について

Spark と Hadoop を Python と統合する

  • Python の Spark RDD の実装
  • MapReduce を使用したデータの処理
  • HDFS での分散データセットの作成

Machine Learning Spark MLlib を使用した場合

Big DataをSpark Streamingで処理する

レコメンダー システムの使用

Kafka、Sqoop、Kafka、および Flume の操作

Apache Mahout と Spark および Hadoop

トラブルシューティング

概要と次のステップ

要求

  • SparkとHadoopの経験
  • Pythonプログラミング経験

観客

  • データサイエンティスト
  • 開発者
 21 時間

参加者の人数



Price per participant

お客様の声 (3)

関連コース

関連カテゴリー