コース概要

導入

分散コンピューティングの原則

    アパッチスパーク Hadoop

Data Serializationの原則

    データ オブジェクトがネットワーク上でどのように渡されるか オブジェクトのシリアル化 シリアル化のアプローチ Thrift プロトコル バッファ Apache Avro データ構造のサイズ、速度、形式の特性 永続的なデータ ストレージ 動的言語との統合 動的型付けスキーマ タグなしデータ変更管理

Data Serialization と分散コンピューティング

    Hadoop のサブプロジェクトとしての Avro Java シリアル化 Hadoop シリアル化 Avro シリアル化

Avro を使用して

    Hive (AvroSerDe) 豚 (AvroStorage)

既存の RPC フレームワークの移植

要約と結論

要求

  • 分散コンピューティングに精通していること
 14 時間

参加者の人数



Price per participant

お客様の声 (3)

関連コース

Datameer for Data Analysts

14 時間