コース概要

Stratioプラットフォームの紹介

  • Stratioアーキテクチャとコアモジュールの概要
  • データライフサイクルにおけるRocketとIntelligenceの役割
  • Stratio UIにログインし、ナビゲートする

Rocketモジュールでの作業

  • データの取り込みとパイプラインの作成
  • データソースの接続と変換の設定
  • Rocketでの前処理タスクにPySparkを使用する

Stratioユーザー向けのPySparkエッセンシャル

  • PySparkデータ構造と操作
  • ループ構造: for, while, if/else の使用
  • defを使用してカスタム関数を書くこととそれらの適用

PySparkを使用したRocketの高度な利用

  • ストリーミング取り込みと変換
  • バッチおよびリアルタイムシナリオでのループと関数の使用
  • PySparkパイプラインでのパフォーマンスに関するベストプラクティス

Intelligenceモジュールの探求

  • データモデリングと分析機能の概要
  • 特徴選択、変換、探索
  • カスタム分析と洞察でのPySparkの役割

高度なアナリティクスワークフローの構築

  • Intelligenceでユーザー定義関数(UDFs)を作成する
  • データロジックのために条件文とループを適用する
  • ケーススタディ: セグメンテーション、集計、予測

デプロイメントとコラボレーション

  • ワークフローの保存、エクスポート、再利用
  • Stratioでの他のチームメンバーとの協力
  • 出力の確認と下流ツールとの統合

まとめと次へのステップ

要求

  • Pythonプログラミングの経験
  • データ分析またはビッグデータ処理概念の理解
  • Apache Sparkと分散計算の基本的な知識

対象者

  • Stratioベースのプラットフォームで工作的するデータエンジニア
  • RocketとIntelligenceモジュールを使用するアナリストまたは開発者
  • Stratio内でのPySparkワークフローへの移行を計画している技術チーム
 14 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (4)

今後のコース

関連カテゴリー