コース概要

インタロード

Dataiku Data Science Studio (DSS)のインストールと設定

  • Dataiku DSSのシステム要件
  • Apache HadoopとApache Sparkの統合設定
  • Webプロキシを使用したDataiku DSSの設定
  • 他のプラットフォームからDataiku DSSへの移行

Dataiku DSSの機能とアーキテクチャの概要

  • Dataiku DSSの基礎となる主要なオブジェクトとグラフ
  • Dataiku DSSでのレシピとは何か?
  • Dataiku DSSでサポートされるデータセットの種類

Dataiku DSSプロジェクトの作成

Dataiku DSSでデータリソースに接続するためのデータセットの定義

  • DSSコネクタとファイル形式の使用
  • 標準DSSフォーマットとHadoop固有のフォーマット
  • Dataiku DSSプロジェクト用にファイルをアップロードする

Dataiku DSSのサーバーファイルシステムの概要

マネージドフォルダの作成と使用

  • マージフォルダ用のDataiku DSSレシピ
  • ローカルと非ローカルマネージドフォルダ

マネージドフォルダのコンテンツを使用したファイルシステムデータセットの構築

  • DSSコードレシピを使用したクリーンアップの実行

メトリクスデータセットと内部統計データセットの使用

HTTPデータセット用のDSSダウンロードレシピの実装

SQLデータセットとHDFSデータセットの移動

Dataiku DSSでのデータセットの順序付け

  • Writer順序と読み取り時の順序

Dataiku DSSプロジェクトのためのデータビジュアルの探索と準備

Dataikuスキーマ、ストレージタイプ、および意味の概要

Dataiku DSSでのデータクリーニング、正規化、エンリッチメントスクリプトの実行

Dataiku DSSチャートインターフェースとビジュアル集約の種類の使用

Dataiku DSSのインタラクティブ統計機能の利用

  • 単変量分析と二変量分析
  • Principal Component Analysis (PCA) DSSツールの活用

Dataiku DSSでの機械学習の概要

  • 監督付きMLと非監督付きML
  • DSS MLアルゴリズムと特徴量ハンドリングの参照情報
  • Dataiku DSSでの深層学習

Dataiku DSSデータセットとレシピから派生したフローの概要

Dataiku DSSで既存のデータセットをビジュアルレシピで変換する

ユーザー定義コードに基づくDSSレシピの使用

DSSコードノートブックを使用したコード探索と実験の最適化

Webappsを使用して高度なDSSビジュアライゼーションとカスタムフロントエンド機能の作成

Dataiku DSSのコードレポート機能の使用

データプロジェクト要素の共有とDSSダッシュボードの操作

再利用可能なアプリケーションとしてDataiku DSSプロジェクトを設計およびパッケージ化する

Dataiku DSSでの高度な手法の概要

  • DSSを使用した最適化されたデータセット分割の実装
  • Kubernetesコンテナ内の計算を介して特定のDSS処理部分の実行

Dataiku DSSでのコラボレーションとバージョン管理の概要

DSSプロジェクトテストのための自動化シナリオ、メトリクス、チェックの実装

DSS自動化ノードとバンドルを使用したプロジェクトの展開と更新

Dataiku DSSでのリアルタイムAPIの使用

  • 追加のAPIとRest API in DSS

Dataiku DSS時系列データの分析と予測

Dataiku DSSプロジェクトの保護

  • プロジェクト権限とダッシュボード権限の管理
  • 高度なセキュリティオプションの実装

Dataiku DSSをクラウドとの統合

トラブルシューティング

要約と結論

要求

  • Python、SQL、Rプログラミング言語の経験
  • Apache HadoopとSparkでのデータ処理に関する基本的な知識
  • 機械学習概念とデータモデルの理解
  • 統計分析とデータサイエンス概念の背景
  • データのビジュアライゼーションとコミュニケーションに関する経験

対象者

  • エンジニア
  • データサイエンティスト
  • データアナリスト
 21 時間

参加者の人数


参加者1人当たりの料金

今後のコース

関連カテゴリー