コース概要
インタロード
Dataiku Data Science Studio (DSS)のインストールと設定
- Dataiku DSSのシステム要件
- Apache HadoopとApache Sparkの統合設定
- Webプロキシを使用したDataiku DSSの設定
- 他のプラットフォームからDataiku DSSへの移行
Dataiku DSSの機能とアーキテクチャの概要
- Dataiku DSSの基礎となる主要なオブジェクトとグラフ
- Dataiku DSSでのレシピとは何か?
- Dataiku DSSでサポートされるデータセットの種類
Dataiku DSSプロジェクトの作成
Dataiku DSSでデータリソースに接続するためのデータセットの定義
- DSSコネクタとファイル形式の使用
- 標準DSSフォーマットとHadoop固有のフォーマット
- Dataiku DSSプロジェクト用にファイルをアップロードする
Dataiku DSSのサーバーファイルシステムの概要
マネージドフォルダの作成と使用
- マージフォルダ用のDataiku DSSレシピ
- ローカルと非ローカルマネージドフォルダ
マネージドフォルダのコンテンツを使用したファイルシステムデータセットの構築
- DSSコードレシピを使用したクリーンアップの実行
メトリクスデータセットと内部統計データセットの使用
HTTPデータセット用のDSSダウンロードレシピの実装
SQLデータセットとHDFSデータセットの移動
Dataiku DSSでのデータセットの順序付け
- Writer順序と読み取り時の順序
Dataiku DSSプロジェクトのためのデータビジュアルの探索と準備
Dataikuスキーマ、ストレージタイプ、および意味の概要
Dataiku DSSでのデータクリーニング、正規化、エンリッチメントスクリプトの実行
Dataiku DSSチャートインターフェースとビジュアル集約の種類の使用
Dataiku DSSのインタラクティブ統計機能の利用
- 単変量分析と二変量分析
- Principal Component Analysis (PCA) DSSツールの活用
Dataiku DSSでの機械学習の概要
- 監督付きMLと非監督付きML
- DSS MLアルゴリズムと特徴量ハンドリングの参照情報
- Dataiku DSSでの深層学習
Dataiku DSSデータセットとレシピから派生したフローの概要
Dataiku DSSで既存のデータセットをビジュアルレシピで変換する
ユーザー定義コードに基づくDSSレシピの使用
DSSコードノートブックを使用したコード探索と実験の最適化
Webappsを使用して高度なDSSビジュアライゼーションとカスタムフロントエンド機能の作成
Dataiku DSSのコードレポート機能の使用
データプロジェクト要素の共有とDSSダッシュボードの操作
再利用可能なアプリケーションとしてDataiku DSSプロジェクトを設計およびパッケージ化する
Dataiku DSSでの高度な手法の概要
- DSSを使用した最適化されたデータセット分割の実装
- Kubernetesコンテナ内の計算を介して特定のDSS処理部分の実行
Dataiku DSSでのコラボレーションとバージョン管理の概要
DSSプロジェクトテストのための自動化シナリオ、メトリクス、チェックの実装
DSS自動化ノードとバンドルを使用したプロジェクトの展開と更新
Dataiku DSSでのリアルタイムAPIの使用
- 追加のAPIとRest API in DSS
Dataiku DSS時系列データの分析と予測
Dataiku DSSプロジェクトの保護
- プロジェクト権限とダッシュボード権限の管理
- 高度なセキュリティオプションの実装
Dataiku DSSをクラウドとの統合
トラブルシューティング
要約と結論
要求
- Python、SQL、Rプログラミング言語の経験
- Apache HadoopとSparkでのデータ処理に関する基本的な知識
- 機械学習概念とデータモデルの理解
- 統計分析とデータサイエンス概念の背景
- データのビジュアライゼーションとコミュニケーションに関する経験
対象者
- エンジニア
- データサイエンティスト
- データアナリスト