コース概要
導入
Dataiku Data Science Studio (DSS) のインストールと構成
- Dataiku DSS のシステム要件
- Apache Hadoop および Apache Spark 統合のセットアップ
- Web プロキシを使用した Dataiku DSS の構成
- 他のプラットフォームから Dataiku DSS への移行
Dataiku DSS の機能とアーキテクチャの概要
- Dataiku DSS の基礎となるコア オブジェクトとグラフ
- Dataiku DSS のレシピとは何ですか?
- Dataiku DSS でサポートされるデータセットの種類
Dataiku DSS プロジェクトの作成
Dataiku DSS でデータ リソースに接続するデータセットを定義する
- DSS コネクタとファイル形式の操作
- 標準 DSS 形式と Hadoop 固有の形式
- Dataiku DSS プロジェクトのファイルのアップロード
Dataiku DSS のサーバー ファイルシステムの概要
管理フォルダーの作成と使用
- Dataiku DSS マージフォルダーのレシピ
- ローカル管理フォルダーと非ローカル管理フォルダー
管理フォルダーの内容を使用したファイルシステム データセットの構築
- DSS コード レシピを使用したクリーンアップの実行
メトリクス データセットと内部統計データセットの操作
HTTP データセットの DSS ダウンロード レシピの実装
DSS を使用した SQL データセットと HDFS データセットの再配置
Dataiku DSS でのデータセットの注文
- ライターの順序と読み取り時の順序
Dataiku DSS プロジェクトのデータ ビジュアルの探索と準備
Dataiku スキーマ、ストレージの種類、および意味の概要
Dataiku DSS でのデータ クレンジング、正規化、強化スクリプトの実行
Dataiku DSS チャート インターフェイスと視覚的な集計の種類の操作
DSS のインタラクティブ Statistics 機能の利用
- 一変量解析と二変量解析
- 主成分分析 (PCA) DSS ツールの利用
Dataiku DSS を使用した Machine Learning の概要
- 教師あり ML と教師なし ML
- DSS ML アルゴリズムと機能の処理に関するリファレンス
- Deep Learning Dataiku DSS を使用
DSS データセットとレシピから派生するフローの概要
ビジュアル レシピを使用した DSS の既存のデータセットの変換
ユーザー定義コードに基づく DSS レシピの利用
DSS コード ノートブックを使用したコード探索と実験の最適化
Web アプリを使用した高度な DSS 視覚化とカスタム フロントエンド機能の作成
Dataiku DSS コード レポート機能の使用
データ プロジェクト Element を共有し、DSS ダッシュボードに慣れる
Dataiku DSS プロジェクトを再利用可能なアプリケーションとして設計およびパッケージ化する
Dataiku DSS の高度なメソッドの概要
- DSS を使用した最適化されたデータセットのパーティショニングの実装
- Kubernetes コンテナーでの計算による特定の DSS 処理部分の実行
Collaboration の概要と Dataiku DSS のバージョン管理
DSS プロジェクト テストの自動化シナリオ、メトリクス、チェックの実装
DSS 自動化ノードとバンドルを使用したプロジェクトのデプロイと更新
Dataiku DSS でのリアルタイム API の操作
- DSS の追加の API と REST API
分析とForecasting Dataiku DSS 時系列
Dataiku DSS でプロジェクトを保護する
- プロジェクト権限とダッシュボード権限の管理
- 高度なセキュリティ オプションの実装
Dataiku DSS とクラウドの統合
トラブルシューティング
要約と結論
要求
- Python、SQL、Rプログラミング言語の経験 。
- Apache HadoopおよびSparkを用いたデータ処理に関する基本的な知識 。
- 機械学習の概念とデータモデルの理解
- 統計分析とデータサイエンスの概念のバックグラウンド
- データの可視化とコミュニケーションの経験
観客
- エンジニア データサイエンティストデータアナリスト