Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
コース概要
はじめに
- アナリティクスと機械学習におけるデータ準備の重要性を理解する
- データ準備パイプラインとデータライフサイクルにおける役割
- 生データに共通する課題と分析への影響を探る
データの収集と取得
- データソース:データベース、API、スプレッドシート、テキストファイルなど
- データ収集のテクニックと収集中のデータ品質の確保
- 様々なソースからのデータ収集
Data Cleaning テクニック
- 欠損値、外れ値、不整合の特定と処理
- データセット内の重複やエラーへの対処
- 実世界のデータセットのクリーニング
データの変換と標準化
- データの正規化と標準化のテクニック
- カテゴリーデータの取り扱い:エンコーディング、ビニング、フィーチャーエンジニアリング
- 生データを使用可能な形式に変換する
Data Integrationと集約
- 異なるソースからのデータセットのマージと結合
- データ競合の解決とデータタイプの整合
- データ集約と統合のテクニック
Data Quality 保証
- プロセス全体を通してデータの品質と完全性を保証する方法
- 品質チェックと検証手順の実施
- データ品質保証のケーススタディと実践的アプリケーション
次元削減と特徴選択
- 次元削減の必要性の理解
- PCA、特徴選択、削減戦略などのテクニック
- 次元削減技術の実装
まとめと次のステップ
要求
- データの概念の基本的な理解
観客
- データ アナリスト Database 管理者 IT プロフェッショナル
14 時間
お客様の声 (2)
wiedza, wzorcowe prowadzenie szkolenia
Krzysztof Kantorski - Santander
コース - Oracle GoldenGate
1 対 1 ベースで対話し、議論された概念を明確に理解できるようにする能力。
Dave - Sea
コース - Data Architecture Fundamentals
Machine Translated