コース概要

はじめに

  • アナリティクスと機械学習におけるデータ準備の重要性を理解する
  • データ準備パイプラインとデータライフサイクルにおける役割
  • 生データに共通する課題と分析への影響を探る

データの収集と取得

  • データソース:データベース、API、スプレッドシート、テキストファイルなど
  • データ収集のテクニックと収集中のデータ品質の確保
  • 様々なソースからのデータ収集

Data Cleaning テクニック

  • 欠損値、外れ値、不整合の特定と処理
  • データセット内の重複やエラーへの対処
  • 実世界のデータセットのクリーニング

データの変換と標準化

  • データの正規化と標準化のテクニック
  • カテゴリーデータの取り扱い:エンコーディング、ビニング、フィーチャーエンジニアリング
  • 生データを使用可能な形式に変換する

Data Integrationと集約

  • 異なるソースからのデータセットのマージと結合
  • データ競合の解決とデータタイプの整合
  • データ集約と統合のテクニック

Data Quality 保証

  • プロセス全体を通してデータの品質と完全性を保証する方法
  • 品質チェックと検証手順の実施
  • データ品質保証のケーススタディと実践的アプリケーション

次元削減と特徴選択

  • 次元削減の必要性の理解
  • PCA、特徴選択、削減戦略などのテクニック
  • 次元削減技術の実装

まとめと次のステップ

要求

    データの概念の基本的な理解

観客

    データ アナリスト Database 管理者 IT プロフェッショナル
 14 時間

参加者の人数



Price per participant

お客様の声 (2)

関連コース

関連カテゴリー