コース概要

データタスク向けPythonの基礎

  • Pythonのインストールと開発環境のセットアップ。
  • 言語の基礎:変数、データ型、制御構造。
  • シンプルなPythonスクリプトの作成と実行。

ファイルハンドリング: CSVとExcel

  • csvモジュールとPandasを使用してCSVファイルを読み書きする。
  • openpyxl/xlrdとPandasを使用してExcelファイルを扱う。
  • 実践演習:ファイル変換の自動化。

Pandasの概要

  • DataFrameの基礎:作成、インデックス付け、選択、フィルタリング。
  • 集約とグループ化操作。
  • 一般的なクリーニング操作:欠損値、重複、型変換。

Polarsの概要

  • Pandasと比較したPolarsの概念とパフォーマンス特性。
  • Polarsでの基本的なDataFrame操作。
  • ユースケース例:PandasではなくPolarsを選択するタイミング。

高度なデータ変換(中級)

  • Pandasでの複雑な結合、ウィンドウ関数、ピボット操作。
  • Polarsでの効率的なデータ処理パターン。
  • 操作のチェインとメモリ使用量の最適化。

Pythonを使用したプロセス自動化

  • 反復的なデータタスクやETLステップを自動化するスクリプトの作成。
  • OSスケジューラーやタスクスケジューラーを使用してスクリプトのスケジュール設定。
  • ログ記録、エラーハンドリング、通知。

スクリプトのパッケージ化とベストプラクティス

  • PyInstallerや類似ツールを使用した実行可能ファイルの作成。
  • プロジェクト構造、仮想環境、依存関係管理。
  • バージョン管理の基礎とワークフローのドキュメント化。

手動ミニプロジェクト

  • エンドツーエンドタスク:生データを読み込み、クリーニングと変換を行い、出力を生成する。
  • ワークフローの自動化と実行可能なスクリプトまたは実行可能ファイルへのパッケージ化。
  • ピアフィードバックに基づいたレビューと改善。

まとめと次なるステップ

要求

  • プログラミング概念に基本的な理解があること、または学ぶ意欲があること。
  • パッケージのインストールに使用するコマンドラインやターミナルを快適に使用できること。
  • スプレッドシート(CSV/Excel)を使用した経験。

対象者

  • データタスクを自動化するデータアナリストとオペレーションスタッフ。
  • 軽量なETLスクリプティングを行う解析エンジニア。
  • 実用的なPythonベースのデータワークフローに興味がある専門家。
 14 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (5)

今後のコース

関連カテゴリー