お問い合わせを送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
予約を送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
コース概要
データタスク向けPythonの基礎
- Pythonのインストールと開発環境のセットアップ。
- 言語の基礎:変数、データ型、制御構造。
- シンプルなPythonスクリプトの作成と実行。
ファイルハンドリング: CSVとExcel
- csvモジュールとPandasを使用してCSVファイルを読み書きする。
- openpyxl/xlrdとPandasを使用してExcelファイルを扱う。
- 実践演習:ファイル変換の自動化。
Pandasの概要
- DataFrameの基礎:作成、インデックス付け、選択、フィルタリング。
- 集約とグループ化操作。
- 一般的なクリーニング操作:欠損値、重複、型変換。
Polarsの概要
- Pandasと比較したPolarsの概念とパフォーマンス特性。
- Polarsでの基本的なDataFrame操作。
- ユースケース例:PandasではなくPolarsを選択するタイミング。
高度なデータ変換(中級)
- Pandasでの複雑な結合、ウィンドウ関数、ピボット操作。
- Polarsでの効率的なデータ処理パターン。
- 操作のチェインとメモリ使用量の最適化。
Pythonを使用したプロセス自動化
- 反復的なデータタスクやETLステップを自動化するスクリプトの作成。
- OSスケジューラーやタスクスケジューラーを使用してスクリプトのスケジュール設定。
- ログ記録、エラーハンドリング、通知。
スクリプトのパッケージ化とベストプラクティス
- PyInstallerや類似ツールを使用した実行可能ファイルの作成。
- プロジェクト構造、仮想環境、依存関係管理。
- バージョン管理の基礎とワークフローのドキュメント化。
手動ミニプロジェクト
- エンドツーエンドタスク:生データを読み込み、クリーニングと変換を行い、出力を生成する。
- ワークフローの自動化と実行可能なスクリプトまたは実行可能ファイルへのパッケージ化。
- ピアフィードバックに基づいたレビューと改善。
まとめと次なるステップ
要求
- プログラミング概念に基本的な理解があること、または学ぶ意欲があること。
- パッケージのインストールに使用するコマンドラインやターミナルを快適に使用できること。
- スプレッドシート(CSV/Excel)を使用した経験。
対象者
- データタスクを自動化するデータアナリストとオペレーションスタッフ。
- 軽量なETLスクリプティングを行う解析エンジニア。
- 実用的なPythonベースのデータワークフローに興味がある専門家。
14 時間
お客様の声 (2)
各トピックについてより深く理解するのに、実践的な演習が大いに役立ちます。また、授業を講義で始め、その後実践的な演習を続けていくスタイルは、先に呈示された講義内容と関連付ける上で非常に役立つし、助けになります。
Nazeera Mohamad - Ministry of Science, Technology and Innovation
コース - Introduction to Data Science and AI using Python
機械翻訳
ドメインに完全適応された例題・練習問題
Luc - CS Group
コース - Scaling Data Analysis with Python and Dask
機械翻訳