データサイエンスチームのための Jupyterのトレーニングコース
Jupyter はオープンソースで、ウェブベースの対話型 IDE および計算環境です。
このインストラクター主導の実践的なトレーニング(オンラインまたはオンサイト)では、データサイエンスにおける共同開発の概念を紹介し、Jupyter を使用して「計算アイデアのライフサイクル」にチームとして参加し、追跡する方法を示します。このトレーニングでは、参加者に対して Jupyter エコシステムに基づいたサンプルデータサイエンスプロジェクトの作成方法を説明します。
本トレーニングの終了時には、参加者は以下のことができるようになります:
- Jupyter のインストールと設定を行い、Git でのチームリポジトリの作成と統合を行う。
- Jupyter の拡張機能、対話型ウィジェット、マルチユーザーモードなどの機能を使用してプロジェクトの共同開発を可能にする。
- チームメンバーと一緒に Jupyter Notebook を作成、共有、整理する。
- Scala, Python, R などを使用してコードを記述および実行し、Apache Spark のようなビッグデータシステムと Jupyter インターフェースを通じて統合する。
コースの形式
- 対話型講義とディスカッション。
- 多くの演習と練習。
- ライブラボ環境での実践的な実装。
コースのカスタマイズオプション
- Jupyter Notebook は R, Python, Scala, Julia など、40 種類以上の言語をサポートしています。このコースを希望する言語にカスタマイズする場合は、ご連絡ください。
コース概要
Jupyter 入門
- Jupyter とそのエコシステムの概要
- インストールとセットアップ
- チーム共同作業用に Jupyter を設定する
共同開発機能
- Git を使用したバージョン管理
- 拡張機能と対話型ウィジェットの利用
- マルチユーザーモード
Notebook の作成と管理
- Notebook の構造と機能
- Notebook の共有と整理
- 共同開発のためのベストプラクティス
Jupyter でのプログラミング
- 言語選択と使用方法 (Python, R, Scala)
- コードの記述と実行
- ビッグデータシステム (Apache Spark) との統合
高度な Jupyter 機能
- Jupyter 環境のカスタマイズ
- Jupyter を使用したワークフローの自動化
- 高度なユースケースの探索
実践セッション
- 手動ラボ
- リアルワールドのデータサイエンスプロジェクト
- グループ演習とピアレビュー
まとめと次回へのステップ
要求
- Python, R, Scala などのプログラミング言語の経験。
- データサイエンスに関するバックグラウンド。
対象者
- データサイエンスチーム
オープントレーニングコースには5人以上が必要です。
データサイエンスチームのための Jupyterのトレーニングコース - 予約
データサイエンスチームのための Jupyterのトレーニングコース - お問い合わせ
データサイエンスチームのための Jupyter - コンサルティングお問い合わせ
お客様の声 (1)
このコースが、事前アンケートで私が強調した重要な領域に合わせてカスタマイズされているのは素晴らしいことです。これにより、私の持つ疑問を解決し、学習目標と一致させることが本当に役立ちます。
Winnie Chan - Statistics Canada
コース - Jupyter for Data Science Teams
機械翻訳
今後のコース
関連コース
Pythonを活用したデータサイエンスとAIの入門
35 時間Pythonを用いたデータサイエンスとAIの実践的なアプローチを深く掘り下げ、ビジネスの文脈でデータを探索し、機械学習モデルを構築し、AI駆動のアプリケーションを展開するスキルを専門家に備えさせます。CRISP-DMワークフロー、統計分析、教師あり・教師なし学習、Tensorflowによる深層学習、自然言語処理、Sparkを活用したビッグデータ、データドリブンなストーリーテリングをカバーします。Pythonのデータサイエンス認定資格を目指し、キャリアに直結する分析研修を求める初心者にとって理想的な課程です。
データサイエンスのための Apache Airflow: 機械学習パイプラインの自動化
21 時間このインストラクター主導のライブトレーニング(オンラインまたはオンサイト)は、中級レベルの参加者向けに設計されており、機械学習ワークフローの自動化と管理、モデル訓練、検証、展開を Apache Airflow を使用して行うことを目指しています。
このトレーニング終了時には、参加者は以下のことが Able to できます:
- 機械学習ワークフローのオーケストレーションのために Apache Airflow を設定する。
- データ前処理、モデル訓練、検証タスクを自動化する。
- 機械学習フレームワークやツールと Airflow を統合する。
- 自動パイプラインを使用して機械学習モデルを展開する。
- 生産環境での機械学習ワークフローの監視と最適化を行う。
データサイエンティストのためのAnacondaエコシステム
14 時間このインストラクター主導のライブトレーニング(オンラインまたはオンサイト)は、Anacondaエコシステムを使用してパッケージとデータ分析ワークフローを単一のプラットフォームで管理および展開したいデータサイエンティスト向けです。
このトレーニング終了時には、参加者は以下のことが Able to:
- Anacondaのコンポーネントやライブラリをインストールし設定する。
- Anacondaのコア概念、機能、および利点を理解する。
- Anaconda Navigatorを使用してパッケージ、環境、チャネルを管理する。
- Conda、R、Pythonパッケージをデータサイエンスと機械学習に使用する。
- 複数のデータ環境を管理するための実践的なユースケースやテクニックについて知る。
AWS Cloud9 for Data Science
28 時間このインストラクター主導の実践的なトレーニング(オンラインまたはオンサイト)は、AWS Cloud9を使用して効率的なデータサイエンスワークフローを構築したい中級レベルのデータサイエンティストとアナリスト向けです。
このトレーニング終了時には、参加者は以下のことをできるようになります:
- AWS Cloud9でのデータサイエンス環境の設定
- Python、R、およびJupyter Notebookを使用してデータ分析を行う
- S3、RDS、RedshiftなどのAWSデータサービスとの統合
- AWS Cloud9を使用した機械学習モデルの開発と展開
- データ分析と処理のためのクラウドベースワークフローの最適化
Google Colab を使用したデータサイエンスの入門
14 時間このインストラクター主導のライブトレーニング(オンラインまたはオンサイト)は、Google Colab を使用してデータサイエンスの基本を学びたい初心者向けのデータサイエンティストと IT 専門家を対象としています。
このトレーニング終了時には、参加者は以下のことができるようになります:
- Google Colab の設定とナビゲーションを行う。
- 基本的な Python コードを記述および実行する。
- データセットのインポートと操作を行う。
- Python のライブラリを使用して可視化を作成する。
マーケティング・セールス専門家向けデータサイエンス
21 時間このコースは、マーケティングや営業でデータサイエンスをより深く活用したいと考えているマーケティング・セールスの専門家向けに設計されています。このコースでは、「アップセル」、「クロスセル」、市場セグメンテーション、ブランド構築、CLV(顧客生涯価値)など、さまざまなデータサイエンステクニックについて詳細な解説を提供します。
マーケティングと営業の違い - 営業とマーケティングはどのように異なるのでしょうか?
簡単に言えば、営業は個人や小さなグループを対象とするプロセスです。一方、マーケティングはより大きな集団や一般大衆を対象としています。マーケティングには、顧客のニーズを特定するリサーチ、革新的な製品を開発すること、広告を通じた製品のプロモーション、そして消費者への製品認知度向上が含まれます。つまり、マーケティングはリードや見込み顧客の生成を意味します。製品が市場に出ると、営業担当者の役割は顧客に製品を購入させるために説得することです。営業はリードや見込み顧客を購入や注文に変えることを目指し、マーケティングは長期的な目標に対応するのに対し、営業は短期的な目標に関連しています。
Kaggle
14 時間このインストラクター主導のライブトレーニング(オンラインまたはオンサイト)は、Kaggleを使用してデータサイエンスのキャリアを学びたいと考えているデータサイエンティストや開発者向けです。
このトレーニング終了時には、参加者は以下のことが able to できます:
- データサイエンスと機械学習について学ぶ。
- データ分析を探索する。
- Kaggleとその機能について学ぶ。
KNIME アナリティクスプラットフォームを用いたデータサイエンス
21 時間KNIME Analytics Platform は、データ駆動型イノベーションのための主要なオープンソースオプションであり、データに隠された可能性を見出し、新しい洞察を得たり、将来を予測したりするのに役立ちます。1000以上のモジュール、数百の実行可能な例、幅広い統合ツール、そして利用できる最先端のアルゴリズムが最も豊富な KNIME Analytics Platform は、データサイエンティストやビジネスアナリストにとって理想的なツールボックスです。
この KNIME Analytics Platform のコースは、初心者、上級ユーザー、KNIME 専門家向けの理想的な機会です。KNIME に初めて触れる方々が効果的に使用し、KNIME ワークフローに基づく明確で包括的なレポートを作成する方法を学ぶことができます。
この講師主導のライブトレーニング(オンラインまたはオンサイト)は、KNIME を使用して複雑なビジネスニーズを解決したいデータプロフェッショナル向けです。
プログラミングの知識がない方でも、最先端のツールを使用してアナリティクシナリオを実装する方法を学ぶことができます。
このトレーニングの終了時には、参加者は以下のことが Able になります:
- KNIME のインストールと設定
- データサイエンシナリオの構築
- モデルの学習、テスト、検証
- データサイエンスモデルのエンドツーエンドバリューチェーンの実装
コース形式
- インタラクティブな講義とディスカッション。
- 多数の演習と実践。
- ライブラボ環境での手動実装。
コースカスタマイズオプション
- このコースのカスタマイズトレーニングを依頼するか、このプログラムに関する詳細情報を知りたい場合は、ご連絡ください。
Pythonを使用したデータサイエンスのための機械学習
21 時間この講師主導のライブトレーニング(オンラインまたはオンサイト)は、中級レベルのデータアナリスト、開発者、またはデータサイエンティストを目指している人々向けです。参加者はPythonを使用して機械学習技術を適用し、洞察を得たり、予測を行ったり、データ駆動型の意思決定を自動化する方法を学びます。
このコース終了時には、参加者は以下のことをできるようになります:
- 主要な機械学習パラダイムを理解し、区別することができます。
- データ前処理技術とモデル評価指標を探索できます。
- 実世界のデータ問題に機械学習アルゴリズムを適用できます。
- PythonライブラリやJupyterノートブックを使用して手動開発を行えます。
- 予測、分類、推薦、クラスタリング用のモデルを作成できます。
Modinを使用してPython Pandasワークフローを加速
14 時間この講師主導のライブトレーニング(オンラインまたはオンサイト)は、Modinを使用して並列計算を構築および実装し、高速なデータ分析を行うことを目指すデータサイエンティストや開発者向けです。
このトレーニング終了時には、参加者は以下のことが Able to:
- 必要な環境を設定して、Modinを使用してスケールアウトするPandasワークフローの開発を開始します。
- Modinの機能、アーキテクチャ、および優位性を理解します。
- Modin、Dask、およびRayの違いを知ります。
- Modinを使用してPandas操作を高速に行います。
- 全Pandas APIと関数を実装します。
事前学習済みモデルの導入
14 時間本講座は、オンラインまたはオンサイトでのインストラクター主導のライブトレーニングです。事前学習済みモデルの概念を理解し、ゼロからモデルを構築せずに実際の問題を解決する方法を学びたい初級レベルのプロフェッショナル向けです。
このトレーニング終了時には、参加者は以下のことをできるようになります:
- 事前学習済みモデルの概念と利点を理解します。
- さまざまな事前学習済みモデルのアーキテクチャとそのユースケースを探求します。
- 特定のタスクに向けた事前学習済みモデルの微調整を行います。
- 単純な機械学習プロジェクトで事前学習済みモデルを実装します。
Pythonを用いた金融プログラミング
35 時間Pythonは、金融業界で大きな人気を得ているプログラミング言語です。大手投資銀行やヘッジファンドでも採用され、コアの取引プログラムからリスク管理システムまで、多様な金融アプリケーションの開発に使用されています。
この講師主導の実践的なトレーニングでは、参加者はPythonを用いて具体的な金融問題を解決するための実践的なアプリケーションを開発する方法を学びます。
本トレーニング終了時には、参加者は以下のことが Able to できます:
- Pythonプログラミング言語の基本を理解する
- 金融アプリケーションの開発に最適なツールのダウンロード、インストール、メンテナンスを行う
- さまざまなソース(CSV、Excel、データベース、ウェブなど)から金融データを整理、可視化、分析するために最も適切なPythonパッケージとプログラミング手法を選択し利用する
- 資産配分、リスク分析、投資パフォーマンスなどの問題に関連するアプリケーションを開発する
- Pythonアプリケーションのトラブルシューティング、統合、展開、最適化を行う
対象者
- 開発者
- アナリスト
- クオンツ
コース形式
- 講義、ディスカッション、演習と実践的な練習が含まれます
注意
- このトレーニングは、金融プロフェッショナルが直面する主要な問題に対する解決策を提供することを目指しています。ただし、特定のトピック、ツール、または手法について追加や詳細を望む場合は、ご連絡ください。
Qlik Sense for Data Science
14 時間この講師主導型の実践的なトレーニング(オンラインまたは対面)では、Qlik Sense で関連モデルを開発したいデータアナリストとウェブ開発者を対象としています。
本トレーニング終了時には、参加者は以下のことをできるようになります:
- データサイエンスに Qlik Sense を適用する。
- Qlik Sense のインターフェースを使用し、ナビゲートする。
- AI との対話によりデータリテラシーを持つ労働力を構築する。
- Qlik Sense を使用してデータ駆動型企業を作成する。
NVIDIA RAPIDSによるGPUデータサイエンス
14 時間この講師主導のライブトレーニング(オンラインまたはオンサイト)は、データサイエンティストや開発者向けに設計されており、RAPIDSを使用してGPUアクセラレートされたデータパイプライン、ワークフロー、および可視化を構築し、XGBoost、cuMLなどの機械学習アルゴリズムを適用する方法を学ぶことができます。
このトレーニングの終了時には、参加者は以下のことができるようになります:
- NVIDIA RAPIDSを使用してデータモデルを構築するために必要な開発環境をセットアップする。
- RAPIDSの特徴、コンポーネント、および利点を理解する。
- GPUを活用してエンドツーエンドのデータと分析パイプラインを加速する。
- cuDFとApache Arrowを使用してGPUアクセラレートされたデータ準備とETLを実装する。
- XGBoostとcuMLアルゴリズムを使用して機械学習タスクを行う方法を学ぶ。
- cuXfilterとcuGraphを使用してデータ可視化とグラフ分析を構築する。