データサイエンスチームのための Jupyterのトレーニングコース
Jupyter はオープンソースで、ウェブベースの対話型 IDE および計算環境です。
このインストラクター主導の実践的なトレーニング(オンラインまたはオンサイト)では、データサイエンスにおける共同開発の概念を紹介し、Jupyter を使用して「計算アイデアのライフサイクル」にチームとして参加し、追跡する方法を示します。このトレーニングでは、参加者に対して Jupyter エコシステムに基づいたサンプルデータサイエンスプロジェクトの作成方法を説明します。
本トレーニングの終了時には、参加者は以下のことができるようになります:
- Jupyter のインストールと設定を行い、Git でのチームリポジトリの作成と統合を行う。
- Jupyter の拡張機能、対話型ウィジェット、マルチユーザーモードなどの機能を使用してプロジェクトの共同開発を可能にする。
- チームメンバーと一緒に Jupyter Notebook を作成、共有、整理する。
- Scala, Python, R などを使用してコードを記述および実行し、Apache Spark のようなビッグデータシステムと Jupyter インターフェースを通じて統合する。
コースの形式
- 対話型講義とディスカッション。
- 多くの演習と練習。
- ライブラボ環境での実践的な実装。
コースのカスタマイズオプション
- Jupyter Notebook は R, Python, Scala, Julia など、40 種類以上の言語をサポートしています。このコースを希望する言語にカスタマイズする場合は、ご連絡ください。
コース概要
Jupyter 入門
- Jupyter とそのエコシステムの概要
- インストールとセットアップ
- チーム共同作業用に Jupyter を設定する
共同開発機能
- Git を使用したバージョン管理
- 拡張機能と対話型ウィジェットの利用
- マルチユーザーモード
Notebook の作成と管理
- Notebook の構造と機能
- Notebook の共有と整理
- 共同開発のためのベストプラクティス
Jupyter でのプログラミング
- 言語選択と使用方法 (Python, R, Scala)
- コードの記述と実行
- ビッグデータシステム (Apache Spark) との統合
高度な Jupyter 機能
- Jupyter 環境のカスタマイズ
- Jupyter を使用したワークフローの自動化
- 高度なユースケースの探索
実践セッション
- 手動ラボ
- リアルワールドのデータサイエンスプロジェクト
- グループ演習とピアレビュー
まとめと次回へのステップ
要求
- Python, R, Scala などのプログラミング言語の経験。
- データサイエンスに関するバックグラウンド。
対象者
- データサイエンスチーム
オープントレーニングコースには5人以上が必要です。
データサイエンスチームのための Jupyterのトレーニングコース - 予約
データサイエンスチームのための Jupyterのトレーニングコース - お問い合わせ
データサイエンスチームのための Jupyter - コンサルティングお問い合わせ
コンサルティングお問い合わせ
お客様の声 (1)
このコースが、事前アンケートで私が強調した重要な領域に合わせてカスタマイズされているのは素晴らしいことです。これにより、私の持つ疑問を解決し、学習目標と一致させることが本当に役立ちます。
Winnie Chan - Statistics Canada
コース - Jupyter for Data Science Teams
機械翻訳
今後のコース
関連コース
Python を使用したデータサイエンスと AI の入門
35 時間このコースは、データサイエンスと人工知能(AI)の5日間の入門です。
Python を使用した例題や演習を交えて展開します。
データサイエンティストのためのAnacondaエコシステム
14 時間このインストラクター主導のライブトレーニング(オンラインまたはオンサイト)は、Anacondaエコシステムを使用してパッケージとデータ分析ワークフローを単一のプラットフォームで管理および展開したいデータサイエンティスト向けです。
このトレーニング終了時には、参加者は以下のことが Able to:
- Anacondaのコンポーネントやライブラリをインストールし設定する。
- Anacondaのコア概念、機能、および利点を理解する。
- Anaconda Navigatorを使用してパッケージ、環境、チャネルを管理する。
- Conda、R、Pythonパッケージをデータサイエンスと機械学習に使用する。
- 複数のデータ環境を管理するための実践的なユースケースやテクニックについて知る。
データサイエンスの実践的な入門
35 時間この研修を終了した参加者は、データサイエンスとその関連技術、手法、ツールについて、実際の世界で活用できる理解を得ることができます。
参加者は演習を通じてこの知識を実践に活かす機会があります。グループでの交流や講師からのフィードバックはクラスの重要な部分を構成します。
コースはデータサイエンスの基本概念の紹介から始まり、その後、データサイエンスで使用されるツールと手法に進んでいきます。
対象者
- 開発者
- 技術アナリスト
- ITコンサルタント
コース形式
- 講義と討論、演習および実践的な練習を組み合わせたもの
注意事項
- このコースのカスタマイズ版をご希望の場合は、お問い合わせください。
データサイエンス・プログラム
245 時間今日の世界では、情報とデータの爆発的な増加は前例のないものです。イノベーションを推進し、可能な限りの境界を拡張する能力はかつてないほど急速に成長しています。データサイエンティストの役割は、現在産業界で最も需要が高まっているスキルの一つです。
当プログラムでは理論的な学習だけでなく、実践的で市場性のあるスキルを提供します。これは学術界と産業界の要求との間にあるギャップを埋めます。
この7週間のカリキュラムは、特定の業界要件に合わせてカスタマイズできます。詳細情報やお問い合わせについては、当社までご連絡くださいか、Nobleprog Institute のウェブサイトをご覧ください。
対象者:
このプログラムは大学院レベル以上の卒業者や、必要な前提条件のスキルを有する方々を対象としています。参加者は事前に評価と面接が行われます。
カリキュラム配布方法:
コースの配布は講師主導の教室での学習とオンラインでの学習の組み合わせとなります。通常、1週目は「教室主導」で、2〜6週目は「仮想教室」、7週目は再び「教室主導」となります。
ビッグデータ分析のためのデータサイエンス
35 時間ビッグデータとは、その量と複雑さが伝統的なデータ処理アプリケーションソフトウェアでは十分に扱えないデータセットのことを指します。ビッグデータの課題には、データの収集、保存、分析、検索、共有、転送、可視化、クエリ、更新、情報プライバシーなどがあります。
マーケティング・セールス専門家向けデータサイエンス
21 時間このコースは、マーケティングや営業でデータサイエンスをより深く活用したいと考えているマーケティング・セールスの専門家向けに設計されています。このコースでは、「アップセル」、「クロスセル」、市場セグメンテーション、ブランド構築、CLV(顧客生涯価値)など、さまざまなデータサイエンステクニックについて詳細な解説を提供します。
マーケティングと営業の違い - 営業とマーケティングはどのように異なるのでしょうか?
簡単に言えば、営業は個人や小さなグループを対象とするプロセスです。一方、マーケティングはより大きな集団や一般大衆を対象としています。マーケティングには、顧客のニーズを特定するリサーチ、革新的な製品を開発すること、広告を通じた製品のプロモーション、そして消費者への製品認知度向上が含まれます。つまり、マーケティングはリードや見込み顧客の生成を意味します。製品が市場に出ると、営業担当者の役割は顧客に製品を購入させるために説得することです。営業はリードや見込み顧客を購入や注文に変えることを目指し、マーケティングは長期的な目標に対応するのに対し、営業は短期的な目標に関連しています。
データサイエンス入門
35 時間このインストラクター主導のライブトレーニング(オンラインまたはオンサイト)は、データサイエンスのキャリアを始めたい専門家向けです。
このトレーニングが終了すると、参加者は以下のことができるようになります:
- PythonとMySqlのインストールと設定を行う。
- データサイエンスとは何か、そしてそれがどのようなビジネスにも価値をもたらす方法を理解する。
- Pythonでのコーディングの基礎を学ぶ。
- 監督学習と非監督学習の機械学習技術を学び、実装し、結果を解釈する方法を学ぶ。
コース形式
- 双方向の講義とディスカッション。
- 多数の演習と実践。
- ライブラボ環境での手順実装。
コースカスタマイズオプション
- このコースのカスタムトレーニングをリクエストする場合は、ご連絡ください。
Kaggle
14 時間このインストラクター主導のライブトレーニング(オンラインまたはオンサイト)は、Kaggleを使用してデータサイエンスのキャリアを学びたいと考えているデータサイエンティストや開発者向けです。
このトレーニング終了時には、参加者は以下のことが able to できます:
- データサイエンスと機械学習について学ぶ。
- データ分析を探索する。
- Kaggleとその機能について学ぶ。
MATLABの基礎、データ科学、およびレポート生成
35 時間このトレーニングの前半では、MATLABの基礎とその言語としての機能やプラットフォームとしての役割をカバーします。この議論には、MATLABの文法、配列と行列、データ可視化、スクリプト開発、およびオブジェクト指向の原則への導入が含まれています。
後半では、MATLABを使用してデータマイニング、機械学習、予測分析を行う方法をデモンストレーションします。参加者がMATLABのアプローチと能力について明確で実践的な視点を持つことができるようにするために、スプレッドシートやC、C++、Visual Basicなどの他のツールとの比較を行います。
最後の部分では、データ処理とレポート生成を自動化して作業を効率化する方法について学びます。
コース全体を通じて、参加者はラボ環境で手を動かす演習を通じて学んだアイデアを実践します。トレーニング終了時には、参加者はMATLABの能力に精通しており、現実世界のデータサイエンス問題の解決や作業の自動化を通じて活用できるようになります。
コース中には進行度を測定するために評価が行われます。
コースの形式
- 理論と実践の演習を含み、ケースディスカッション、サンプルコードの検査、および手を動かす実装を行います。
注意
- 練習セッションは事前に用意されたサンプルデータレポートテンプレートに基づいて行われます。特定の要件がある場合は、ご連絡ください。
Pythonを使用したデータサイエンスのための機械学習
21 時間この講師主導のライブトレーニング(オンラインまたはオンサイト)は、中級レベルのデータアナリスト、開発者、またはデータサイエンティストを目指している人々向けです。参加者はPythonを使用して機械学習技術を適用し、洞察を得たり、予測を行ったり、データ駆動型の意思決定を自動化する方法を学びます。
このコース終了時には、参加者は以下のことをできるようになります:
- 主要な機械学習パラダイムを理解し、区別することができます。
- データ前処理技術とモデル評価指標を探索できます。
- 実世界のデータ問題に機械学習アルゴリズムを適用できます。
- PythonライブラリやJupyterノートブックを使用して手動開発を行えます。
- 予測、分類、推薦、クラスタリング用のモデルを作成できます。
Modinを使用してPython Pandasワークフローを加速
14 時間この講師主導のライブトレーニング(オンラインまたはオンサイト)は、Modinを使用して並列計算を構築および実装し、高速なデータ分析を行うことを目指すデータサイエンティストや開発者向けです。
このトレーニング終了時には、参加者は以下のことが Able to:
- 必要な環境を設定して、Modinを使用してスケールアウトするPandasワークフローの開発を開始します。
- Modinの機能、アーキテクチャ、および優位性を理解します。
- Modin、Dask、およびRayの違いを知ります。
- Modinを使用してPandas操作を高速に行います。
- 全Pandas APIと関数を実装します。
Pythonを用いた金融プログラミング
35 時間Pythonは、金融業界で大きな人気を得ているプログラミング言語です。大手投資銀行やヘッジファンドでも採用され、コアの取引プログラムからリスク管理システムまで、多様な金融アプリケーションの開発に使用されています。
この講師主導の実践的なトレーニングでは、参加者はPythonを用いて具体的な金融問題を解決するための実践的なアプリケーションを開発する方法を学びます。
本トレーニング終了時には、参加者は以下のことが Able to できます:
- Pythonプログラミング言語の基本を理解する
- 金融アプリケーションの開発に最適なツールのダウンロード、インストール、メンテナンスを行う
- さまざまなソース(CSV、Excel、データベース、ウェブなど)から金融データを整理、可視化、分析するために最も適切なPythonパッケージとプログラミング手法を選択し利用する
- 資産配分、リスク分析、投資パフォーマンスなどの問題に関連するアプリケーションを開発する
- Pythonアプリケーションのトラブルシューティング、統合、展開、最適化を行う
対象者
- 開発者
- アナリスト
- クオンツ
コース形式
- 講義、ディスカッション、演習と実践的な練習が含まれます
注意
- このトレーニングは、金融プロフェッショナルが直面する主要な問題に対する解決策を提供することを目指しています。ただし、特定のトピック、ツール、または手法について追加や詳細を望む場合は、ご連絡ください。
Python in Data Science
35 時間このトレーニングコースでは、参加者が Python プログラミングとデータ分析を使用した Web アプリケーション開発の準備を進めることができます。このようなデータ可視化は、トップマネジメントの意思決定に大いに役立ちます。
Qlik Sense for Data Science
14 時間この講師主導型の実践的なトレーニング(オンラインまたは対面)では、Qlik Sense で関連モデルを開発したいデータアナリストとウェブ開発者を対象としています。
本トレーニング終了時には、参加者は以下のことをできるようになります:
- データサイエンスに Qlik Sense を適用する。
- Qlik Sense のインターフェースを使用し、ナビゲートする。
- AI との対話によりデータリテラシーを持つ労働力を構築する。
- Qlik Sense を使用してデータ駆動型企業を作成する。
NVIDIA RAPIDSによるGPUデータサイエンス
14 時間この講師主導のライブトレーニング(オンラインまたはオンサイト)は、データサイエンティストや開発者向けに設計されており、RAPIDSを使用してGPUアクセラレートされたデータパイプライン、ワークフロー、および可視化を構築し、XGBoost、cuMLなどの機械学習アルゴリズムを適用する方法を学ぶことができます。
このトレーニングの終了時には、参加者は以下のことができるようになります:
- NVIDIA RAPIDSを使用してデータモデルを構築するために必要な開発環境をセットアップする。
- RAPIDSの特徴、コンポーネント、および利点を理解する。
- GPUを活用してエンドツーエンドのデータと分析パイプラインを加速する。
- cuDFとApache Arrowを使用してGPUアクセラレートされたデータ準備とETLを実装する。
- XGBoostとcuMLアルゴリズムを使用して機械学習タスクを行う方法を学ぶ。
- cuXfilterとcuGraphを使用してデータ可視化とグラフ分析を構築する。