Data Science for Big Data Analyticsのトレーニングコース

ビッグデータは非常に膨大で複雑なデータセットであるため、従来のデータ処理アプリケーションソフトウェアでは処理できません。ビッグデータの課題には、データのキャプチャ、データストレージ、データ分析、検索、共有、転送、視覚化、クエリ、更新、および情報のプライバシーが含まれます。

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

お客様の声 (2)

Intensity, Training materials and expertise, Clarity, Excellent communication with Alessandra

Marija Hornis Dmitrovic - Marija Hornis

コース - Data Science for Big Data Analytics

The example and training material were sufficient and made it easy to understand what you are doing

Teboho Makenete

コース - Data Science for Big Data Analytics

Kaggle

14 時間

Accelerating Python Pandas Workflows with Modin

14 時間

GPU Data Science with NVIDIA RAPIDS

14 時間

Anaconda Ecosystem for Data Scientists

14 時間

Data Vault: Building a Scalable Data Warehouse

28 時間

Spark Streaming with Python and Kafka

7 時間

Confluent KSQL

7 時間

Apache Ignite for Developers

14 時間

Unified Batch and Stream Processing with Apache Beam

14 時間

Apache Apex: Processing Big Data-in-Motion

21 時間

Apache Apexは、ストリームとバッチ処理を統合するYARNネイティブプラットフォームです。動作中のビッグデータを、スケーラブル、パフォーマンス、フォールトトレラント、ステートフル、安全、分散、簡単に操作できる方法で処理します。
このインストラクター主導のライブトレーニングでは、 Apache Apexの統合ストリーム処理アーキテクチャを紹介し、Apex on Hadoopを使用して分散アプリケーションを作成する方法を説明します。
このトレーニングの終わりまでに、参加者は次のことができるようになります。
ソースとシンクのコネクタ、一般的なデータ変換などのデータ処理パイプラインの概念を理解する
Apexアプリケーションの構築、スケーリング、最適化
リアルタイムデータストリームを最小限のレイテンシで確実に処理します
Apex CoreとApex Malharライブラリを使用して、迅速なアプリケーション開発を可能にします
Apex APIを使用して、既存のJavaコードを作成して再利用する
Apexを処理エンジンとして他のアプリケーションに統合する
Apexアプリケーションの調整、テスト、スケーリング
コースの形式
インタラクティブな講義とディスカッション。
たくさんの練習と練習。
ライブラボ環境での実践的な実装。
コースのカスタマイズオプション
このコースのカスタマイズされたトレーニングをリクエストするには、お問い合わせください。

続きを読む...

Apache Storm

28 時間

Apache Stormは、リアルタイムビジネスインテリジェンスを可能にするために使用される配布されたリアルタイムコンピューティングエンジンです。これは、アプリケーションが無制限のデータストリームを信頼性の高い処理を可能にすることによって行われます(例えば、ストリーム処理)
"Storm is for real-time processing what Hadoop is for バッチ処理!"
このインストラクターによるライブトレーニングでは、参加者はインストールと設定の方法を学び、その後、リアルタイムでビッグデータを処理するためのアプリケーションの開発と導入を学びます。
このトレーニングに含まれるテーマのいくつかは以下のとおりです。
〔1〕〔1〕〔1〕〔1〕〔1〕〔1〕
無制限データの処理
継続的な計算
リアルタイム分析
配布されたRPCとETL処理
今すぐこのコースをお願いします!
観客
ソフトウェアとETL開発者
メインフレームプロ
データ科学者
大型データアナリスト
(3)専門家
コースの形式
参加講義、参加討論、練習、重い実践

続きを読む...

Apache NiFi for Administrators

21 時間

このインストラクターによるライブ・トレーニング（オンサイトまたはリモート）では、参加者はライブ・ラボ環境でApache NiFiをデプロイし管理する方法を学びます。
このトレーニングの終了時までに、参加者は以下のことができるようになります：

Apachi NiFiのインストールと設定
。
データベースやビッグデータレイクを含む、異種分散データソースからのデータ取得、変換、および管理
。
データフローを自動化します。
ストリーミング分析を可能にする。
データ取り込みにさまざまなアプローチを適用する
。
Big Dataをビジネスインサイトに変換する
。

続きを読む...

Apache NiFi for Developers

7 時間

このインストラクター主導のライブ・トレーニングでは、Apache NiFiを使用して多くのデモ拡張機能、コンポーネント、プロセッサを開発しながら、フローベースプログラミングの基礎を学びます。
このトレーニングの終了時までに、参加者は以下のことができるようになります：

NiFiのアーキテクチャとデータフローの概念を理解する
。
NiFiとサードパーティのAPIを使って拡張機能を開発する
。
独自の Apache Nifi プロセッサをカスタム開発する
。
異種かつ一般的でないファイル形式やデータソースからリアルタイムデータを取得し、処理する
。

続きを読む...

Apache Flink Fundamentals

28 時間

日本でのこのインストラクター主導のライブトレーニング (オンラインまたはオンサイト) では、分散ストリームおよびバッチデータ処理の背後にある原則とアプローチを紹介し、参加者に Apache Flink でのリアルタイムデータストリーミングアプリケーションの作成手順を説明します。
このトレーニングを終了するまでに、参加者は次のことができるようになります。
データ分析アプリケーションを開発するための環境をセットアップします。 Apache Flink のグラフ処理ライブラリ (Gelly) がどのように機能するかを理解します。 Flink ベースのフォールトトレラントなデータストリーミングアプリケーションをパッケージ化、実行、監視します。多様なワークロードを管理します。高度な分析を実行します。マルチノード Flink クラスターをセットアップします。パフォーマンスを測定して最適化します。 Flink をさまざまな Big Data システムと統合します。 Flink の機能を他のビッグデータ処理フレームワークの機能と比較します。

続きを読む...

Python and Spark for Big Data (PySpark)

21 時間

このインストラクターによるライブ・トレーニングでは、PythonとSparkを組み合わせてビッグデータを分析する方法を、実習を交えながら学びます。
このトレーニングの終了時までに、参加者は以下のことができるようになります：

PythonでSparkを使ってビッグデータを分析する方法を学びます。
実際のケースを想定した演習に取り組みます。
PySparkを使用したビッグデータ分析のためのさまざまなツールやテクニックを使用します。

続きを読む...

関連カテゴリー

ビッグデータ

データマイニング

データサイエンス

Data Science for Big Data Analyticsのトレーニングコース

コース概要

Data Science for Big Data Analytics の紹介

データ分析ライフサイクルの概要

この時点から、トレーニング時間のほとんど (80%) が R および関連するビッグ データ テクノロジの例と演習に費やされます。

R を始める

Hadoop を始める

R と Hadoop を RHadoop と統合する

データの前処理と準備

R の探索的データ分析手法

Data Visualization

回帰（将来の値の推定）

分類

モデルのパフォーマンスと選択の評価

アンサンブルメソッド

分類と回帰のためのサポートベクターマシン

リンク分析の概念 ネットワーク分析のメトリクス ページランク アルゴリズム ハイパーリンクに起因するトピック Search リンク予測の演習とケース スタディ

テキスト分析の手順 生のテキストの収集 単語の集まり 用語の頻度 – 逆文書頻度 感情の決定 演習とケーススタディ

お客様の声 (2)

Marija Hornis Dmitrovic - Marija Hornis

コース - Data Science for Big Data Analytics

Teboho Makenete

コース - Data Science for Big Data Analytics

関連コース

Kaggle

Accelerating Python Pandas Workflows with Modin

GPU Data Science with NVIDIA RAPIDS

Anaconda Ecosystem for Data Scientists

Data Vault: Building a Scalable Data Warehouse

Spark Streaming with Python and Kafka

Confluent KSQL

Apache Ignite for Developers

Unified Batch and Stream Processing with Apache Beam

Apache Apex: Processing Big Data-in-Motion

Apache Storm

Apache NiFi for Administrators

Apache NiFi for Developers

Apache Flink Fundamentals

Python and Spark for Big Data (PySpark)

関連カテゴリー

ビッグデータ

データマイニング

データサイエンス

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

この時点から、トレーニング時間のほとんど (80%) が R および関連するビッグデータテクノロジの例と演習に費やされます。

リンク分析の概念ネットワーク分析のメトリクスページランクアルゴリズムハイパーリンクに起因するトピック Search リンク予測の演習とケーススタディ

テキスト分析の手順生のテキストの収集単語の集まり用語の頻度 – 逆文書頻度感情の決定演習とケーススタディ