コース概要

導入

ヘテロジニアス コンピューティング手法の基礎を理解する

なぜ並列コンピューティングなのか?並列コンピューティングの必要性を理解する

マルチコアプロセッサ - アーキテクチャと設計

スレッドの概要、スレッドの基本、並列の基本概念 Programming

GPU ソフトウェア最適化プロセスの基礎を理解する

OpenMP - ディレクティブベースの並列の標準 Programming

マルチコアマシン上の各種プログラムのハンズオン・デモンストレーション

GPU コンピューティングの概要

並列コンピューティングの GPU

GPU Programming モデル

各種プログラムのハンズオン・デモンストレーションGPU

GPUのSDK、ツールキット、環境のインストール

さまざまなライブラリの操作

GPU とサンプル プログラムと OpenACC を使用したツールのデモンストレーション

CUDA Programming モデルを理解する

CUDA アーキテクチャを学ぶ

CUDA 開発環境の探索とセットアップ

CUDA ランタイム API の操作

CUDA メモリ モデルを理解する

追加の CUDA API 機能を調べる

CUDA でグローバル メモリを効率的に Access する: グローバル メモリの最適化

CUDA ストリームを使用した CUDA でのデータ転送の最適化

CUDA での共有メモリの使用

CUDA におけるアトミック操作と命令の理解と使用

ケーススタディ: CUDA を使用した基本的なデジタル画像処理

マルチ GPU の使用 Programming

NVIDIA / CUDA での高度なハードウェア プロファイリングとサンプリング

動的カーネル起動のための CUDA 動的並列処理 API の使用

要約と結論

要求

  • C Programming
  • LinuxのGCC
  21 時間
 

参加者の人数


開始

完了


Dates are subject to availability and take place between 10:00 and 17:00.
Open Training Courses require 5+ participants.

関連コース

GPU Programming with OpenCL

  28 時間

GPU Programming with CUDA

  28 時間

GPU Programming - OpenCL vs CUDA vs ROCm

  28 時間

AMD GPU Programming

  28 時間

ROCm for Windows

  21 時間

Introduction to GPU Programming

  21 時間

GPU Programming with OpenACC

  28 時間

関連カテゴリー