コース概要

はじめに

異種コンピューティングメソドロジーの基礎を理解する

なぜ並列計算が必要なのか - 並列計算の必要性を理解する

マルチコアプロセッサ - アーキテクチャと設計

スレッドの基本、並列プログラミングの基礎概念について

GPUソフトウェア最適化プロセスの基礎を理解する

OpenMP - ディレクティブベースの並列プログラミングの標準

マルチコアマシンでさまざまなプログラムのデモンストレーション

GPUコンピューティング入門

並列計算用のGPU

GPUプログラミングモデル

GPU上でさまざまなプログラムのデモンストレーション

SDK、ツールキット、およびGPU環境のインストール

さまざまなライブラリの使用方法

サンプルプログラムとOpenACCを使用したGPUとツールのデモンストレーション

CUDAプログラミングモデルを理解する

CUDAアーキテクチャを学ぶ

CUDA開発環境の設定と探求

CUDAランタイムAPIを使用する

CUDAメモリモデルを理解する

追加のCUDA API機能の探求

CUDAでグローバルメモリに効率的にアクセスする - グローバルメモリ最適化

CUDAストリームを使用したCUDAでのデータ転送の最適化

CUDAで共有メモリを使用する

CUDAでアトミック操作と命令を使用して理解する

ケーススタディ: CUDAを用いた基本的なデジタル画像処理

マルチGPUプログラミングの方法

NVIDIA/CUDAでの高度なハードウェアプロファイリングとサンプリング

CUDA動的並列性APIを使用した動的カーネル起動

まとめと結論

要求

  • Cプログラミング
  • Linux GCC
 21 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (1)

今後のコース

関連カテゴリー