コース概要

Biren GPU アーキテクチャの概要

  • Biren の概要と使用事例
  • ハードウェア構成:コア、メモリ、コンピュートクラスタ
  • NVIDIA および AMD GPU との比較

Biren プログラミング環境のセットアップ

  • Biren SDK とランタイムのインストール
  • ツールチェーンとコンパイラモデルの理解
  • 基本的なプロジェクト構造とビルドプロセス

Biren スタックを使用した GPU プログラミング

  • スレッドモデルとブロックモデル
  • メモリ管理とデータ転送
  • カーネル開発と起動パターン

CUDA から Biren へのポーティング

  • CUDA コードの翻訳テクニック
  • 共通の API マッピングと適応
  • コード変換ラボと実践

デバッグとプロファイリング

  • Biren のデバッガーとプロファイラの使用方法
  • ボトルネックの特定
  • メモリアクセスパターンと最適化

最適化テクニック

  • スレッドスケジューリングと命令パイプライン
  • ループアンロールと共有メモリの使用
  • トータルスループットのための高度なカーネル調整

ケーススタディとアプリケーション例

  • Biren アクセレレーターを使用したモデルのトレーニング
  • ビジョンまたは NLP モデルのポーティングとプロファイリング
  • CUDA/NVIDIA との性能比較

まとめと次なるステップ

要求

  • GPU アーキテクチャと並列処理の理解
  • CUDA、OpenCL、または類似の GPU プログラミング環境での経験
  • PyTorch や TensorFlow などのディープラーニングフレームワークへの習熟

対象者

  • HPC 開発者
  • AI インフラストラクチャエンジニア
  • パフォーマンス最適化スペシャリスト
 21 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (1)

今後のコース

関連カテゴリー