お問い合わせを送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
予約を送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
コース概要
Biren GPU アーキテクチャの概要
- Biren の概要と使用事例
- ハードウェア構成:コア、メモリ、コンピュートクラスタ
- NVIDIA および AMD GPU との比較
Biren プログラミング環境のセットアップ
- Biren SDK とランタイムのインストール
- ツールチェーンとコンパイラモデルの理解
- 基本的なプロジェクト構造とビルドプロセス
Biren スタックを使用した GPU プログラミング
- スレッドモデルとブロックモデル
- メモリ管理とデータ転送
- カーネル開発と起動パターン
CUDA から Biren へのポーティング
- CUDA コードの翻訳テクニック
- 共通の API マッピングと適応
- コード変換ラボと実践
デバッグとプロファイリング
- Biren のデバッガーとプロファイラの使用方法
- ボトルネックの特定
- メモリアクセスパターンと最適化
最適化テクニック
- スレッドスケジューリングと命令パイプライン
- ループアンロールと共有メモリの使用
- トータルスループットのための高度なカーネル調整
ケーススタディとアプリケーション例
- Biren アクセレレーターを使用したモデルのトレーニング
- ビジョンまたは NLP モデルのポーティングとプロファイリング
- CUDA/NVIDIA との性能比較
まとめと次なるステップ
要求
- GPU アーキテクチャと並列処理の理解
- CUDA、OpenCL、または類似の GPU プログラミング環境での経験
- PyTorch や TensorFlow などのディープラーニングフレームワークへの習熟
対象者
- HPC 開発者
- AI インフラストラクチャエンジニア
- パフォーマンス最適化スペシャリスト
21 時間
お客様の声 (1)
段階的に進められる練習が豊富なトレーニングです。ワークショップのようでしたし、その点で非常に満足しています。
Ireneusz - Inter Cars S.A.
コース - Intelligent Applications Fundamentals
機械翻訳