コース概要

中国 AI GPU エコシステムの概要

  • 華為アセンディ、百綿、カムブリコン MLU の比較
  • CUDA と CANN、百綿 SDK、BANGPy モデルの違い
  • 業界トレンドとベンダーエコシステム

移行への準備

  • あなたの CUDA コードベースを評価する
  • ターゲットプラットフォームと SDK バージョンの特定
  • ツールチェーンのインストールと環境設定

コード翻訳手法

  • CUDA のメモリアクセスとカーネルロジックを移植する
  • 計算グリッド/スレッドモデルのマッピング
  • 自動化された翻訳オプションと手動の翻訳オプション

プラットフォーム固有の実装

  • 華為 CANN オペレータとカスタムカーネルの使用
  • 百綿 SDK 変換パイプライン
  • BANGPy(カムブリコン)を使用してモデルを再構築する

クロスプラットフォームテストと最適化

  • 各ターゲットプラットフォームでの実行プロファイリング
  • メモリチューニングと並列実行の比較
  • パフォーマンストラッキングと反復

混合 GPU 環境の管理

  • 複数アーキテクチャを使用したハイブリッド展開
  • フォールバック戦略とデバイス検出
  • コードの保守性を高めるための抽象化レイヤー

事例研究とベストプラクティス

  • アセンディやカムブリコンへのビジョン/NLP モデルの移植
  • 百綿クラスター上の推論パイプラインの改装
  • バージョンの不一致や API のギャップを処理する

まとめと次回のステップ

要求

  • CUDA や GPU ベースのアプリケーションのプログラミング経験
  • GPU メモリモデルと計算カーネルの理解
  • AI モデルの展開や加速ワークフローの知識

対象者

  • GPU プログラマー
  • システムアーキテクト
  • 移植専門家
 21 時間

参加者の人数


参加者1人当たりの料金

今後のコース

関連カテゴリー