コース概要

CambriconとMLUアーキテクチャの概要

  • CambriconのAIチップ製品群の概観
  • MLUアーキテクチャと命令パイプライン
  • サポートされるモデルタイプとユースケース

開発ツールチェーンのインストール

  • BANGPyとNeuware SDKのインストール
  • PythonおよびC++用の環境設定
  • モデルの互換性と前処理

BANGPyを使用したモデル開発

  • テンソル構造と形状管理
  • 計算グラフの構築
  • BANGPyでのカスタムオペレーションサポート

Neuwareランタイムを使用したデプロイメント

  • モデルの変換とロード
  • 実行および推論制御
  • エッジとデータセンターのデプロイメント慣行

パフォーマンス最適化

  • メモリマッピングと層調整
  • 実行トレースとプロファイリング
  • 一般的なボトルネックと解決策

アプリケーションへのMLUの統合

  • Neuware APIを使用したアプリケーション統合
  • ストリーミングとマルチモデルサポート
  • CPU-MLUハイブリッド推論シナリオ

エンドツーエンドのプロジェクトとユースケース

  • ラボ: 視覚またはNLPモデルのデプロイ
  • BANGPy統合を使用したエッジ推論
  • 精度とスループットのテスト

まとめと次のステップ

要求

  • 機械学習モデル構造に関する理解
  • Pythonおよび/またはC++の経験
  • モデルデプロイメントとアクセラレーション概念に精通していること

対象者

  • 組み込みAI開発者
  • エッジまたはデータセンター向けのMLエンジニア
  • 中国のAIインフラストラクチャを使用する開発者
 21 時間

参加者の人数


参加者1人あたりの価格

今後のコース

関連カテゴリー