コース概要

CANN 最適化機能の概要

  • CANN における推論性能の取り扱い方法。
  • エッジおよび組み込み AI システムの最適化目標。
  • AI コア利用とメモリアロケーションの理解。

Graph Engine の使用方法

  • Graph Engine と実行パイプラインの紹介。
  • オペレータグラフとランタイムメトリクスの可視化。
  • 最適化のために計算グラフを変更する方法。

プロファイリングツールとパフォーマンスメトリクス

  • CANN プロファイリングツール(profiler)を使用したワークロード分析。
  • カーネル実行時間とボトルネックの分析。
  • メモリアクセスプロファイリングとタイリング戦略。

TIK を使用したカスタムオペレータ開発

  • TIK とオペレータプログラミングモデルの概要。
  • TIK DSL を使用してカスタムオペレータを実装する方法。
  • オペレータ性能のテストとベンチマーク。

TVM による高度なオペレータ最適化

  • CANN との TVM 統合の紹介。
  • 計算グラフの自動チューニング戦略。
  • TVM と TIK を切り替えるタイミングと方法。

メモリ最適化技術

  • メモリアクセスとバッファ配置の管理。
  • チップ上でのメモリ消費を削減するためのテクニック。
  • 非同期実行と再利用的最佳プラクティス。

実際の展開とケーススタディ

  • ケーススタディ:スマートシティカメラパイプラインのパフォーマンストーニング。
  • ケーススタディ:自律走行車推論スタックの最適化。
  • 反復プロファイリングと継続的な改善のガイドライン。

まとめと次回ステップ

要求

  • ディープラーニングモデルアーキテクチャと訓練ワークフローの深い理解。
  • CANN、TensorFlow、または PyTorch を使用したモデル展開の経験。
  • Linux CLI、シェルスクリプト、Python プログラミングに精通していること。

対象者

  • AI 性能エンジニア
  • 推論最適化スペシャリスト
  • エッジ AI またはリアルタイムシステムで働く開発者
 14 時間

参加者の人数


参加者1人あたりの価格

今後のコース

関連カテゴリー