お問い合わせを送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
予約を送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
コース概要
CANN 最適化機能の概要
- CANN における推論性能の取り扱い方法。
- エッジおよび組み込み AI システムの最適化目標。
- AI コア利用とメモリアロケーションの理解。
Graph Engine の使用方法
- Graph Engine と実行パイプラインの紹介。
- オペレータグラフとランタイムメトリクスの可視化。
- 最適化のために計算グラフを変更する方法。
プロファイリングツールとパフォーマンスメトリクス
- CANN プロファイリングツール(profiler)を使用したワークロード分析。
- カーネル実行時間とボトルネックの分析。
- メモリアクセスプロファイリングとタイリング戦略。
TIK を使用したカスタムオペレータ開発
- TIK とオペレータプログラミングモデルの概要。
- TIK DSL を使用してカスタムオペレータを実装する方法。
- オペレータ性能のテストとベンチマーク。
TVM による高度なオペレータ最適化
- CANN との TVM 統合の紹介。
- 計算グラフの自動チューニング戦略。
- TVM と TIK を切り替えるタイミングと方法。
メモリ最適化技術
- メモリアクセスとバッファ配置の管理。
- チップ上でのメモリ消費を削減するためのテクニック。
- 非同期実行と再利用的最佳プラクティス。
実際の展開とケーススタディ
- ケーススタディ:スマートシティカメラパイプラインのパフォーマンストーニング。
- ケーススタディ:自律走行車推論スタックの最適化。
- 反復プロファイリングと継続的な改善のガイドライン。
まとめと次回ステップ
要求
- ディープラーニングモデルアーキテクチャと訓練ワークフローの深い理解。
- CANN、TensorFlow、または PyTorch を使用したモデル展開の経験。
- Linux CLI、シェルスクリプト、Python プログラミングに精通していること。
対象者
- AI 性能エンジニア
- 推論最適化スペシャリスト
- エッジ AI またはリアルタイムシステムで働く開発者
14 時間