お問い合わせを送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
予約を送信いただきありがとうございます!当社のスタッフがすぐにご連絡いたします。
コース概要
DeepSeek LLM微調整の紹介
- DeepSeekモデル(DeepSeek-R1やDeepSeek-V3など)の概要
- LLMを微調整する必要性の理解
- 微調整とプロンプトエンジニアリングの比較
データセットの準備
- 特定ドメイン向けデータセットの作成
- データ前処理とクリーニング技術
- DeepSeek LLM用のトークン化とデータセットフォーマット
微調整環境の設定
- GPUおよびTPU加速の設定
- Hugging Face TransformersとDeepSeek LLMのセットアップ
- 微調整用ハイパーパラメータの理解
DeepSeek LLMの微調整
- 監督付き微調整の実装
- LoRA(低ランク適応)とPEFT(パラメータ効率的な微調整)の使用
- 大規模データセット向け分散微調整の実行
微調整されたモデルの評価と最適化
- 評価指標を使用したモデル性能の評価
- 過学習と学習不足の処理
- 推論速度とモデル効率の最適化
微調整されたDeepSeekモデルの展開
- API展開用のモデルパッケージング
- アプリケーションへの微調整済みモデルの統合
- クラウドおよびエッジコンピューティングを使用した展開のスケーリング
実際の使用例とアプリケーション
- 金融、医療、カスタマーサポート向けに微調整されたLLM
- 業界アプリケーションの事例研究
- 特定ドメインAIモデルにおける倫理的配慮
まとめと次なるステップ
要求
- 機械学習および深層学習フレームワークの経験
- トランスフォーマーと大規模言語モデル(LLM)の理解
- データ前処理とモデル訓練技術の理解
対象者
- LLM微調整を研究するAI研究者
- カスタムAIモデルを開発する機械学習エンジニア
- AI駆動ソリューションを実装する上級開発者
21 時間