コース概要

DeepSeek LLM微調整の紹介

  • DeepSeekモデル(DeepSeek-R1やDeepSeek-V3など)の概要
  • LLMを微調整する必要性の理解
  • 微調整とプロンプトエンジニアリングの比較

データセットの準備

  • 特定ドメイン向けデータセットの作成
  • データ前処理とクリーニング技術
  • DeepSeek LLM用のトークン化とデータセットフォーマット

微調整環境の設定

  • GPUおよびTPU加速の設定
  • Hugging Face TransformersとDeepSeek LLMのセットアップ
  • 微調整用ハイパーパラメータの理解

DeepSeek LLMの微調整

  • 監督付き微調整の実装
  • LoRA(低ランク適応)とPEFT(パラメータ効率的な微調整)の使用
  • 大規模データセット向け分散微調整の実行

微調整されたモデルの評価と最適化

  • 評価指標を使用したモデル性能の評価
  • 過学習と学習不足の処理
  • 推論速度とモデル効率の最適化

微調整されたDeepSeekモデルの展開

  • API展開用のモデルパッケージング
  • アプリケーションへの微調整済みモデルの統合
  • クラウドおよびエッジコンピューティングを使用した展開のスケーリング

実際の使用例とアプリケーション

  • 金融、医療、カスタマーサポート向けに微調整されたLLM
  • 業界アプリケーションの事例研究
  • 特定ドメインAIモデルにおける倫理的配慮

まとめと次なるステップ

要求

  • 機械学習および深層学習フレームワークの経験
  • トランスフォーマーと大規模言語モデル(LLM)の理解
  • データ前処理とモデル訓練技術の理解

対象者

  • LLM微調整を研究するAI研究者
  • カスタムAIモデルを開発する機械学習エンジニア
  • AI駆動ソリューションを実装する上級開発者
 21 時間

参加者の人数


参加者1人あたりの価格

今後のコース

関連カテゴリー