お問い合わせ

コース概要

安全で公平なAIの基礎

  • 主要コンセプト:安全性、バイアス、公平性、透明性
  • バイアスの種類:データセット、表現、アルゴリズムに基づくバイアス
  • 規制フレームワークの概要(EU AI法、GDPRなど)

ファインチューニング済みモデルにおけるバイアス

  • ファインチューニングがバイアスを導入または増幅する方法
  • ケーススタディおよび現実世界の失敗事例
  • データセットおよびモデル予測におけるバイアスの特定

バイアス緩和の技術

  • データレベルの戦略(再バランス、拡張)
  • トレーニング中の戦略(正則化、敵対的デバイアシング)
  • ポストプロセッシング戦略(出力フィルタリング、キャリブレーション)

モデルの安全性と頑健性

  • 危険または有害な出力の検出
  • 敵対的入力の処理
  • ファインチューニング済みモデルに対するレッドチーム演習および負荷テスト

AIシステムの監査と監視

  • バイアスおよび公平性の評価指標(例:人口統計的パリティ)
  • 説明可能性ツールおよび透明性フレームワーク
  • 継続的な監視およびガバナンスの実践

ツールキットとハンズオン実践

  • オープンソースライブラリ(例:Fairlearn、Transformers、CheckList)の使用
  • 実践:ファインチューニング済みモデルにおけるバイアスの検出と緩和
  • プロンプト設計と制約を通じて安全な出力を生成する

エンタープライズ向けユースケースとコンプライアンスの準備

  • LLMワークフローへの安全性統合のベストプラクティス
  • コンプライアンスのためのドキュメンテーションおよびモデルカード
  • 監査および外部レビューへの準備

まとめと次のステップ

要求

  • 機械学習モデルおよびトレーニングプロセスに関する理解
  • ファインチューニングおよびLLM(大規模言語モデル)の取扱い経験
  • PythonおよびNLP(自然言語処理)の概念への親しみ

対象者

  • AIコンプライアンスチーム
  • MLエンジニア
 14 時間

参加者の人数


参加者1人あたりの価格

今後のコース

関連カテゴリー