コース概要

高度なアラーティングの概要

  • IT システムにおけるアラーティングの基本原則
  • Prometheus Alertmanager の概要
  • Grafana でのアラーティング機能

高度なアラートルールの作成

  • Prometheus でアラートルールを定義する
  • アラートにラベルと注釈を使用する
  • グルーピングとサイレンシング戦略

Alertmanager を外部システムとの統合

  • 外部統合のための Webhook 設定
  • Slack、PagerDuty、メールシステムなどのツールと統合する
  • Alertmanager テンプレートをカスタマイズする

アラートへの自動応答の実装

  • 自動修復ワークフローの実装
  • Ansible、Kubernetes などのオーケストレーションツールとの統合
  • スクリプトを使用した自動的な問題解決

Grafana でのアラートの可視化

  • Grafana でアラートパネルを設定する
  • アラート通知としきい値のカスタマイズ
  • 監視状態の最適な管理方法

大量アラートの管理

  • アラートストームを効果的に処理する
  • Prometheus のパフォーマンスを最適化してアラーティングを行う
  • Alertmanager のスケーラビリティに関する考慮事項

スケーリングと高度なテクニック

  • Prometheus と Alertmanager を使用した分散アラーティングの設定
  • クラウドベースのアラーティングソリューションとの統合
  • Grafana と Prometheus 生態系での新機能の探索

まとめと次へのステップ

要求

  • Grafana と Prometheus の基本的な経験
  • IT 監視概念の理解
  • 自動化のためのスクリプティングやプログラミングへの熟悉度

対象者

  • DevOps エンジニア
  • サイト信頼性エンジニア (SREs)
 14 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (2)

今後のコース

関連カテゴリー