コース概要

高度なアラーティングの導入

  • ITシステムにおけるアラートの基本原則
  • Prometheus Alertmanagerの概要
  • Grafanaでのアラーティング機能

高度なアラートルールの作成

  • Prometheusでアラートルールを定義する
  • アラート用のラベルと注釈を使用する
  • グループ化とサイレンシング戦略

Alertmanagerを外部システムとの統合

  • 外部統合用のウェブフック設定
  • Slack、PagerDuty、メールシステムなどのツールとの統合
  • Alertmanagerテンプレートのカスタマイズ

アラートへの自動応答の実装

  • 自動対応ワークフローの実装
  • Ansible、Kubernetesなどのオーケストレーションツールとの統合
  • スクリプトを使用した自動問題解決

Grafanaでのアラートの可視化

  • Grafanaでアラートパネルを設定する
  • アラート通知と閾値のカスタマイズ
  • アラートステータスの監視に関するベストプラクティス

大量のアラートを管理する

  • 有効なアラートストーム対策
  • アラーティング向けのPrometheusパフォーマンスの最適化
  • Alertmanagerのスケーラビリティに関する考慮事項

スケーリングと高度なテクニック

  • PrometheusとAlertmanagerを使用した分散アラーティング設定
  • クラウドベースのアラーティングソリューションとの統合
  • GrafanaとPrometheusエコシステムでの新機能の探索

まとめと次ステップ

要求

  • GrafanaとPrometheusの基本的な経験
  • IT監視概念の理解
  • 自動化のためのスクリプトまたはプログラミングの知識

対象者

  • DevOpsエンジニア
  • サイト信頼性エンジニア(SRE)
 14 時間

参加者の人数


参加者1人あたりの価格

お客様の声 (2)

今後のコース

関連カテゴリー