Skip to content

Grafana OnCall

Grafana OnCall 輪值與告警管理

軟體分類 網路與資安 / 網路應用
開發廠商 Grafana Labs
Stars
0
Forks
0
License
AGPL-3.0
Version
v1.10.2
Update
OS
kubernetes

終結無意義的告警轟炸,建立專業的 SRE 回應工作流

  • 告警噪音過濾: 透過強大的過濾與分組引擎,將成千上萬的原始日誌轉化為具備可操作性的事件,避免開發人員產生告警疲勞。
  • 靈活輪值安排: 視覺化排班介面,支援多時區、補班與交接設定,確保一年 365 天都有專人處理緊急事件。
  • 全方位通知途徑: 原生整合 Slack、Telegram、Microsoft Teams 與 Email,支援階層式升級(Escalation),若首位輪值者未回應,系統將自動通知備援人員。

主要功能、特點

  • [cite_start]介紹: Grafana OnCall 是一款開源的事件回應工具,旨在縮短平均修復時間 (MTTR)。它能接收來自 Grafana [cite: 1][cite_start]、Prometheus 、Zabbix 等多種監控系統的告警。

  • 特色服務:

    • 升級策略 (Escalation Chains): 支援自定義升級邏輯,例如:「先在 Slack 通知 5 分鐘,若無反應則發送電話簡訊,最後再通知主管」。
    • ChatOps 整合: 開發者可以直接在 Slack 或 Telegram 介面中確認(Acknowledge)、解決或靜音告警,無需切換到瀏覽器。
    • 與 Grafana 深度整合: 在同一個儀表板中查看監控指標、紀錄日誌與管理輪值,實現統一的運維視圖。
    • 事件分析報告: 自動生成故障處理時程紀錄,方便團隊進行事後檢討(Post-mortem)與流程優化。

安裝指令

推薦使用 Docker Compose 進行部署,這是啟動 Grafana OnCall OSS 版本的標準方式:

# 複製 Grafana OnCall 儲存庫
git clone [https://github.com/grafana/oncall.git](https://github.com/grafana/oncall.git)
cd oncall

# 啟動全功能堆疊(包含 Redis 與 MySQL)
docker-compose up -d

為什麼推薦 Grafana OnCall?

[cite_start]在 OSS軟體清單_2025 中,雖然已經有了強大的監控工具如 Grafana [cite_start]與 Prometheus ,但如何將「數據」轉化為「行動」一直是個缺口。Grafana OnCall 填補了這最後一哩路。它將原本昂貴的商業輪值服務「平民化」,讓中小型團隊也能擁有世界級的事件回應機制。如果您已經在使用 Docker(編號 36)部署服務,Grafana OnCall 是提升團隊運維成熟度的關鍵補強。