Name: Grafana OnCall
Availability: InStock
Author: Grafana Labs

終結無意義的告警轟炸，建立專業的 SRE 回應工作流

告警噪音過濾: 透過強大的過濾與分組引擎，將成千上萬的原始日誌轉化為具備可操作性的事件，避免開發人員產生告警疲勞。
靈活輪值安排: 視覺化排班介面，支援多時區、補班與交接設定，確保一年 365 天都有專人處理緊急事件。
全方位通知途徑: 原生整合 Slack、Telegram、Microsoft Teams 與 Email，支援階層式升級（Escalation），若首位輪值者未回應，系統將自動通知備援人員。

主要功能、特點

[cite_start]介紹: Grafana OnCall 是一款開源的事件回應工具，旨在縮短平均修復時間 (MTTR)。它能接收來自 Grafana [cite: 1][cite_start]、Prometheus 、Zabbix 等多種監控系統的告警。
特色服務:
- 升級策略 (Escalation Chains): 支援自定義升級邏輯，例如：「先在 Slack 通知 5 分鐘，若無反應則發送電話簡訊，最後再通知主管」。
- ChatOps 整合: 開發者可以直接在 Slack 或 Telegram 介面中確認（Acknowledge）、解決或靜音告警，無需切換到瀏覽器。
- 與 Grafana 深度整合: 在同一個儀表板中查看監控指標、紀錄日誌與管理輪值，實現統一的運維視圖。
- 事件分析報告: 自動生成故障處理時程紀錄，方便團隊進行事後檢討（Post-mortem）與流程優化。

安裝指令

推薦使用 Docker Compose 進行部署，這是啟動 Grafana OnCall OSS 版本的標準方式：

# 複製 Grafana OnCall 儲存庫
git clone [https://github.com/grafana/oncall.git](https://github.com/grafana/oncall.git)
cd oncall

# 啟動全功能堆疊（包含 Redis 與 MySQL）
docker-compose up -d

為什麼推薦 Grafana OnCall？

[cite_start]在 OSS軟體清單_2025 中，雖然已經有了強大的監控工具如 Grafana [cite_start]與 Prometheus ，但如何將「數據」轉化為「行動」一直是個缺口。Grafana OnCall 填補了這最後一哩路。它將原本昂貴的商業輪值服務「平民化」，讓中小型團隊也能擁有世界級的事件回應機制。如果您已經在使用 Docker（編號 36）部署服務，Grafana OnCall 是提升團隊運維成熟度的關鍵補強。